Universidad de La Salle Ciencia Unisalle
Ingeniería Industrial Facultad de Ingeniería
2020
Diseño de una herramienta de visualización de datos de homicidios en Colombia para el periodo comprendido entre 2010 y 2017
Anderson Cifuentes Duarte Universidad de La Salle, Bogotá
Carlos Ernesto Quijano Vaca Universidad de La Salle, Bogotá
Follow this and additional works at: https://ciencia.lasalle.edu.co/ing_industrial
Part of the Industrial Engineering Commons
Citación recomendada Cifuentes Duarte, A., & Quijano Vaca, C. E. (2020). Diseño de una herramienta de visualización de datos de homicidios en Colombia para el periodo comprendido entre 2010 y 2017. Retrieved from https://ciencia.lasalle.edu.co/ing_industrial/151
This Trabajo de grado - Pregrado is brought to you for free and open access by the Facultad de Ingeniería at Ciencia Unisalle. It has been accepted for inclusion in Ingeniería Industrial by an authorized administrator of Ciencia Unisalle. For more information, please contact [email protected]. DISEÑO DE UNA HERRAMIENTA DE VISUALIZACIÓN DE DATOS DE HOMICIDIOS EN COLOMBIA PARA EL PERIODO COMPRENDIDO ENTRE 2010 Y 2017
ANDERSON CIFUENTES DUARTE CARLOS ERNESTO QUIJANO VACA
UNIVERSIDAD DE LA SALLE FACULTAD DE INGENIERÍA INGENIERÍA INDUSTRIAL BOGOTÁ D.C. 2020
DISEÑO DE UNA HERRAMIENTA DE VISUALIZACIÓN DE DATOS DE HOMICIDIOS EN COLOMBIA PARA EL PERIODO COMPRENDIDO ENTRE 2010 Y 2017
ANDERSON CIFUENTES DUARTE CARLOS ERNESTO QUIJANO VACA
Trabajo de grado para optar al título de INGENIERO INDUSTRIAL
Director HERIBERTO ALEXANDER FELIZZOLA JIMENEZ Ingeniero industrial M.Sc Ingeniería Industrial
UNIVERSIDAD DE LA SALLE FACULTAD DE INGENIERÍA INGENIERÍA INDUSTRIAL BOGOTA D.C. 2020 Nota de aceptación:
______
______Firma del Director
______Firma del Jurado
______Firma del Jurado
Bogotá, 2019
AGRADECIMIENTOS
Primero que todo agradecer a Dios, porque él más que nadie sabe el arduo camino recorrido y los numerosos sacrificios transcurridos, por ello quiero dedicar este trabajo en primera instancia a mi abuela Ana Elvia Babativa, que hoy ya no nos acompaña entre nosotros pero que fue la primera persona que me brindó su apoyo total. A ti gracias abuelita por permitirme dar el primer paso en mi carrera de ingeniero. A mis padres, Carlos Julio Cifuentes y Gloria E Duarte, agradecerles por su apoyo incondicional, por las voces de aliento que día a día me brindaba, y que gracias a ellas me daban fuerzas para continuar. Y finalmente y no menos importante al ingeniero Heriberto Felizzola por sus conocimientos, su paciencia y comprensión para el desarrollo de este proyecto.
Anderson Cifuentes.
Desde hace años me he dado cuenta que la vida se encuentra llena de retos, tropiezos y enseñanzas que cada vez te hacen más fuerte. Por esta razón, agradezco en primera instancia a Dios por todo lo que me ha brindado. A todos y cada uno de los ingenieros y docentes que hicieron parte de mi proceso formativo como ingeniero industrial y persona. A nuestro director el ing. Heriberto Felizzola, por cada consejo y colaboración ofrecida durante el desarrollo de este trabajo. A todos mis amigos, especialmente a mi compañero Anderson Cifuentes, con quien trabaje arduamente para culminar el proyecto de manera satisfactoria. Y el más eterno agradecimiento a mi madre que ha sido una fuente de apoyo constante e incondicional en toda mi vida y más aún en mi proceso de formación profesional.
Este logro es para ustedes, como muestra de agradecimiento por todas las veces que me mostraron el camino y además me ayudaron para avanzar. Para todos mil gracias.
Carlos Quijano.
CONTENIDO
LISTA DE TABLAS ...... 7 LISTA DE FIGURAS ...... 8 LISTA DE ECUACIONES ...... 9 GLOSARIO ...... 10 RESUMEN ...... 11 1. PLANTEAMIENTO DEL PROBLEMA ...... 12 1.1 DESCRIPCIÓN DEL PROBLEMA...... 12 1.2 JUSTIFICACIÓN ...... 12 1.3 FORMULACIÓN DEL PROBLEMA ...... 13 1.4 OBJETIVOS ...... 13 1.4.1 Objetivo general ...... 13 1.4.2 Objetivos específicos ...... 13 2. MARCO REFERENCIAL ...... 14 2.1 MARCO TEÓRICO ...... 14 2.1.1 Visualización de datos ...... 14 2.1.2 Tasa de homicidios ...... 15 2.2 ANTECEDENTES ...... 16 2.3 MARCO NORMATIVO ...... 18 3. METODOLOGÍA ...... 19 3.1 TIPO DE INVESTIGACIÓN ...... 19 3.2 FUENTES DE INFORMACION ...... 19 3.3 LAS TECNICAS Y HERRAMIENTAS ...... 19 3.4 EL PROCESO DE INVESTIGACIÓN ...... 19 3.4.1 Fase I: Especificaciones...... 20 3.4.2 Fase II: Análisis ...... 20 3.4.3 Fase III: Diseño ...... 20 3.4.4 Fase IV: Implementación...... 21 3.4.5 Fase V: Validación ...... 21 4. FASE I y II. ESPECIFICACIONES Y ANÁLISIS ...... 23 4.1 GENERALIDADES ...... 23 4.2 CARACTERIZACIÓN DE LAS VARIABLES ...... 25 4.3 SELECCIÓN DE LAS VARIABLES ...... 26 5. FASE III. DISEÑO DE ESTRATEGIA DE VISUALIZACIÓN ...... 30 5.1 COMPONENTES DEL SISTEMA DE INFORMACIÓN ...... 30 5.2 DIAGRAMAS UML ...... 33 5.3 SELECCION DE GRAFICAS ...... 44 6. FASE IV. IMPLEMENTACIÓN HOMICIDE TOOL ...... 51 6.1 ENTORNO DE PROGRAMACIÓN ...... 51 6.2 NAVEGABILIDAD ...... 52 6.3 VISUALIZACION DE LAS VARIABLES ...... 56 7. FASE V. VALIDACIÓN CON DISEÑO EXPERIMENTAL ...... 63 7.1 EXPERIMENTO 1 ...... 63 7.2 EXPERIMENTO 2 ...... 75 8. CONCLUSIONES Y RECOMENDACIONES ...... 79 BIBLIOGRAFÍA ...... 81 ANEXOS 83 ANEXO A Listado de municipios por departamento ...... 83 ANEXO B Listado de clase - sitio ...... 90 ANEXO C Listado de armas ...... 91 ANEXO D Encuesta para selección de variables ...... 92 ANEXO E Numero de habitantes por departamento ...... 96 ANEXO F Numero de habitantes por municipio ...... 97 ANEXO G Test Experimental ...... 126
LISTA DE TABLAS Tabla 1. Plataformas de visualización y su agrupación...... 15 Tabla 2. Homicidios registrados por año ...... 23 Tabla 3. Variables por registro de homicidio ...... 23 Tabla 4. Número de municipios por departamento ...... 25 Tabla 5. Tipo de variables ...... 25 Tabla 6. Tipos de variables ...... 26 Tabla 7. Preguntas de encuesta ...... 28 Tabla 8. Resultados de la encuesta ...... 29 Tabla 9. Cuadro comparativo entre alternativas de visualización...... 31 Tabla 10. Requerimientos funcionales del sistema ...... 32 Tabla 11. Requerimientos no funcionales del sistema ...... 32 Tabla 12. Actores del SI ...... 34 Tabla 13. Descripción Caso de uso visualización homicidios en el país...... 34 Tabla 14. Descripción Caso de uso visualización homicidios en el departamento...... 35 Tabla 15. Descripción Caso de uso visualización homicidios en el municipio...... 36 Tabla 16. Descripción Caso de uso seleccionar país...... 38 Tabla 17. Descripción Caso de uso seleccionar año ...... 39 Tabla 18. Descripción Caso de uso seleccionar departamento ...... 39 Tabla 19. Descripción Caso de uso seleccionar año ...... 40 Tabla 20. Selección de la gráfica para la variable año...... 44 Tabla 21. Selección de la gráfica para la variable departamento y municipio...... 45 Tabla 22. Selección de la gráfica para la variable día y mes ...... 46 Tabla 23. Selección de la gráfica para la variable tipo de arma y zona ...... 47 Tabla 24. Selección de la gráfica para la variable edad y género...... 48 Tabla 25. Selección de la gráfica para la variable de móvil agresor y victima ...... 49 Tabla 26. Selección grafico variable barrio ...... 50 Tabla 27. Descripción del experimento 1 ...... 63 Tabla 28. Resultados del test 1 sección 2 ...... 64 Tabla 29. Resultados del test 1 ...... 68 Tabla 30. Resultados del test 2 ...... 69 Tabla 31. Descripción del experimento 2 ...... 75 Tabla 32. Resultados experimento 2...... 75
7
LISTA DE FIGURAS Figura 1. Representación gráfica de la metodología en cascada ...... 20 Figura 2. Diagrama de flujo de la metodología...... 22 Figura 3. Diagrama de casos de uso de la HomicideTool ...... 33 Figura 4. Diagrama de clases de la herramienta de visualización HomicideTool ...... 41 Figura 5. Diagrama de secuencia de HomicideTool ...... 42 Figura 6. Mapa de navegabilidad de HomicideTool ...... 43 Figura 7. Ventana de programación SublimeText ...... 51 Figura 8. Dashboard inicial...... 52 Figura 9. Ventana emergente con información de navegabilidad...... 53 Figura 10. Dashboard del país seleccionado, el sistema está a la espera de seleccionar un año...... 53 Figura 11. Dashboard de los homicidios anuales...... 54 Figura 12. Dashboard anual en el departamento seleccionado...... 55 Figura 13. Dashboard anual del municipio seleccionado...... 56 Figura 14. Localización de la variable año...... 57 Figura 15. Mapa de calor de Colombia en el año 2010...... 58 Figura 16. Grafica de género y edad de las víctimas...... 59 Figura 17. Gráfico mes y día de los homicidios en el año...... 59 Figura 18. Grafica del tipo de arma empleada...... 60 Figura 19. Grafico del departamento seleccionado...... 60 Figura 20. Gráfico tipo de zona...... 61 Figura 21. Gráfico móvil del agresor y móvil de la víctima...... 61 Figura 22. Gráfico de los barrios más peligrosos...... 62 Figura 23. Modificaciones del cuadro de dialogo e instrucciones (Después) ...... 64 Figura 24. Modificaciones de tamaño de gráficos (Antes)...... 65 Figura 25. Modificaciones de tamaño de gráficos (Después)...... 65 Figura 26. Modificaciones de tamaño y color de la letra (Antes) ...... 66 Figura 27. Modificaciones de tamaño y color de la letra (Después) ...... 66 Figura 28. Modificaciones de ubicación del lugar de navegación (Antes) ...... 67 Figura 29. Modificaciones de ubicación del lugar de navegación (Después) ...... 67 Figura 30. Enfoque sistémico del experimento...... 68 Figura 31. Informe resumen del test 1...... 69 Figura 32. Informe resumen del test 2...... 70 Figura 33. Gráfico de caja...... 71 Figura 34. Gráfico de caja...... 73 Figura 35. Informe resumen del tiempo base de datos...... 76 Figura 36. informe resumen tiempo de visualización...... 76 Figura 37. Gráfico de caja...... 77
8
LISTA DE ECUACIONES Ec. 1 Tasa de homicidios ...... 16 Ec. 2 Tamaño de la muestra ...... 27 Ec. 3 Criterio de seleccion ...... 29 Ec. 4 Igualdad de varianzas experimento 1 (tiempo de respuesta) ...... 71 Ec. 5 Hipotesis experimento 1 (tiempo de respuesta) ...... 71 Ec. 6 Desviación estandar conjunta ...... 72 Ec. 7 Estadistico de prueba ...... 72 Ec. 8 Igualdad de varianzas experimento 1 (calificaciones) ...... 73 Ec. 9 Hipotesis experimento 1 (calificaciones) ...... 73 Ec. 10 Desviación estandar conjunta ...... 74 Ec. 11 Estadistico de prueba ...... 74 Ec. 12 Igualdad de varianzas experimento 2 (comparacion) ...... 77 Ec. 13 Hipotesis experimento 2 (comparacion) ...... 77 Ec. 14 Desviación estandar conjunta ...... 78 Ec. 15 Estadistico de prueba ...... 78
9
GLOSARIO
DATOS: Información sobre algo concreto que permite su conocimiento exacto o sirve para deducir las consecuencias derivadas de un hecho.
DEPARTAMENTO: División administrativa y política del territorio. Colombia cuenta con 33 divisiones, 32 departamentos gobernados desde sus capitales y un distrito capital, Bogotá.
DISEÑO: Actividad creativa y técnica encaminada a idear objetos útiles y estéticos que puedan llegar a producirse en serie.
GRAFICO: Representación de algo mediante figuras o signos.
HOMICIDIO: Muerte causada a una persona por otra.
IMAGEN: Figura, representación, semejanza y apariencia de algo
INTERFAZ: Conexión, física o lógica, entre una computadora y el usuario.
MUNICIPIO: Corresponden al segundo nivel de división administrativa en Colombia, que mediante agrupación conforman los departamentos. Colombia posee 1122 municipios.
NAVEGABILIDAD: Es la facilidad que tiene una persona a la hora de desplazarse por todas las páginas de una web.
PAIS: Territorio, con características geográficas y culturales propias, que puede constituir una entidad política.
REGISTRO: Conjunto de datos relacionados entre sí, que constituyen una unidad de información en una base de datos.
SISTEMA DE INFORMACIÓN: Es un conjunto de elementos orientados al tratamiento y administración de datos e información, organizados y listos para su uso posterior.
SOFTWARE: Conjunto de programas, instrucciones y reglas informáticas para ejecutar ciertas tareas en una computadora.
VARIABLE: Magnitud que puede tener un valor cualquiera de los comprendidos en un conjunto, que varía o puede variar.
VISUALIZACIÓN: Representar mediante imágenes ópticas fenómenos de otro carácter. Hacer visible una imagen en un monitor.
10
RESUMEN La tasa de homicidios es una estadística importante por su impacto socioeconómico y de seguridad en ciertos lugares, además de ser un punto de comparación entre países a nivel global. Si bien los organismos de seguridad del Estado guardan información acerca de la víctima, el victimario, el lugar, la hora, etc. Estos datos almacenados pueden ser incomprensibles y difíciles de manejar, ya que, por sí solos representan un sin número de registros sin relación aparente, que los investigadores deben filtrar, seleccionar y comparar con ayuda de programas especializados que en muchos de casos requieren alto recurso tecnológico y capacidad de procesamiento. Este trabajo presenta una propuesta visualización de la información de homicidios ocurridos entre 2010 - 2017, la cual presenta la información de manera visual, de los registros de homicidios publicados por el Grupo de Información de Criminalidad (GICRI), junto con la DIJIN y almacenados en la base de datos abiertos del Gobierno de Colombia. El proceso efectuado para el desarrollo de la herramienta HomicideTool, se compuso de una secuencia predefinida por especificaciones, análisis, diseño, programación, pruebas, implementación. Este método consistió en avanzar secuencialmente y de forma ordena por cada una de las etapas. Inicialmente se realiza una descripción de la base de datos, donde se seleccionan las variables que serán presentadas en la herramienta, seguido de esto, la elección del lenguaje y entorno de programación; en este punto se programan las ventanas de navegación, las cuales fueron evaluadas con experimentos comparativos con diferentes usuarios seleccionados de manera aleatoria, con el fin de identificar cambios que permitan una mejor comprensión de los datos. Como resultado de los experimentos aplicados, los factores ajustados fueron el tipo y tamaño de letra, desarrollo de las ayudas de navegabilidad, tamaño y ubicación de gráficos, entre otros. Todo esto con el fin de facilitar la compresión y percepción de la información, con gráficos dinámicos, que permitieron la navegabilidad y flexibilidad en su uso, de tal forma que los usuarios encargados del análisis de la información o personas que tengan cierto interés en esta puedan encontrar patrones, observar tendencias y otros aspectos importantes relacionados al homicidio como las fechas, los lugares y características demográficas de la población.
11
1. PLANTEAMIENTO DEL PROBLEMA
1.1 DESCRIPCIÓN DEL PROBLEMA
En Colombia el homicidio, es un importante problema social y a su vez es un indicador universal de violencia social, que se define como “la muerte por agresión con independencia de su calificación jurídica y es considerado el responsable de la alta tasa de mortalidad de la población a nivel mundial” (Chaparro, Cortes, Leon, & Castañeda, 2016). Desde el año 2010 en adelante, se hace la publicación de aproximadamente de 13.000 registros de homicidios por año, correspondiente a la información asociada a los diferentes asesinatos. Estos registros se encuentran publicados en el portal de datos abiertos del Gobierno de Colombia y la entidad encargada de la publicación es el Grupo De Información De Criminalidad (GICRI) en compañía de la Dirección De Investigación Criminal E Interpol (DIJIN). Con el fin de promover el tratamiento de los datos para investigación y desarrollo, por parte de la comunidad.
La correcta percepción de la información permite a las personas tomar decisiones asertivas, por lo tanto, para buscar soluciones enfocadas a la seguridad y asociadas a la disminución de estos indicadores de homicidios en el país, se debe realizar una correcta interpretación de la información, por medio de un significado más amplio de los datos recolectados (Soriano, 1988).
Por todo esto, es importante mejorar el flujo de información, así como obtener un mejor aprovechamiento tanto de la información que es presentada por parte del país como de los recursos tecnológicos disponibles para el desarrollo de herramientas flexibles y dinámicas que permitan a las personas analizar los datos registrados en la base de datos abiertos del Gobierno Digital de Colombia, para que se realicen procesos de análisis e interpretación de la información de manera práctica.
1.2 JUSTIFICACIÓN
La razón principal para desarrollar este proyecto es demostrar la aplicabilidad de las herramientas de visualización y el apoyo que estas suministran a la hora de la interpretación de datos almacenados. De la misma manera, evidenciar que estas pueden estar aplicadas a cualquier tipo de contexto.
En cuanto al tema de homicidios es suministrar una herramienta que permita a las personas en general facilitar la interpretación de la información registrada en la base de datos publica de homicidios de la Dirección e Investigación Criminal e Interpol (DIJIN) referente al periodo comprendido entre 2010 y 2017, de tal manera que el usuario final pueda tener una idea de cómo se encuentra su país, su departamento o localidad; esta información puede influir en decisiones como viajar a un lugar en específico ya sea por negocios o por turismo, comprar una casa o empresa, montar un negocio entre otros.
Este trabajo se desarrolló con herramientas computacionales para el procesamiento de datos y la visualización de información, a través de las cuales se diseñaron tableros que despliegan y presentan gráficas, que permiten comprender y aprovechar los registros de homicidios para diferentes fines, de acuerdo con distintos discriminantes y variables. El proceso de validación incluyó diseños experimentales comparativos, que permitieron realizar mejoras en la herramienta, buscando con esto una mejora en la comprensión de la información por parte del usuario final.
12
Finalmente, este trabajo nos permitió optar por el título de Ingenieros Industriales, en el cual evidenciaremos los conocimientos adquiridos, en sistemas de información, programación, diseño de experimentos, entre otros.
1.3 FORMULACIÓN DEL PROBLEMA
¿Cuál es la estrategia de procesamiento y visualización de datos de homicidios en Colombia que permita lograr una mejor comprensión de los datos y tomar decisiones acertadas en relación a la seguridad urbana?
1.4 OBJETIVOS
1.4.1 Objetivo general
Diseñar una herramienta para la visualización de datos de homicidios en Colombia en el periodo comprendido entre 2010 y 2017, utilizando principios de visual analitycs, plataformas de visualización y bases de datos libres.
1.4.2 Objetivos específicos
Caracterizar la base de datos de homicidios de la Dirección e Investigación Criminal e Interpol (DIJIN) referente al periodo comprendido entre 2010 y 2017. Seleccionar las variables de la base de datos que harán parte de la visualización. Diseñar la estrategia de visualización de datos. Programar el sistema de visualización de datos, que permita la interpretación y la interacción con la información.
13
2. MARCO REFERENCIAL 2.1 MARCO TEÓRICO
En este capítulo se dan a conocer algunos conceptos básicos para el desarrollo de este proyecto. Los temas centrales son: visualización de datos, tasa de homicidios y la analítica de datos de homicidios.
2.1.1 Visualización de datos
Desde la antigüedad el ser humano ha buscado códigos y representaciones para transmitir el conocimiento. Desde los egipcios con manuscritos en papiros hasta el nacimiento del papel con registros relevantes en diagramas geométricos, mapas y posiciones de cuerpos celestes. (Pontis, 2007)
El concepto de visualización de datos, como hoy en día se conoce surge a finales de los años noventa, con definiciones como:
Lev Manovich que en 2010 publica un artículo titulado ¿What is visualization?, en él se describe la visualización como “una transformación de datos cuantitativos no visuales en una representación visual de estos”. (Manovich, 2010) Colin Ware en 2012 la define como “la representación gráfica de datos o conceptos, que tiene como resultado una imagen mental o un artefacto extremo que ayude a la toma de decisiones”. (Ware, 2012) Alberto Cairo en 2016 la define como “la representación visual de información diseñada para permitir la comunicación, el análisis, el descubrimiento y la exploración”. (Cairo, 2016)
La nueva era tecnológica y el boom informático, desatado en los últimos años debido a las redes sociales, plataformas, aplicaciones y dispositivos de gran capacidad de almacenamiento han dado como resultado un crecimiento exponencial en los datos y así mismo la necesidad de contar con herramientas adecuadas para su análisis, comprensión y aprovechamiento. Los usuarios de dichas herramientas exigen día a día entornos dinámicos, gráficos e intuitivos, donde el tiempo de respuesta juega un papel fundamental e influyen en la aceptación del consumidor. Para desarrollar entornos avanzados se debe comprender que, graficar simples datos sin el adecuado tratamiento no representa una buena práctica de visualización, es por ello que deben ser filtrados y procesados para convertirlos en información. Finalmente, el proceso de caracterización termina con la comparación de la información con los requerimientos del usuario destinatario, por este motivo conocer su perfil con recurrentes test de usabilidad garantizan el éxito dichas plataformas. El siguiente paso es la codificación visual, empezando con el tipo de gráfico, tamaño, colores y posiciones, sin embargo, no hay que olvidar que debe prevalecer la funcionalidad antes de la estética. (Pascual Cid, 2010)
Actualmente, para la construcción de visualizaciones existen una gran cantidad de aplicaciones y aunque cada herramienta tiene sus propias características, muchas tienen elementos en común que permiten ser agrupadas en función del manejo de los datos y del tipo de resultado final deseado. Estas categorías corresponden a la ofimática, web, analítica, programación, open data y mapas. (Red.es, 2016) A continuación, se observa la Tabla 1 que plasma algunas herramientas y su adaptación a las categorías descritas anteriormente.
14
Tabla 1. Plataformas de visualización y su agrupación.
Ofimática Web Analítica Programación Open Data Mapas Excel * * ~ OpenOffice * ~ Google Sheets * * * SAP BI ~ ~ SAS ~ ~ ~ MS Power BI ~ ~ IBM Gognos ~ * ~ Pentano ~ * ~ ~ Qlik ~ * * Tableau Sof. ~ * * R ~ * * ~ Weka ~ * * ~ Matlab ~ * * ~ Mathematica ~ * * ~ Maple ~ * * ~ Tableau * ~ ~ CartoDB * ~ Socrata * * ~ Ckan * * *
~ = 50% ∗ = 100% Fuente: (Red.es, 2016)
Hoy en día el gran reto de las herramientas de visualización está en asegurar que puedan ser usadas sin tener conocimientos de programación, que permitan el tratamiento de grandes bases de datos, con gráficos que puedan ser extrapolados o adaptados a dispositivos móviles y demás plataformas tecnológicas. Finalmente, el futuro de la visualización se centra en aplicativos con aceleración de grafico 3D y tecnologías de realidad aumentada que combinan la información real con entornos interactivos para el usuario, que hasta hace algunos años solo se observaban en la ciencia ficción.
2.1.2 Tasa de homicidios
La tasa de mortalidad presenta un dato estadístico sobre el número de defunciones por cada mil ciudadanos de una misma región en un intervalo de tiempo. Sin embargo, a este índice se le atribuyen fallecimientos de tipo natural, por enfermedades, suicidios y homicidios.
En la actualidad el homicidio es un indicador que permite medir el nivel de violencia de un lugar determinado, la cual presenta una conducta típica donde un sujeto agrede a otro y como resultado está la muerte. El almacenamiento de la información de los homicidios permite guardar registros de cada lugar, género de la víctima, la frecuencia con que estos suceden, que tipo de personas se ven más expuestas al riesgo, entre otros. Además, facilita realizar comparaciones entre ciudades, regiones y países, de tal manera que se puedan identificar patrones que contribuyan a la salud pública y a la seguridad ciudadana. (Oficina de las Naciones Unidad contra la Droga y el Delito, 2013)
15
La tasa de homicidios por cada 100.000 habitantes habla de la cantidad de eventos sucedidos en una población durante un periodo de tiempo. Para el cálculo de la tasa de homicidios en una región específica,
푁퐻 푇 = ∗ 100.000 Ec. 1 푃푇
Donde:
T: Es la tasa por 100 mil habitantes. NH: Número de homicidios en un lapso determinado de tiempo. PT: Población total.
La tasa de homicidios es un indicador utilizado por los gobiernos nacionales y locales para evaluar la situación de seguridad en cada población y con esto diseñar políticas públicas y estrategias para mitigar la presencia de violencia en los lugares con mayor índice de violencia y ofrecer a los ciudadanos una mejor seguridad.
Como se describió anteriormente la tasa de homicidios es un indicador clave a nivel socioeconómico que permite comparar el nivel de seguridad entre países, es decir que a grandes rasgos permite comprender el grado de violencia de una población. Se sabe por las bases de datos el lugar de la muerte de una persona, el tipo de armas usadas, el género de la víctima y demás información que podría ser empleada en la generación de políticas de seguridad ciudadana; pero para comprender en detalle cómo es el comportamiento y bajo qué patrones se comportan estos hechos delictivos, se hace necesario poder visualizar la información para que los expertos en el tema y los tomadores de decisiones en seguridad urbana puedan extraer información y conocimiento útil para definir estrategias (Bachelet, 2015).
2.2 ANTECEDENTES
Cuando se habla del concepto de visualización de datos, es necesario mencionar al profesor Edward Tufte el cual en 1983 publicó Visual Display of Quatitative Information, quien menciona que “la excelencia grafica requiere la verdad acerca de los datos”, esta excelencia es multivariada, puede ser medida con el factor de mentira, si este factor es mayor de 1,05 o menor 0,95 la representación está distorsionada. Complementa la hipótesis con el factor data-ink que describe la eficiencia entre los datos y la información no redundante de la visualización. (Tufte, 1983)
A brief history of data visualization, publicado en el 2006 por Michael Friendly menciona que la visualización no debe entenderse como un término moderno, sino más bien como una de las formas más antiguas de transmitir información. Friendly estructura su artículo bajo una línea del tiempo con los sucesos más relevantes desde el siglo XVII hasta la actualidad, donde se destaca el siglo XIX con los mayores avances en técnicas de análisis estadístico impulsado por la industrialización, el comercio, la globalización y transporte. Cabe resaltar que los lenguajes de programación modernos y los avances tecnológicos en ordenadores permitieron no solo generar nuevas formas de gráficos dinámicos si no automatizar cálculos llevando a la visualización de datos a un nivel más completo. (Minguillón Alfonso, 2016)
16
“Mirar antes de analizar: visualizar datos en la justicia penal”, es un artículo publicado por Michael D. Maltz, donde se habla acerca de los datos de criminalidad en Estados Unidos, los cuales son recopilados y publicados anualmente por el FBI. En esta propuesta de visualización los datos son presentados de manera sencilla. Los datos de tiempo son graficados de forma longitudinal, mientras que los eventos y su frecuencia se ubican de manera vertical, de esta manera los analistas pueden ver el aumento o disminución de los crímenes durante 45 años consecutivos. (Maltz, 2009)
Por otro lado, El sistema de recuperación de noticias sobre el crimen de Malasia, es una herramienta desarrollada por investigadores con el fin de apoyar las labores relevantes a la seguridad, por medio de un mecanismo de monitoreo del estado actual y eventos pasados relacionados con los crímenes. Esta herramienta facilita a los usuarios conocer distintos aspectos sobre los delitos, por medio de diferentes interfaces de usuario, permitiendo visualizar noticias sobre el crimen de manera eficaz y de forma interactiva, los cuales consolidan un sistema robusto de supervisión y control para diferentes grupos de usuarios y analistas, de tal manera que permita a los expertos estudiar los datos y contribuir a la comprensión de información relevante a los crímenes. (Mohamad, y otros, 2011)
Existe documentado otro artículo denominado “El Poder Persuasivo de la Visualización de Datos”, donde se explica cómo se han utilizado los datos para informar a los usuarios. Sin embargo, presenta como la visualización puede influir en los analistas para que el mensaje sea más persuasivo. El estudio se basa en dos pilares. El primero es un experimento de exploración donde se observa el impacto de las interfaces sobre el usuario final, el segundo es el diseño de la estrategia de visualización de la información para una mayor comprensión de los datos. En este orden de ideas realizaron un análisis cualitativo y cuantitativo para abordar la hipótesis, por medio de la comparación de diferentes tipos de diagramas y tablas, para luego evaluar la captación del mensaje y así entender la efectividad de la visualización. (Pandey, Manivannan, Nov, Sattethwaite, & Bertini, 2014)
En cuanto a los referentes relacionados con homicidios, Homicide Monitor es la herramienta de visualización de datos más completa disponible públicamente sobre asesinatos en el mundo. Diseñada para mostrar la distribución, las dimensiones y la dinámica de la violencia de cada país. Esta plataforma fue diseñada por el instituto Igarapé, el cual es un organismo independiente de pensamiento y acción dedicado a políticas basadas en desafíos complejos de seguridad, justicia y desarrollo en Brasil, América Latina y África. La visión de esta Institución es incentivar la crítica y debate, fomentar las conexiones y desencadenar acciones. El instituto tiene su sede en Río de Janeiro, con personal distribuido en Brasil, Colombia y México. Establecido en 2011, cuenta con el respaldo de entidades bilaterales, algunas fundaciones, entidades internacionales y contribuciones privadas de todo el mundo. Estos incluyen, Canadá, Noruega y el Reino Unido, así como la Fundación Bernard van Leer, Google, Open Society Foundation, el Centro Internacional de Investigaciones para el Desarrollo, las Naciones Unidas y patrocinadores privados. (Igarapé Institute, 2017)
Otra plataforma que permite la visualización de homicidios pero que se centra en Colombia es DATAFIP-Beta creada por la fundación ideas para la paz, organización creada en 1999 que tiene como objetivo generar el conocimiento, proponer iniciativas, desarrollar prácticas y acompañar procesos de paz en Colombia. Esta plataforma permite la visualización en un mapa de calor de los homicidios por año, por ciudades y departamentos, aparte relaciona el desplazamiento forzado, el cultivo de la coca, entre otros factores derivados de la violencia. (FIP, 2017)
17
Por otro lado, el Gobierno colombiano promueve la participación ciudadana por medio de la publicación de visualizaciones, gráficos y tratamientos de la información que las personas realizan de los registros almacenados en la base de datos abiertos del Gobierno de Colombia.
2.3 MARCO NORMATIVO
Ley 1712 de 2014: Ley de transparencia y del derecho al acceso de la información pública. La cual permite el derecho de acceso a la información pública por parte de todas las personas, los procedimientos para el ejercicio y la garantía del derecho fundamental, así como las excepciones a la publicidad de la información pública. De esta manera todas las personas nacionales y extranjeras tienen derecho a conocer de la existencia y acceder a la información pública. (El Congreso de la República, 2014) Decreto 1008 de 2018: Decreto cuyo objeto es incentivar el uso y el aprovechamiento de las tecnologías de información y comunicación para consolidar un Estado y ciudadanos competitivos, proactivos e innovadores, que generen un valor público en un entorno de confianza digital. (MINTIC, 2018) Ley 1581 de 2012: Constituye el marco general de protección de datos personales. (Congreso de Colombia, 2012) Decreto 1377 del 2013: Es un reglamento parcial de la Ley 1581 de 2012, por la cual se dictan disposiciones generales para la protección de datos personales. (Ministerio De Comercio, Industria Y Turismo, 2013)
18
3. METODOLOGÍA A continuación, se definen algunos elementos que conformaran la metodología: el tipo de investigación, las fuentes de información, las técnicas y herramientas y el proceso de investigación.
3.1 TIPO DE INVESTIGACIÓN
Este trabajo combina dos tipos de investigación, la primera es una investigación aplicada porque se busca un producto, una plataforma de visualización de datos de homicidios. El segundo tipo de investigación es experimental pues para llegar al objetivo que es la herramienta de visualización se debe realizar una serie de experimentos que permiten mejorar la plataforma con el fin de obtener un mejor producto final, siempre con el objetivo de la compresión de la información a partir de las gráficas presentadas.
3.2 FUENTES DE INFORMACION
Las fuentes de información principales de esta investigación son primarias pues cita libros, artículos de revistas científicas, trabajos de grado, tesis, monografías, documentos oficiales, trabajos presentados en seminarios. En menor instancia se tiene algunas referencias de fuentes terciarias como lo son empresas de las herramientas de visualización investigadas.
3.3 LAS TECNICAS Y HERRAMIENTAS
Para la recolección de la información se usará la encuesta con cuestionarios previamente diseñados para conocer la opinión del usuario. Para el análisis de los datos sobre la respuesta de los usuarios a la plataforma se realizó un experimento bajo un entorno controlado que permitió establecer la comparación de diferentes tableros de la herramienta de visualización.
3.4 EL PROCESO DE INVESTIGACIÓN
El proceso de desarrollo implementado para HomicideTool viene dada por el ciclo de vida del sistema (especificaciones, análisis, diseño, programación, pruebas, implementación), con un esquema de cascada pura, como se observa en la Fig. 1. Este método consiste en avanzar secuencialmente y de forma ordena por cada una de las etapas, permitiendo la detección temprana de errores reduciendo costos de planificación. Como contraste a lo anterior este modelo es de avance lento, con resultados palpables solo al final del proceso que requiere documentación extensa y altos costos en inversión tecnológica. (KENDALL & KENDALL, 2011)
19
Figura 1. Representación gráfica de la metodología en cascada
Fuente: (Digital Guide IONOS, 2019)
Basado en la metodología en cascada de la Fig. 1, se presentan 5 fases las cuales se describen al detalle continuación:
3.4.1 Fase I: Especificaciones
Propósito: Caracterizar la base de datos de homicidios de la Dirección e Investigación Criminal e Interpol (DIJIN) referente al periodo comprendido entre 2010 y 2017. Alcance: Descripción de cada uno de los elementos de información que integran la base de datos, numero de variables, número de registros consignados. Actividades: Descargar de cada uno de los archivos. Compilación en un solo documento. Análisis detallado de cada variable consignada, número de registros. Entrega 1 y realimentación: El grupo de trabajo se reúne con el director de tesis para discutir el resultado de esta fase, se hacen ajustes y correcciones pertinentes.
3.4.2 Fase II: Análisis
Propósito: Determinar las variables de la base de datos que harán parte de la visualización. Alcance: Selección de las variables con alta relevancia que al graficar los registros su comportamiento se entienda y comprenda por el visor. Actividades: Recolección de la información acerca de lo que desean visualizar los usuarios. (encuesta). Selección de las variables. Entrega 2 y realimentación: El grupo de trabajo se reúne con el director de tesis para discutir el resultado de esta fase, se hacen ajustes y correcciones pertinentes.
3.4.3 Fase III: Diseño
Propósito: Diseñar la estrategia de visualización de datos. Alcance: Selección de los tipos de gráficas para cada una de las variables, los tipos de filtros, las capas de la interfaz, etc. 20
Actividades: Selección del entorno de programación y el tipo de lenguaje. Selección de los posibles tipos de visualización para cada una de las variables. Entrega 3 y realimentación: El grupo de trabajo se reúne con el director de tesis para discutir el resultado de esta fase, se hacen ajustes y correcciones pertinentes.
3.4.4 Fase IV: Implementación
Propósito: Desarrollo de un prototipo de visualización de datos, que permita la interpretación y la interacción con la información. Alcance: Aplicativo web que permita la visualización de los registros consignados en la base de datos, con la facilidad para acceder sin conocimiento previo, compresión en la información plasmada. Actividades: Programar la herramienta: cada capa, cada interfaz y gráfica planeada en la estrategia de visualización. Entrega 4 y Realimentación: El grupo de trabajo se reúne con el director de tesis para discutir el resultado de esta fase, se hacen ajustes y correcciones pertinentes.
3.4.5 Fase V: Validación
Propósito: Realizar la validación del desempeño de la plataforma por medio de 2 experimentos comparativos, que permitan identificar aspectos por mejorar, la comprensión de la información presentada y claridad a la hora de buscar información puntual. Alcance: Aplicación de 2 experimentos a una población de estudiantes del programa de ing. Industrial de la Universidad de La Salle. Actividades: Describir los experimentos, realizar enfoque sistémico, Realizar los experimentos, con el respectivo análisis. Implementar cambios en la herramienta basados en el resultado de los experimentos. Concluir el resultado obtenido con la herramienta de visualización. Entrega 5: El grupo de trabajo se reúne con el director de tesis para discutir el resultado de esta fase, se hacen ajustes y correcciones pertinentes. Entrega a los jurados, correcciones, presentación final y sustentación.
Para comprender un poco mejor la metodología se describen cada una de las actividades a realizar en el flujograma de la Fig. 2.
21
Figura 2. Diagrama de flujo de la metodología.
Fuente: Autores
22
4. FASE I y II. ESPECIFICACIONES Y ANÁLISIS En este capítulo se realiza la caracterización de un fragmento de la base de datos de homicidios de la Dirección e Investigación Criminal e Interpol (DIJIN). Inicialmente se hace una descripción de cada una de las variables que hacen parte de la base de datos.
4.1 GENERALIDADES
La base de datos de homicidios para los periodos de 2010 a 2017 tiene 111.046 registros, los cuales se encuentran repartidos como se presenta en la Tabla 2.
Tabla 2. Homicidios registrados por año
AÑO HOMICIDIOS 2010 14950 2011 15736 2012 15968 2013 14918 2014 12931 2015 12439 2016 12139 2017 11965 Fuente: Autores
La Tabla 2, hace referencia al número de homicidios registrados en la base de datos para cada uno de los años entre 2010 y 2017. Los registros de homicidios se caracterizan por medio de 18 variables, las cuales se describen en la Tabla 3. Tabla 3. Variables por registro de homicidio
N° VARIABLE DESCRIPCIÓN 1 Fecha Es la variable que indica el tiempo en el que ocurrió el homicidio. En la base de datos tiene el formato de día/mes/año. Por tanto, tiene datos del día, mes y año en el que suceden los homicidios en el periodo comprendido entre 2010 y 2017. 2 Departamento Es la división de primer nivel del territorio colombiano, los cuales tienen independencia administrativa y política. Colombia cuenta con 32 departamentos y su capital, la ciudad de Bogotá. 3 Municipio Es la entidad administrativa que agrupa una localidad o varias y puede hacer referencia a una ciudad o un pueblo. La Tabla 4 presenta el número de municipios por departamento y en el anexo A, se encuentran los municipios que hacen parte de cada departamento. 4 Día Es la variable que describe que día de la semana se presentó el homicidio. Los días son: lunes, martes, miércoles, jueves, viernes, sábado y domingo. 5 Hora Es la variable que describe la unidad del tiempo en que sucedió el homicidio, el formato está en 24 horas, es decir no cuenta con anotación AM o PM y esta descrita de la siguiente manera. HH:MM 6 Barrio Esta variable hace referencia a una subdivisión territorial de una ciudad. 23
N° VARIABLE DESCRIPCIÓN 7 Zona Esta variable hace referencia al sector de una superficie o terreno. Esta se clasifica en dos tipos: rural y urbana. La zona urbana, son el conjunto de edificaciones que se encuentran delimitadas por calles, carreras y avenidas, que a su vez se dividen en barrios, esta se caracteriza por contar con los servicios de saneamiento básicos. Por otra parte las áreas rurales, son viviendas que se encuentran dispersas, no cuentan con nomenclatura para sus calles y su principal actividad económica es la explotación agropecuaria. 8 Clase - Sitio Esta variable indica el lugar en donde se cometió el homicidio. La base de datos cuenta con 150 lugares descritos en el anexo B. 9 Arma Esta variable hace referencia al arma empleada en el homicidio. La base de datos empleada cuenta con 38 armas posibles descritos en el anexo C. Esta variable especifica en qué medio de transporte se desplazaba el agresor. Algunos 10 Móvil agresor de ellos son: no reporta, a pie, bicicleta, bus, motocicleta, taxi, vehículo particular, entre otros. Esta variable especifica en qué medio de transporte se desplazaba la víctima. Algunos 11 Móvil victima de ellos son: no reporta, a pie, bicicleta, bus, motocicleta, taxi, vehículo particular, entre otros. 12 Edad Es la variable que hace referencia al tiempo transcurrido desde el nacimiento hasta el homicidio de la víctima, esta medida en años. 13 Genero Esta variable indica las características fisiológicas y sexuales con las que nace la víctima. Puede ser masculino o femenino. 14 Estado civil Es la condición de la víctima en función de si tenía o no pareja y su situación legal respecto a esto según el registro civil. La base de datos reporta 7 posibles estados civiles para las víctimas: no reporta, casado, soltero, divorciado, separado, unión libre y viudo. 15 Nacionalidad Esta variable hace referencia al país de nacimiento de la víctima. 16 Actividad Esta variable hace referencia al ejercicio de una actividad laboral por la cual la victima económica recibía una remuneración. 17 Profesión Esta variable indica la actividad para la que la víctima se preparó y tenía derecho a recibir remuneración al ejercerla. 18 Escolaridad Esta variable hace referencia al nivel de educación formal que tenía la víctima. La base de datos clasifica a las victimas bajo los siguientes niveles:
Analfabeta: Incapacidad de la víctima de leer y escribir. Primaria: Conforma los primeros 5 grados de la educación básica. Secundaria: Conforma los 6 últimos grados de la educación básica. Técnico: Educación para formación de carácter operativo e instrumental. Superior: Educación profesional que contiene dos niveles: pregrado o posgrado. No reporta: No se conoce información sobre el nivel de escolaridad de la víctima.
Una vez finalizados los estudios de educación básica y media, los estudios siguientes pueden ser técnicos, tecnólogos o profesionales. Fuente: Autores
Para conocer el número de municipios que hacen parte de los 32 departamentos de Colombia, referirse a la Tabla 4. 24
Tabla 4. Número de municipios por departamento
Dpto. N° Dpto. N° Mun. Dpto. N° Dpto. N° Mun. Mun. Mun. Amazonas 11 Casanare 19 La Guajira 15 Santander 87 Antioquia 125 Cauca 42 Magdalena 30 Sucre 26 Arauca 7 Cesar 25 Meta 29 Tolima 47 Atlántico 23 Choco 30 Nariño 64 Valle del 42 Cauca Bogotá 1 Córdoba 30 N. de 40 Vaupés 3 Santander Bolívar 46 Cundinamarca 116 Putumayo 13 Vichada 4 Boyacá 123 Guainía 9 Quindío 12 Caldas 27 Guaviare 4 Risaralda 14 Caquetá 16 Huila 37 San Andrés 2 Fuente: Autores
4.2 CARACTERIZACIÓN DE LAS VARIABLES
Para iniciar con el proceso de caracterización de variables, se realiza una clasificación de estas para que sea más fácil su comprensión. Las variables están clasificadas según la Tabla 5. Tabla 5. Tipo de variables
Tipo Descripción Ejemplos Los valores son diferentes nombres que Códigos de barras, Números Nominal proporcionan únicamente información para ID. distinguir un objeto de otro (=,≠) Cualitativos Los valores proporcionan información Nivel de dolor, Ordinal suficiente para ordenar los objetos (<,>) clasificaciones satisfacción o conformidad. Las diferencias entre los valores son Fechas de calendarios, De medidas, es decir una medida existente (+, - Temperatura en grados intervalo ) Celsius o Fahrenheit. Cuantitativos Tanto la razón como el producto son Temperatura en kelvin, De razón significativas (*, /) Cantidades monetarias, masa, longitudes.
Fuente: Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar. Introduction to data mining. Pearson Education India, 2016.
Las variables cualitativas son aquellas que toman valores no numéricos, estas variables no pueden medirse con un instrumento ni se encuentran asociadas a una medida. Por tanto, estas variables representan atributos, características o cualidades, estas pueden se nominales u ordinales. Las variables cualitativas nominales, son aquellas que no admiten un criterio de orden y no tienen un valor numérico asignado. Por otro lado, las variables cualitativas ordinales, a pesar que hacen referencia a cualidades o atributos que carecen de un valor numérico se les clasifica dentro de una escala de valor.
25
Las variables cuantitativas, son aquellas que pueden ser expresadas por medio de un valor numérico, de esta manera se puede realizar cálculos y operaciones matemáticas entre ellas. Estas variables se clasifican en dos tipos, de intervalo y de razón. Las variables cuantitativas de intervalo, además de ordenar y clasificar, establece medidas numéricas exactas y emplean unidades de medida y las variables de razón son aquellas con nivel de medición, pero que adicional se puede establecer un valor de origen que representa la ausencia absoluta de la característica.
A partir de lo anterior se realiza una caracterización de cada una de las variables presentes en el fragmento de la base de datos de homicidios de la Dirección e Investigación Criminal e Interpol (DIJIN). Tabla 6. Tipos de variables
N° VARIABLE TIPO DE VARIABLE 1 Fecha Cuantitativa de intervalo 2 Departamento Cualitativa nominal 3 Municipio Cualitativa nominal 4 Día Cualitativa nominal 5 Hora Cuantitativa de razón 6 Barrio Cualitativa nominal 7 Zona Cualitativa nominal 8 Clase - Sitio Cualitativa nominal 9 Arma empleada Cualitativa nominal 10 Móvil agresor Cualitativa nominal 11 Móvil victima Cualitativa nominal 12 Edad Cuantitativa de razón 13 Genero Cualitativa nominal 14 Estado civil Cualitativa nominal 15 Nacionalidad Cualitativa nominal 16 Actividad económica Cualitativa nominal 17 Profesión Cualitativa nominal 18 Escolaridad Cualitativa nominal Fuente: Autores
4.3 SELECCIÓN DE LAS VARIABLES
Para el proceso de la selección de las variables de la base de datos, cuya información será presentada de manera gráfica dentro de la herramienta de visualización, se realizó una encuesta por medio de la herramienta Google Forms, con el fin de conocer la opinión de posibles usuarios acerca de que variables consideraban relevantes para la inclusión dentro de la herramienta de visualización. Inicialmente se determinó el número de personas a encuestar, teniendo en cuenta los posibles usuarios de la herramienta, se concluyó que la población es infinita ya que cualquier persona puede tener acceso y uso de la misma. Por tanto, para calcular el tamaño de la muestra para la población infinita se utilizó la Ec. 1.
26
푍 ∗ 푝 ∗ 푞 푛 = Ec. 2 푒 Donde:
Z: Es una constante que depende del nivel de confianza asignado. Este valor se obtiene de la tabla de distribución normal estándar. En este caso, para un nivel de confianza del 95% el valor de Z será 1,96. p: Probabilidad de éxito o proporción esperada. q: Probabilidad de fracaso. e: Precisión (error máximo admisible en términos de proporción).
Reemplazando en la Ec. 2, se obtuvo:
1,96 ∗ (0,5) ∗ (0,5) 푛 = 0,1
푛 = 96
Una vez calculado el tamaño de la muestra a encuestar, se formularon 13 preguntas. Cada una de estas preguntas se asoció a una de las variables presentes en la base de datos con excepción de la variable fecha, departamento y municipio. Estas variables no se tuvieron en cuenta para la formulación de la encuesta, pues son de gran importancia para la navegación en la herramienta de visualización. De la variable fecha se extrae el año en que sucedió el homicidio, el departamento y municipio darían la ubicación espacial en el mapa de Colombia.
Por otro lado, se agruparon las variables de móvil del agresor y móvil de la víctima en una sola pregunta de la encuesta, teniendo en cuenta que las dos variables pueden tomar los mismos valores de respuesta, refiriéndose al medio de transporte empleado.
Con respecto a la variable profesión esta no fue tenida en cuenta para el desarrollo de la encuesta, debido a que el 71% de las víctimas, es decir, 78.842 homicidios no reportaron profesión.
Esta encuesta permitió que los usuarios seleccionaran que variables consideraban importantes, para que estas fueran visualizadas en la herramienta. Las preguntas formuladas junto con las variables asociadas se presentan en la Tabla 7 y la encuesta en el anexo A.
27
Tabla 7. Preguntas de encuesta
PREGUNTA VARIABLE 1. ¿Considera usted importante conocer el día en el que sucedieron Día los homicidios? (Lunes a Domingo) 2. ¿Considera usted importante conocer la hora en la que Hora sucedieron los homicidios? 3. ¿Considera usted importante conocer el barrio en el que Barrio sucedieron los homicidios? 4. ¿Considera usted importante conocer el tipo de zona en el que Zona sucedieron los homicidios? 5. ¿Considera usted importante conocer el lugar en el que Lugar sucedieron los homicidios? (vía pública – casa parques - etc.) 6. ¿Considera usted importante conocer el arma empleada con la Arma cual se ejecutó el homicidio? 7. ¿Considera usted importante conocer el medio de transporte del Móvil agresor – Móvil victima agresor y la victima involucrados en los homicidios? 8. ¿Considera usted importante conocer la edad de la víctima? Edad 9. ¿Considera usted importante conocer el género de la víctima? Genero (masculino – femenino) 10. ¿Considera usted importante conocer el estado civil de la Estado civil víctima? 11. ¿Considera usted importante conocer la nacionalidad de la Nacionalidad víctima? 12. ¿considera usted importante conocer la actividad económica de Actividad económica la víctima? 13. ¿Considera usted importante conocer el nivel de escolaridad de Escolaridad la víctima? Fuente: Autores
La encuesta fue formulada con 13 preguntas, donde los encuestados deberían responder en una escala del 1 al 5, donde 1 es sin relevancia y 5 es muy relevante, que tan importante es presentar la información de la variable en el sistema de visualización y de esta manera fuera más fácil la interpretación y el entendimiento de la información presentada. La encuesta fue distribuida por redes sociales, con un alcance total de 143 encuestados de diferentes edades, genero, niveles educativos, profesiones y ciudades. Los resultados de la encuesta se encuentran presentados en la Tabla 8.
28
Tabla 8. Resultados de la encuesta
Respuestas Porcentaje de Respuestas en 4-5 Pregunta Variable respuestas en 1 2 3 4 5 / Encuestados 4-5 1 Día 6 3 17 29 88 117/143 81,82 % 2 Hora 4 2 25 34 78 112/143 78,32 % 3 Barrio 0 1 6 28 108 136/143 95,10 % 4 Zona 1 0 14 41 87 128/143 89,51 % 5 Lugar 1 0 6 44 92 136/143 95,10 % 6 Arma 2 4 21 29 87 116/143 81,12 % 7 Móvil 2 6 13 40 82 122/143 85,31 % 8 Edad 5 10 17 48 63 111/143 77,62 % 9 Genero 3 5 19 36 80 116/143 81,12 % 10 Estado Civil 22 26 35 26 34 60/143 41,96 % 11 Nacionalidad 7 16 27 41 52 93/143 65,03 % 12 Actividad Económica 17 12 32 42 40 82/143 57,34 % 13 Escolaridad 26 31 33 26 27 53/143 37,06 % Fuente: Autores
A partir de los resultados se determinó que para que la variable fuera seleccionada, esta debería cumplir el criterio de selección. Este consiste en tener un puntaje superior al 75% de los votos totales en la valoración 4 y 5 para cada variable. La Ec. 3 presenta el número de votos sobre el cual las variables fueron seleccionadas.
퐶푆 = 푉4 + 푉5 > 푁퐸 ∗ 75% Ec. 3
Donde:
CS: Criterio de selección. V4: Número de votos con calificación 4. V5: Número de votos con calificación 5. NE: Numero de encuestados.
Reemplazando el número de encuestados en la Ec. 3
퐶푆 = 푉4+ 푉5 > 143∗75% 퐶푆 = 푉4+ 푉5 > 108
De esta manera las variables que cumplieron con el criterio de selección de la Ec. 3, serán presentadas en la herramienta de visualización. Las seleccionadas por los usuarios encuestados fueron: día, barrio, zona, lugar, arma, móvil, edad, genero. Adicional a estas, el año, el departamento y municipio serán variables intrínsecas en la herramienta por temas de navegabilidad.
29
5. FASE III. DISEÑO DE ESTRATEGIA DE VISUALIZACIÓN
Los sistemas de información (SI) son un conjunto de elementos que interactúan entre sí, que buscan administrar y comunicar un cierto tipo de información para empleados, clientes, proveedores y administrativos. (Whitten & Bentley, 2017) Sin embargo, presentar la información de forma sencilla es un reto para las organizaciones y para los programadores. Por lo tanto, contar con herramientas de visualización en los sistemas de información es clave para aprovechar los datos, generar conocimiento y soportar los procesos de toma decisiones (Logicalis, 2015).
5.1 COMPONENTES DEL SISTEMA DE INFORMACIÓN
Dentro del diseño de los sistemas de información se debe realizar una planeación del proceso de desarrollo, este se presenta en la descripción de los 4 componentes que conforman el SI: Individuos participantes, tecnologías de la información, documentación de procedimientos y requerimientos. (Gonzalez-Longatt, 2012)
Individuos participantes: En HomicideTool los propietarios, diseñadores y constructores del sistema son los tesistas. Los usuarios de prueba del sistema son los estudiantes de la Universidad de La Salle. Y finalmente se tiene la base datos como el elemento donde se almacenan los datos.
Tecnologías de la información: Son los recursos tecnológicos necesarios para la ejecución de la plataforma, esta interfaz no posee un recurso tangible pues está conformada por una serie de archivos que interactúan entre sí. El objetivo de esta sección es seleccionar la herramienta de procesamiento y visualización de datos, dentro de los más usados se tiene:
- Tableau: Esta herramienta trabaja en dos niveles: infográfico y visualización, permite crear pequeños cálculos para su posterior visualización y como plus permite cargar datos de diferentes fuentes. - Flourish: Esta herramienta está enfocada en data HistoryTelling (contar historia con los datos), con plantillas de limitada modificación. - Infogram: Esta herramienta realiza presentaciones con carácter infográfico, con limitación en datos dinámicos y limitación en fuentes de datos. - Carto: Esta herramienta representa datos geográficos, con un nivel de detalle como calles, puntos, ciudades, barrios, etc. La carga de datos se hace por varias fuentes donde se especifique el área y la información asociada. - Datawrapper: Herramienta de código abierto, que permite crear mapas y gráficos de forma muy sencilla, con carga de datos muy versátil. Su limitación está en el volumen de los datos, pues no permite manejar gran complejidad, aparte el formato de la salida de los gráficos viene para ser embebido en un plataforma online o sitio web. - RStudio: Es una calculadora visual gráfica pensada en programadores, esta herramienta tiene cierto nivel visualización, pero se debe tener conocimientos previos para su manipulación, por ellos debe ser descartada como herramienta inicial en la presentación de datos. - Processing: Mas que herramientas son lenguajes de programación que está pensada en programadores avanzados para un nivel complejo de visualización. - d3.js: Librería de JavaScript que permite realizar visualizaciones con alto grado de dinamismo, requiere conocimientos básicos en java, diseñada para programadores con una excelente versatilidad entres diferentes fuentes de información. 30
Nota: Las anteriores definiciones fueron obtenidas del curso online titulado Big Data: visualización de datos de la plataforma Coursera de la Universidad de Barcelona impartido por Quelic Berga Carreras, Julià Minguillón Alfonso, Teresa Sancho Vinuesa, Josep Curto Díaz y Ignasi Alcalde. (Coursera, 2019)
Basado en la información anterior y en los criterios mostrados a continuación, se construye la Tabla 9, para seleccionar la herramienta adecuada para HomicideTool.
A: Curva de aprendizaje. B: Flexibilidad de programación. C: Carga de datos. D: Tipo s de visualizaciones. E: Volumen de datos. F: Conocimientos previos por los tesistas. G: Promedio. H: Fuente.
Los criterios de selección son calificados con un referente teórico y de acuerdo con este, se hace una valorización de 1, 3 o 5 bajo la interpretación de los tesistas, donde 5 representa una mayor dificultad, 3 un valor intermedio y 1 nulidad o menor dificultad.
Tabla 9. Cuadro comparativo entre alternativas de visualización.
Fuente: Autor.
Como se puede observan en la Tabla 9, se busca el menor valor de la columna G que representa el promedio de la evaluación de los criterios. El cuadro rojo resalta los tres mejores resultados de esta selección, en donde se tiene a Rstudio, Procesing y D3,js. Por los conocimientos previos y la amplia flexibilidad de programación la librería D3,js para JavaScript, será la herramienta con la cual se diseñara la interfaz de visualización. Consecuente a ello se selecciona Sublime Text 3.0, un editor de texto y editor de código, el cual posee características como: mini mapa, multiselección, edición dividida, multicursor, búsquedas dinámicas, accesos rápidos, variedad en los leguajes que soporta, bajo recurso tecnológico y finalmente la facilidad de instalación de gran variedad de plugin. En la sección 6.2 se describe en mayor detalla dicha herramienta. (EduRed, 2019)
31
Documentación de procedimientos: Realizar el registro detallado es la base de cualquier proyecto de sistemas de información, donde no solo es la programación de la plataforma y el análisis de los resultados, si no el diseño de una buena metodología de desarrollo que permita a cualquier desarrollador comprender las características del sistema.
Requerimientos: El proceso de diseño comienza con los requerimientos, los cuales están divididos en funcionales y no funcionales como se observa en la Tabla 10.
Tabla 10. Requerimientos funcionales del sistema
Identificación Requerimiento Prioridad RF1 Los datos deberán estar en archivos de texto plano .csv Alta RF2 La aplicación deberá hacer los cálculos necesarios para cada gráfica. Alta RF3 La profundidad de la información deberá ir desde el país a nivel general, Alta departamento a nivel intermedio y municipio a nivel detallado. RF4 El sistema deberá visualizar la edad, el género, como variables en común Alta para los tres niveles de profundidad en la navegabilidad. RF5 El campo de país deberá solo mostrar a Colombia debió al alcance del Alta proyecto. RF6 La navegabilidad del sistema deberá iniciar por la selección del año, Alta seguido del departamento y finaliza en el municipio. Fuente: Autor.
Tabla 11. Requerimientos no funcionales del sistema
Identificación Requerimiento Prioridad RNF1 La plataforma no deberá contar no textos extensos, de Baja tal manera que los usuarios estén centrados en la visualización. RNF2 Los colores de la plataforma no deberán ser brillantes y Media se debe observa una opacidad. RNF3 Deberá ser fácil de navegar con ayudas y menús Alta intuitivos. RNF4 El sistema deberá mostrar gráficos dinámicos que Media faciliten la interpretación de la información RNF5 Toda búsqueda en el sistema deberá responder al usuario Alta en menos de 30 segundos. RNF6 El sistema debe proporcionar mensajes de error que Media informen al usuario final. Fuente: Autor.
Identificados cada uno de los requisitos es necesario usar una herramienta que permita trabajar con programación orientada a objetos (POO) y lenguaje unificado de modelado (UML) son la solución.
32
5.2 DIAGRAMAS UML
Dado que la herramienta de visualización seleccionada trabaja con JavaScript, un lenguaje orientado a objetos, el diseño del sistema será usando UML, una metodología que agrupa una de las mejores prácticas de modelado de software.
El primer diagrama es el diagrama de casos de uso, que permiten modelar el comportamiento del sistema bajo los principales requisitos funcionales. La Fig. 3 se observa el usuario, el cual es representado por medio de un stick de persona.
Figura 3. Diagrama de casos de uso de la HomicideTool
Fuente: Autor.
Para comprender la interacción que tiene con la plataforma el usuario, la Tabla 12 presenta una descripción detallada.
33
Tabla 12. Actores del SI
Actor Usuario NO registrado Descripción Representa cualquier individuo que ingrese a la plataforma HomicideTool Persona de cualquier edad con acceso a internet, interesados en conocer información Características sobre homicidios en lugares específicos en Colombia entre el año 2010 y 2017
Relaciones NA Tipo Primario Anderson Cifuentes / Autor Fecha 19/04/2020 Versión 1.0 Carlos Quijano
Fuente: Autor.
A continuación, se presentan las Tablas 13, 14 y 15, que hacen referencia a los principales casos de uso, en ellas se encuentra una descripción detallada. Los casos de uso principales son: visualización homicidios en el país, visualización homicidios en el departamento y visualización de homicidios en el municipio; En el primer caso de uso, visualización de homicidios en el país, el usuario selecciona el país que quiere visualizar y selecciona el año. Se consultan los valores seleccionados en la base de datos y se crean las gráficas: género, edad, asesinatos por mes, tipo de arma y mapa de calor a nivel nacional, este es presentado en la Tabla 13.
Tabla 13. Descripción Caso de uso visualización homicidios en el país.
Caso de uso Visualizar homicidios en el país Actores Usuario No registrado, base de datos Tipo real Referencias N/A Precondiciones N/A Post condiciones Se crean las gráficas de homicidios a nivel país Autor Anderson Cifuentes / Carlos Fecha 20/04/2020 Versión 1.0 Quijano Propósito Visualizar las gráficas de homicidios en el país seleccionado Resumen El usuario selecciona el país que quiere visualizar y selecciona el año. Se consultan los valores seleccionados en la base de datos y se crean las gráficas: género, edad, Asesinatos por mes, tipo de arma y mapa de calor a nivel nacional
Curso Normal 1. El usuario accede a la plataforma por internet 2. Lee la información que allí se describe acerca de la plataforma HomicideTool.
34
3. Selecciona un país de interés. (para 4. El sistema comprueba que en la base este caso: Colombia) de datos el país 5. El sistema visualiza el país seleccionado y desplegar información de navegabilidad 6. El usuario lee los la información de navegabilidad y acepta los términos 7. El usuario selecciona un año de 8. El sistema filtra la base de datos por interés el año seleccionado 9. El sistema crea las gráficas: edad, genero, asesinatos por mes, tipo de arma y el mapa de calor del Colombia. Otros datos Frecuencia 20 Usuarios por hora Rendimiento Alto esperada Importancia Alta Urgencia N/A Estado Revisado Estabilidad Moderada
Fuente: Autor
Para el siguiente caso de uso, el cual es la visualización homicidios en el departamento, el usuario selecciona el departamento. Se consultan los valores seleccionados en la base de datos y se crean las gráficas: genero, edad, grafica los días que presentan mayor número de asesinatos, tipo de zona con mayor número de asesinatos, mapa de calor para retornar a nivel nacional o seleccionar otro departamento y el mapa de calor a nivel departamental para ir a un municipio, la ficha del caso de uso se presenta en la Tabla 14. Tabla 14. Descripción Caso de uso visualización homicidios en el departamento.
Caso de uso Visualizar homicidios en el departamento Actores Usuario No registrado, base de datos Tipo real Referencias N/A Precondiciones Condición Inicial: Caso de Uso-homicidios en el país Condicional: Seleccionar un departamento
Post condiciones Se crean las gráficas del tablero, homicidios a nivel departamento. Autor Anderson Cifuentes / Carlos Quijano Fecha 20/04/2020 Versión 1.0 Propósito Visualizar las gráficas de homicidios en el departamento seleccionado.
35
Resumen El usuario selecciona el departamento. Se consultan los valores seleccionados en la base de datos y se crean las gráficas: genero, edad, grafica los días que presentan mayor número de asesinatos, tipo de zona con mayor número de asesinatos, mapa de calor para retornar a nivel nacional o seleccionar otro departamento y el mapa de calor a nivel departamental para ir a un municipio.
Curso Normal 1. El usuario selecciona un departamento 2. El sistema valida la información con la base de datos. 3. Verificado el departamento el sistema hace Zoom sobre el área seleccionada y carga los datos de la BD. 4. El sistema crea las gráficas: genero, edad, grafica los días que presentan mayor número de asesinatos, tipo de zona con mayor número de asesinatos, mapa de calor para retornar a nivel nacional o seleccionar otro departamento. 5. El usuario selecciona un el mismo departamento y el sistema lo retorna al caso de uso homicidios en el país.
Cursos alternos 5.a El usuario selecciona otro departamento diferente al seleccionado, el sistema verifica y carga los datos de la base de datos y vuelve a 3.
Otros datos Frecuencia 20 Usuarios por hora Rendimiento Alto esperada Importancia Alta Urgencia N/A Estado Revisado Estabilidad Moderada
Fuente: Autor
Por último, se encuentra el caso de uso de visualización de homicidios en el municipio, donde el usuario selecciona el municipio. Se consultan los valores seleccionados en la base de datos y se crean las gráficas: genero, edad, grafica de los móviles en los que se desplazaba la víctima y el agresor, grafica de los barrios más peligrosos en el municipio, mapa de calor a nivel nacional para retornar a nivel nacional o seleccionar otro departamento y el mapa de calor a nivel departamental para ir a otro municipio, esta ficha de descripción se presenta en la Tabla 15. Tabla 15. Descripción Caso de uso visualización homicidios en el municipio.
Caso de uso Visualizar homicidios en el municipio Actores Usuario No registrado, base de datos 36
Tipo real Referencias N/A Precondiciones Condición Inicial: Caso de uso homicidios en el departamento Condicional: Seleccionar un municipio
Post condiciones Se crean las gráficas del tablero, homicidios a nivel municipal Autor Anderson Cifuentes / Carlos Quijano Fecha 20/04/2020 Versión 1.0 Propósito Visualizar las gráficas de homicidios en el municipio seleccionado. Resumen El usuario selecciona el municipio. Se consultan los valores seleccionados en la base de datos y se crean las gráficas: genero, edad, grafica de los móviles en los que se desplazaba la víctima y el agresor, grafica de los barrios más peligrosos en el municipio, mapa de calor a nivel nacional para retornar a nivel nacional o seleccionar otro departamento y el mapa de calor a nivel departamental para ir a otro municipio.
Curso Normal 1. El usuario selecciona un municipio de 2. El sistema valida la interés información con la base de datos. 3. El sistema crea las gráficas: género, edad, grafica de los móviles en los que se desplazaba la víctima y el agresor, grafica de los barrios más peligrosos en el municipio, mapa de calor a nivel nacional para retornar a nivel nacional o seleccionar otro departamento y el mapa de calor a nivel departamental para ir a otro municipio. 4. El usuario selecciona un el mismo departamento y el sistema lo retorna al caso de uso homicidios en el país
Cursos alternos 4.a El usuario selecciona otro departamento diferente al seleccionado, el sistema verifica y carga los datos de la base de datos y vuelve a la iteración 3 del caso de uso visualizar homicidios departamento. 5.a El usuario selecciona otro municipio diferente al seleccionado, el sistema verifica y carga los datos de la base de datos y vuelve a la iteración 2.
Otros datos Frecuencia 20 Usuarios por hora Rendimiento Alto esperada
37
Importancia Alta Urgencia N/A Estado Revisado Estabilidad Moderada
Fuente: Autor
Por otro lado, los demás casos de uso serán descritos de manera general, pues estos representan tareas básicas como una selección, clic y botón en el SI. Estas descripciones, son presentadas en las fichas de las Tablas 16, 17, 18 y 19 respectivamente.
Tabla 16. Descripción Caso de uso seleccionar país
Caso de uso Seleccionar país. Actores Usuario, base de datos. Una vez se ingresa al sistema, la plataforma visualiza un breve resumen Resumen sobre HomicideTool y desplegué un menú con los países, el usuario selecciona el de su interés. Precondiciones Post condiciones Se debe aceptar la información de navegabilidad del sistema. Incluye Caso de uso: seleccionar año, Verificar datos Extiende Hereda de Flujo de eventos Actor Sistema 1. El usuario lee la información de resumen de la plataforma y selecciona el país 2. El sistema visualiza la información de navegabilidad. deseado. 4. El Sistema consulta la base de datos y carga la información del país. 3. el usuario acepta la información de navegabilidad. Fuente: Autor.
38
Tabla 17. Descripción Caso de uso seleccionar año
Caso de uso Seleccionar año Actores Usuario El usuario selecciona el año deseado entre periodo comprendido de 2010 Resumen a 2017. Precondiciones El usuario tuvo que haber seleccionado un país. Post condiciones NA Incluye Caso de uso: Verificar datos Extiende NA Hereda de NA Flujo de eventos Actor Sistema 1. El usuario 2. El sistema consulta en la base de datos. selecciona el año 3. El sistema carga la información del año seleccionado. de interés Fuente: Autor. Tabla 18. Descripción Caso de uso seleccionar departamento Caso de uso Seleccionar departamento Actores Usuario Al desplazar el cursor y dar clic sobre el departamento realiza la consulta Resumen en la base de datos y procede a la generación de gráficas para la visualización. Precondiciones 1.El usuario debe haber seleccionado el país y el año. Post condiciones NA Incluye Caso de uso: Verificar datos Extiende NA Hereda de NA Flujo de eventos Actor Sistema 1. El usuario selecciona el departamento del 2. El sistema consulta en la base de datos el departamento seleccionado su interés 3. El sistema carga la información del departamento. Fuente: Autor.
39
Tabla 19. Descripción Caso de uso seleccionar año Caso de uso Seleccionar municipio Actores Usuario Al desplazar el cursor y dar clic sobre el municipio el sistema realiza la Resumen consulta en la base de datos y procede a la generación de gráficas para la visualización. 1.El usuario debe haber seleccionado el país y el año. Precondiciones 2. El usuario debe haber seleccionado el departamento de interés. Post condiciones NA Incluye Caso de uso: Verificar datos Extiende NA Hereda de NA Flujo de eventos Actor Sistema 1. El usuario selecciona el municipio de su 2. El sistema consulta en la base de datos el municipio seleccionado interés. 3. El sistema carga la información del municipio. Fuente: Autor.
A continuación, se describe el diagrama el diagrama de clases, el cual permite modelar la estructura estática del sistema. La Fig. 4 describe tres interfaces, la primera es el índex, en donde se visualiza un render con el planeta y un formulario donde se selecciona el país, está asociada con la clase world y la clase intro. La segunda interfaz, Pselecionado permite la visualización de todas las gráficas contenidas en la base de datos, la clase padre Grafica, contiene las características globales o generales de cada una las subclases, como el tamaño, color, fondo, borde, separación entre otras, también como se puede observar existe una fuertes dependencia con entre las clases año, país y municipio, basado en la selección del usuario se realiza el filtro en la BD y se crean las gráficas específicas para cada tablero. Y finalmente se tiene la interfaz error que representa una pantalla de error para notificar al usuario que ha seleccionado un valor incorrecto.
40
Figura 4. Diagrama de clases de la herramienta de visualización HomicideTool
Fuente: Autor. 41
El siguiente diagrama UML es de secuencia básica en donde se observa la interacción del usuario, el sistema y la base de datos. También se observa los funcionamientos y transiciones con los principales mensajes entre los objetos. Como se observa en la Fig. 5 el tipo de control es centralizado, donde el usuario ejecuta las consultas necesarias al sistema y el este a su vez con la base de datos. Tanto el usurario como el sistema tienes líneas de vida de igual magnitud, es decir que una vez el usuario abandona la plataforma el sistema cumple su ciclo de vida, lo que no pasa con la base de datos que es consultada varias veces dentro de la ejecución normal de la interfaz, esto se hace con el fin de tener actualizados los datos en todo momento pues la base de datos puede cambiar por actualizaciones de registros. Figura 5. Diagrama de secuencia de HomicideTool
Fuente: Autor.
42
Finalmente, el ultimo diagrama es el mapa de navegabilidad, que orienta al usuario sobre el recorrido dentro de la plataforma. En la Fig. 6 se observa que le sistema lo componen tres páginas principales, la primera es el index, en donde se tiene la infamación básica sobre la plataforma y donde el usuario selecciona el país que desea consultar, si la información seleccionada no concuerda con la base de datos la página de error se visualiza, por el contrario si la información es verídica la página de selección aparece y dentro de ella el usuario puede visualizar los homicidios del país, de los departamentos y de los municipios.
Figura 6. Mapa de navegabilidad de HomicideTool
Fuente: Autor.
Complementando el diagrama descrito en Fig. 6 la sección 6.3 describe la navegabilidad final de la plataforma.
43
5.3 SELECCION DE GRAFICAS
La parte final en el diseño es la selección de las gráficas de variables seleccionadas en el capítulo anterior y que serán presentadas en la herramienta de visualización. La primera variable es el año, esta permite hacer un filtrado general de información de la base de datos, es decir que cuando se seleccione el año solo se mostrara la información referente a ese año. En la Tabla 20, se observan los posibles gráficos para represar la variable.
Tabla 20. Selección de la gráfica para la variable año.
Variable: Fecha TIME LINE LISTA MENÚ
Fuente: https://es.clipart.me/istock/long- Fuente: http://cssmenumaker.com/blog/free- shadow-design-clean-number-timeline- css-sidebar-menu-navigations/ template-graphic-or-web-342907 Ventajas: Ventajas: - Diseño compacto. - Diseño organizado. - Diseño organizado. - Diseño jerarquico para - Diseño localizado. subcategorias. - Adicion de hipervinculos - Adicion de hipervinculos. Desventajas: Desventajas: - Poco espacio para montar - Ocupa mucho espacio. información. Grafico Selecionado: Dadas las caractericas de la aplicación la linea de tiempo, sera la forma cronologica mas apropiada de presentar la variable año en la herramienta Homicide Tool. Fuente: Autores
Las siguientes variables son el departamento y el municipio, bajo la premisa de que este tipo de variables son espaciales y geográficas, se postulan en la Tabla 21 los siguientes tipos de gráficos.
44
Tabla 21. Selección de la gráfica para la variable departamento y municipio.
Variable: Departamento y Municipio Mapas LISTA MENÚ
Fuente: Fuente: http://cssmenumaker.com/blog/free- https://www.ingeniovirtual.com/tipos-de-graficos- css-sidebar-menu-navigations/ y-diagramas-para-la-visualizacion-de-datos/ Ventajas: Ventajas: - Locaciones geograficas. - Diseño organizado. - Agregar colores para identificacion de - Diseño jerarquico para caracteristicas. subcategorias. - Graficos compactos y dinamicos. - Adicion de hipervinculos. Desventajas: Desventajas: - La complejidad aumenta depediendo la - Ocupa mucho espacio. cantidad ubicaciones. - Itemens limitados, listas muy largas,generan dificultadad en la busqueda. Grafico Selecionado: Dadas las caractericas de la aplicación los mapas, sera la forma geografica mas apropiada de presentar la variable departamento y municipio en la herramienta Homicide Tool. Fuente: Autores
La variable día y mes, representa la cantidad de homicidios consignados de lunes a domingo y de enero a diciembre respectivamente. En la Tabla 22, se observa los diferentes tipos de gráficos considerados para gráficas dichas variables.
45
Tabla 22. Selección de la gráfica para la variable día y mes
Variable: Día y Mes Barras horizontales Gantt
Fuente: Fuente: http://estadisticaise.blogspot.com/2012/09/graficos- https://www.iusc.es/recursos/gesproy/textos/03.03.0 de-barras.html 1.01.htm Ventajas: Ventajas: - Pueden usarse cuando el eje no tiene escala - Cada actividad se represetna mediante un numerica. bloque rectangular cuya longitud indica su - Facil comparacion entre categorias. duracion. - Permite organizar por frecuencia los sucesos - Se observa la sucesion consecutiva de tareas. obtenidos. Desventajas: Desventajas: - Se dificulta la comparacion entre la duracion - La comparacion entre series se dificulta de las tareas, por la ubicacion. cuando el número de clases crece. - Graficos complejos que requerien mayor niveles de programación. - No organiza los sucesos por frecuencias. Grafico Selecionado: Dadas las caractericas de la aplicación las barras horizontales, sera la forma mas apropiada de presentar la variable Dia y Mes en la herramienta Homicide Tool. Fuente: Autores
El tipo de arma clasifica los elementos causantes de la muerte en grupos como armas de fuego, armas blancas, químicas, etc. El tipo de zona muestra dos grupos rurales y urbanos. En la Tabla 23 se comparan los gráficos analizados.
46
Tabla 23. Selección de la gráfica para la variable tipo de arma y zona
Variable: Tipo de arma y zona Torta Barras
Fuente: Fuente: https://elianasanjugo.wordpress.com/estadistica/terc http://asesorias.cuautitlan2.unam.mx/Laboratoriovir er-periodo/diagramas-de-barras-para-dos-variables/ tualdeestadistica/DOCUMENTOS/TEMA%201/5. %20GRAFICA%20DE%20%20PASTEL.pdf Ventajas: Ventajas: - El área de cada parte es proporcional al - Este grafico relaciona las clases de dos o mas número de datos de cada categoría. variables. - Representar variables cualitativas o Desventajas: categóricas, de preferencia nominales. - Cuando la escala de los graficos estan muy Desventajas: dispersas no se logra identificar con claridas - La comparacion entre las categorias se las clases mas pequeñas. dificulta po ellos se ecomienda anexar - En caso de que existan muchas categorias el indicadores numericos. grafico se hace muy grande. Grafico Selecionado: Dadas las caractericas de la aplicación el grafico de torta, sera la forma mas apropiada de presentar la variable tipo de armas en la herramienta Homicide Tool. Fuente: Autores
La edad y el género son variables que caracterizan la población contenida en la base de datos, estas variables se pueden asociar entre sí con una pirámide de población, en la Tabla 24 se observan algunas características. Se selecciona este grafico porque al separar dichas variables sería necesario usar dos tipos de gráficos diferentes los cuales ocuparían más espacio en el dashboard.
47
Tabla 24. Selección de la gráfica para la variable edad y género.
Pirámide de población
Fuente: http://titulaciongeografia- sevilla.es/contenidos/becarios/materiales/archivos/PIRAMIDES_DE_POBLACION.pdf
Ventajas: - Se puede representar datos estadísticos básicos, sexo y edad, de la población de un país, con una rápida comparación entre categorías. - Permite comparar dos grupos diferentes que tiene otra variable en común. Desventajas: - Require mayores niveles de progamación. Fuente: Autores
La variable tipo de móvil agrupo los vehículos en los cuales se desplazaba la víctima y el agresor. En la Tabla 25, se analiza los gráficos propuestos.
48
Tabla 25. Selección de la gráfica para la variable de móvil agresor y victima
Variable: Tipo de móvil agresor y victima Gráfico de árbol Barras
Fuente: Fuente: https://www.plandemejora.com/como- https://elianasanjugo.wordpress.com/estadistica/tercer- hacer-un-diagrama-de-arbol-de-decisiones/ periodo/diagramas-de-barras-para-dos-variables/ Ventajas: Ventajas: - Presenta jerequias y permite deglozar la - Este grafico relaciona las clases de dos o mas informacion por subcategorias. variables. - Es capaz de presentar variables que no Desventajas: tengan frecuencias. - Cuando la escala de los graficos estan muy dispersas no se logra identificar con claridas las Desventajas: clases mas pequeñas. - Entre mas ramas se acumulen mas - En caso de que existan muchas categorias el complicado se hace las comparacion entre grafico se hace muy grande. clases es necesario agregar indicadores numericos. Grafico Selecionado: Dadas las caractericas de la aplicación el grafico de arbol sera la forma mas apropiada de presentar la variable movil del agressor y de la victima en la herramienta Homicide Tool. Fuente: Autores
La variable barrio describe los 5 barrios más peligrosos de cada municipio seleccionado. Para esta variable se seleccionó únicamente un top 5, ya que los barrios son unidades geográficas muy pequeñas dentro de un municipio, para que este fuera graficado dentro de la herramienta, adicional a esto, la base de datos no presentaba información más precisa sobre el lugar donde se presentó el homicidio. En la Tabla 26 se describe el grafico.
49
Tabla 26. Selección grafico variable barrio
Lista descendente
Fuente: http://cssmenumaker.com/blog/free-css-sidebar-menu- navigations/ Ventajas: - Presenta organizar la informacion del mayor al menor evente registrado. Desventajas: - Numero limitado de items a mostrar. Fuente: Autores
50
6. FASE IV. IMPLEMENTACIÓN HOMICIDE TOOL
6.1 ENTORNO DE PROGRAMACIÓN
Como se mencionó anteriormente el desarrollo de la plataforma se seleccionó javascript como lenguaje de programación, ya que este cuenta con unas ventajas sobre otros lenguajes como C++ o tableau en cuanto a flexibilidad y soporte para la visualización de datos. Inicialmente se tuvo en cuenta que este es un lenguaje simple, además de ser intuitivo cuando las personas ya tienen conocimientos en otros entornos de programación, ya que todos estos son similares y la lógica sigue los mismos patrones. Por otro lado, javascript ofrece mayor flexibilidad a la hora de montar escenarios gráficos, esto permitió generar alternativas, realizar modificaciones en los tableros que se realizaron, de tal forma que se obtuviera el mayor provecho de la plataforma.
Como editor de texto se empleó sublime text. El cual es un editor de código que permite el uso de varios lenguajes de programación como C, C++, Javascript, Latex, entre otros. Esta herramienta permitió la implementación del código de programación de manera sencilla, ya que durante el desarrollo de la aplicación se utilizaron varios paneles de trabajo con las diferentes funciones programadas de manera simultánea en la misma pantalla, característica que tiene sublime text. Lo anterior, debido a que las variables que se presentan para todos los departamentos son las mismas, aun cuando la información que consignada en las gráficas varié y de la misma forma con los municipios.
Por otro lado, SublimeText es un programa que dispone de opción de autoguardado, lo que facilita a los programadores almacenar los cambios realizados en sus códigos sin perder ninguno de ellos.
Figura 7. Ventana de programación SublimeText
Fuente: Autores
51
Para el desarrollo del entorno de visualización se utilizó una biblioteca de JavaScript llamada D3.js, la cual es una herramienta informática que se utiliza para producir y crear gráficos dinámicos e interactivos, creando estas gráficas desde el inicio o simplemente utilizando plantillas de gráficos ya creados y que son compartidos en la biblioteca. Esta fue seleccionada debido a que lo que se pretende con el trabajo es realizar la presentación de datos en formatos gráficos e interactivo, de tal manera que se despierte el interés en los usuarios para seguir utilizando estas herramientas, y obtener la finalidad de transferir mejor la información los usuarios finales.
6.2 NAVEGABILIDAD
HomicideTool cuenta con 3 ventanas de navegación. Donde el usuario empieza su recorrido en la herramienta con el dashboard inicial y por medio de vínculos con las cuales el usuario puede consultar la información de interés de manera sencilla. Inicialmente se encuentra el dashboard de bienvenida o inicio, presentado en la Fig. 8. Figura 8. Dashboard inicial.
Fuente: Autores
En esta ventana se realiza una descripción de la herramienta, con el fin de explicar a los usuarios el alcance que esta tiene. Adicional a esto se realiza la selección del país de interés, para la consulta de la información. Para el caso de esta herramienta aplica Colombia. Inmediatamente se despliega una ventana emergente con información para la navegación. En la cual se dan algunas instrucciones como, seleccionar el año de consulta, seleccionar el departamento de consulta, entre otros. En la Fig. 9 se presenta un ejemplo de la ventana emergente con información para usuarios acerca de la de navegación en la plataforma.
52
Figura 9. Ventana emergente con información de navegabilidad.
Fuente: Autores.
Una vez se acepta el aviso presentado en la ventana emergente, aparece el globo terráqueo con el país seleccionado anteriormente, como se presenta en la Fig. 10. Figura 10. Dashboard del país seleccionado, el sistema está a la espera de seleccionar un año.
Fuente: Autores
En esta ventana se realiza la selección del año de consulta de interés (entre 2010 y 2017). Esta selección se realiza al dar clic en el cualquier año ubicado en la barra de la parte inferior derecha de la pantalla. Posteriormente la información se cargará en el mapa de Colombia, por medio de una lectura de la base de datos, donde se filtra solo la información de los homicidios asociados al año seleccionado, y estos son plasmados en un mapa de calor con la tasa de homicidios.
53
El proceso de filtrado de la información en esta ventana se realiza con un ciclo comparativo, donde se lee de la base de datos, únicamente los homicidios cuyo año es el seleccionado, a partir de esto establece un contador de número de homicidios por departamento, el cual queda acumulado en una variable por departamento, de tal manera que permita conocer el número de homicidios de este año. De esta forma, se establece una relación directa entre el número de homicidios por año y la población del territorio seleccionado, que permite la construcción del mapa de calor, el cual está conformado por 6 diferentes tonos de color rojo que varían según la tasa de homicidios cada 100.000 habitantes. Permitiendo al usuario interpretar según la intensidad del color el número de homicidios asociados al territorio seleccionado. La información de la población de los departamentos y municipios, se encuentran relacionados en los anexos E y F respectivamente.
El dashboard anual, se encuentra compuesto por un mapa de calor, que se obtiene luego de realizar la selección del año. Se despliega una ventana en el lado izquierdo de la pantalla con información general, el año, número de homicidios cometidos, un gráfico de edad y género de la víctima, junto con un gráfico de número de asesinatos por mes y el tipo de arma empleado en el homicidio. Figura 11. Dashboard de los homicidios anuales.
Fuente: Autores
Para proseguir con la navegación dentro de la plataforma, la siguiente acción a ejecutar es realizar la selección del departamento de interés, para esto el usuario debe situar el ratón sobre el departamento y seguido de esto es dar clic. De esta manera el usuario accederá a la siguiente ventana, como ejemplo se seleccionó el departamento de Arauca. Aparece una ampliación del departamento seleccionado en la parte central de la pantalla, junto con el nombre del departamento seleccionado. Este departamento aparece con los límites territoriales, conocidos como municipios y la gráfica presenta un mapa de calor, donde presenta cada municipio con la relación de población y número de homicidios.
Por otro lado, y de la misma manera que en la ventana anterior, se despliega un cuadro con gráficos que relacionan, el número de homicidios en el departamento seleccionado, basados en el año escogido
54 en la primera ventana. Así mismo la gráfica de género y edad de la víctima, el número de asesinatos por día y el tipo de zona en la que ocurrió el asesinato. Figura 12. Dashboard anual en el departamento seleccionado.
Fuente: Autores
Para seguir navegando dentro de la aplicación, el usuario tiene dos alternativas, regresar al mapa de Colombia, donde puede seleccionar otro departamento al dar clic sobre el departamento de interés o seguir navegando en el mismo departamento por medio de la selección de un municipio del departamento como se presenta en la Fig. 12, este es también un mapa de calor donde se relaciona el número de habitantes en cada municipio y homicidios en el mismo. El número de habitantes de cada municipio se relaciona en el anexo E. En caso de que el usuario no conozca la geografía del departamento o el municipio, la herramienta despliega letreros de ayuda para la orientación del usuario, con los nombres de los departamentos y los municipios, al pararse sobre ellos, esto con el fin de garantizar que el usuario navegue con mayor facilidad dentro del mapa.
Al seleccionar un municipio, aparece el nombre del municipio seleccionado bajo el nombre del departamento en la parte central de la ventana. En esta ventana se encuentra información puntual sobre el municipio seleccionado. En la parte izquierda aparece el grafico del móvil de desplazamiento de la víctima y del agresor, así como el top 5 de barrios o lugares más peligrosos del municipio seleccionado.
55
Figura 13. Dashboard anual del municipio seleccionado.
Fuente: Autores
6.3 VISUALIZACION DE LAS VARIABLES
En esta sección se presentan las variables junto con los gráficos que representan la información que se asoció a cada una de ellas.
La variable que se presenta al iniciar la herramienta es el año. El usuario puede seleccionar el año de interés por medio de una barra situada en la parte inferior derecha. El usuario cuenta con 8 posibilidades de selección, que son los años de 2010 a 2017. A partir del año seleccionado, el mapa de calor del país varia teniendo en cuenta el número de homicidios y el número de habitantes por departamento. En la Fig. 14, se presenta la ubicación de la barra de selección del año.
56
Figura 14. Localización de la variable año.
Fuente: Autores
La segunda variable es el departamento donde ocurre el homicidio, para esto se presenta un mapa de calor el cual relaciona la información del número de homicidios y habitantes del departamento. Este mapa de calor tiene una escala que se encuentra compuesta por 7 intervalos, que se pueden diferenciar por medio de la visualización ya que entre más intenso es el color rojo, se atribuye que hay un mayor número de homicidios en ese departamento.
Como ejemplo se presenta en la Fig. 15, el grafico del mapa calor de Colombia en el año 2010, donde se evidencia que el departamento con un mayor índice de homicidios es Arauca, con más de homicidios 78 por cada 100.000 habitantes para ese año. Seguido de Caquetá, Valle del Cauca y el Meta que se encuentran en el intervalo de 56 a 78 homicidios por cada 100.000 habitantes. Por otro lado, los departamentos con menos homicidios registrados son Vaupés, Guainía y Boyacá, los cuales se encuentran en el primer intervalo de 0 a 14 homicidios registrados por cada 100.000 habitantes.
57
Figura 15. Mapa de calor de Colombia en el año 2010.
Fuente: Autores.
Para la representación gráfica del género y edad de la víctima se seleccionó un gráfico de tipo pirámide de población, el cual relaciona estas dos variables en un mismo gráfico. Es un gráfico que inicialmente divide el género de la víctima en hombre y mujeres, en el lado izquierdo presenta toda la información sobre los hombres y del lado derecho la información de las mujeres. Así mismo el grafico cuenta con dos ejes. El eje x presenta el porcentaje de homicidios por género que sucedieron en cierto departamento, de tal manera que a simple vista se ve la diferencia en cantidad de homicidios entre hombres y mujeres y por otro lado el eje y permite, por medio de rangos, clasificar las edades de las víctimas y presentarlas en este mismo grafico por medio de barras verticales. En la Fig. 16 se presenta el grafico de género y edad de la víctima.
58
Figura 16. Grafica de género y edad de las víctimas.
Fuente: Autores
Para la representación de la fecha se emplean dos gráficos similares en diferentes dashboard de la herramienta. Es un gráfico de barras dinámicas con orientación horizontal, las cuales presentan el número de homicidios sucedidos en el mes y en el día, este grafico se organiza de mayor a menor, con el fin de que el usuario pueda identificar rápidamente cual mes del año o que día de la semana presenta un mayor número de homicidios. En la Fig. 17 se presenta un ejemplo de cómo se ven las gráficas de la herramienta. Figura 17. Gráfico mes y día de los homicidios en el año.
Fuente: Autores
Otra representación gráfica que se encuentra en la herramienta de visualización Homicide Tool, es una gráfica de anillo, la cual representa la variable del arma empleada para cometer el homicidio. Esta grafica fue seleccionada ya que permite mostrar los datos como un porcentaje total, donde cada tipo de arma empleada se presenta como una sección del anillo, además de esto permite fácilmente enfocar al usuario por el tamaño que tiene cada una de sus secciones, de esta manera el usuario percibe fácilmente cual es el arma más usada para cometer los homicidios. Cuando el usuario navega sobre
59 la gráfica, este despliega letreros que permiten al usuario identificar, el nombre del arma y el número de homicidios cometidos con la misma. La Fig. 18 es un ejemplo de cómo se ve este grafico para el año 2010. Figura 18. Grafica del tipo de arma empleada.
Fuente: Autores
Para el grafico de departamento se implementó la misma estrategia que para el mapa de Colombia, donde se emplea un mapa de calor para el departamento que el usuario seleccione. Este aparece en una gráfica aumentada en el centro de la pantalla junto al mapa de Colombia. El mapa de calor presenta la tasa de homicidios cada 100.000 habitantes para los municipios que componen el departamento, de tal manera que el usuario identifique de manera sencilla cual es el municipio que presenta mayor número de homicidios. Este grafico adicionalmente muestra las divisiones regionales y los municipios que lo conforman. Como ayuda de navegación despliega letreros que ayudan al usuario a saber los nombres de los municipios antes de la selección. La Fig. 19 presenta el grafico del departamento en la herramienta de visualización. Figura 19. Grafico del departamento seleccionado.
Fuente: Autores.
60
Por otro lado, en la herramienta de visualización se presenta un gráfico asociado al tipo de zona donde se cometió el asesinato, este es un gráfico de anillo, que permite realizar una comparación sencilla entre las dos alternativas (urbana o rural). Se encuentra acompañado de una etiqueta de datos, para que el usuario identifique el color y el porcentaje total de asesinatos cometidos en cada una de estas zonas. La Fig. 20 presenta el grafico de zona. Figura 20. Gráfico tipo de zona.
Fuente: Autores
Para representar la variable móvil, la cual describe en que vehículo o medio de transporte utilizaba el homicida y la victima a la hora del asesinato, se empleó un árbol plegable. El cual permite al usuario por medio de un clic seleccionar si está interesado en el agresor o la víctima, al seleccionar alguna de las dos el telar despliega un listado con las diferentes alternativas acompañado de un valor numérico que representa el número de homicidios cuya información se ajusta a los móviles que están allí enlistados. En la Fig. 21 se presenta el grafico de móvil de los agresores y las víctimas. Figura 21. Gráfico móvil del agresor y móvil de la víctima.
Fuente: Autores
61
Por último, para representar el barrio no se encontró un gráfico adecuado, debido a que todos los municipios cuentan con un gran número de barrios, veredas y demás, razón que dificultaba encontrar algún grafico que se pueda adaptar a este tipo de información. Por tanto, se optó por mostrar una lista con los 5 barrios o lugares con mayor número de homicidios. Con el fin de facilitar la información para el usuario. En la Fig. 22 se muestra un ejemplo del top 5 de las 5 veredas con mayor número de homicidios del municipio de Tame ubicado en Arauca. Figura 22. Gráfico de los barrios más peligrosos.
Fuente: Autores.
62
7. FASE V. VALIDACIÓN CON DISEÑO EXPERIMENTAL Para realizar la validación del desempeño de la plataforma se realizaron 2 experimentos comparativos, donde el primero de ellos permitió identificar aspectos por mejorar, para que la herramienta de visualización tuviese características como la fácil navegación, facilitara a los usuarios la comprensión de la información presentada y claridad a la hora de buscar información puntual. El segundo permitiría demostrar la efectividad que tienen las herramientas de visualización al ser comparadas con un método de búsqueda manual en una base de datos.
7.1 EXPERIMENTO 1
El primer experimento que se realizó estaba basado de un test de 2 secciones. La primera sección consta de 5 preguntas puntuales que permitirían determinar cuál era el desempeño que tenía la plataforma, por medio de la interacción entre el usuario y la herramienta de visualización, donde se consignó como variable de salida el tiempo de respuesta al test y el número de respuestas correctas. La segunda parte permitía medir atributos de la plataforma, como el tipo de gráficos, tamaño y tipo de letra, facilidad de comprensión de la información y que el usuario realizara observaciones sobre la herramienta, los cuales permitirían posteriormente realizar algunas modificaciones a la herramienta de visualización de tal manera que se realizara nuevamente el test y nuevos usuarios evaluaran la herramienta. Tabla 27. Descripción del experimento 1
ITEM DESCRIPCIÓN Objetivo del experimento Verificar si los cambios realizados en la plataforma afectan de manera directa el tiempo de respuesta de los estudiantes al test de 5 preguntas. Variable de respuesta Variable: Tiempo, Unidad: Segundos, Instrumento: Cronometro Factor y Tratamientos Diseño de la plataforma: - Antes: Diseño inicial de la plataforma - Después: Diseño propuesto para mejorar la navegabilidad y comprensión de los datos Unidad experimental 2 Grupos de 15 estudiantes Fuente: Autores
En la segunda parte del test que se realizó, se consolido la información obteniendo como resultado 26 observaciones, la información esta resumida en la Tabla 28.
63
Tabla 28. Resultados del test 1 sección 2
OBSERVACION DESCRIPCIÓN DE LA OBSERVACION FRECUENCIA 1 Instrucción de como regresar en la navegación dentro de la 7 plataforma. 2 Tamaño de gráficos pequeños 6 3 Tamaño de la letra (No es legible) 6 4 Color de la letra de la herramienta (Opacidad) 2 5 Ubicación del lugar donde se encuentra navegando 2 6 Buscador de información puntual 2 7 Velocidad de carga de la información 1 Fuente: Autores
Estas observaciones realizadas por los usuarios permitieron realizar los siguientes ajustes en la herramienta de visualización:
Incorporación de un cuadro de instrucción inicial de uso: permite a los usuarios conocer cuáles son los pasos para navegar dentro de la plataforma. Esta hace referencia a la observación 1 de la Tabla 28. La modificación se presenta en la Fig. 23. Figura 23. Modificaciones del cuadro de dialogo e instrucciones (Después)
Fuente: Autores
Modificación de los gráficos: se ajustó al tamaño completo de la pantalla, lo cual permitiría que los gráficos fueran más grandes y el usuario no tuviese inconvenientes con la lectura de la información (ver Fig. 24 y 25). Así mismo se redistribuyó el espacio. Este ajuste hace referencia a la observación 2 de la Tabla 28. Además, se hicieron modificaciones en el tamaño y color de la letra de los gráficos (ver Fig. 26 y 27).
64
Figura 24. Modificaciones de tamaño de gráficos (Antes).
Fuente: Autores
Figura 25. Modificaciones de tamaño de gráficos (Después).
Fuente: Autores.
65
Figura 26. Modificaciones de tamaño y color de la letra (Antes)
Fuente: Autores
Figura 27. Modificaciones de tamaño y color de la letra (Después)
Fuente: Autores.
Ajustes de posición: se modificó la ubicación dentro de la pantalla de visualización el lugar donde se encontraba navegando el usuario, de tal manera que fuera más fácil tener conocimiento por parte del usuario del lugar actual en el que se encontraba (ver Fig. 28 y 29).
66
Figura 28. Modificaciones de ubicación del lugar de navegación (Antes)
Fuente: Autores.
Figura 29. Modificaciones de ubicación del lugar de navegación (Después)
Fuente: Autores.
Con respecto a la observación 6, el desarrollo de un buscador de información puntual dentro de la plataforma requería de programación avanzada, una ventana de navegación independiente con bucles adicionales. Por tanto, esta observación no fue tenida en cuenta. La observación 7, hacía referencia al tiempo de carga de los datos para visualizarlos en pantalla. Esta no puede ser modificable ya que depende de la velocidad de conexión de red a internet del lugar donde se realizó la prueba.
67
Una vez realizadas las modificaciones en la herramienta de visualización, se busca probar por medio de un experimento comparativo que la plataforma tiene una mejora en el tiempo de resolución del test que presentan los estudiantes. En la Fig. 30 se encuentra el enfoque sistémico, el cual describe los elementos que se involucran en el experimento. Figura 30. Enfoque sistémico del experimento.
Fuente: Autores
El desarrollo del experimento se realizó dentro de la universidad de La Salle, en una de las salas de simulación de la institución. Como se mencionó anteriormente las personas que presentaron el test fueron 30 estudiantes de ingeniería industrial de esta misma universidad, divididos en dos grupos, un grupo antes de realizar las modificaciones y otro después de las modificaciones, cada uno de 15 estudiantes. El experimento tendría como salida el tiempo de respuesta del test y la cantidad de aciertos en el mismo.
Inicialmente este test fue presentado por un grupo 15 estudiantes sobre la plataforma que no tenía las modificaciones. El test experimental se encuentra en el anexo G. Los resultados obtenidos como resultado del test 1 se presentan en la Tabla 29.
Tabla 29. Resultados del test 1
Usurario 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Tiempo (S) 350 208 284 188 280 151 161 499 178 168 388 261 194 312 499 Respuestas 4 5 4 5 3 4 5 3 4 4 3 5 5 4 3 Fuente: Autores
La Tabla 29 está conformada por 3 filas, cada registro es un usuario que realizo el test, el cual tiene consignado el tiempo que tardó en dar respuesta a las 5 preguntas y el número de respuestas correctas.
68
De igual manera, el test 2 se realizó con 15 estudiantes diferentes a los de la primera corrida, sin embargo, en este caso se emplearía la plataforma con las modificaciones sugeridas. Los resultados obtenidos como resultado del test 2 se presentan en la Tabla 30. Tabla 30. Resultados del test 2
Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Tiempo (S) 249 134 133 362 139 312 166 169 281 244 323 325 290 191 333 Respuesta 5 3 5 4 4 5 5 4 4 5 5 4 5 4 5 Fuente: Autores.
Para iniciar el proceso de experimentación de la variable continua (tiempo), se realiza un resumen estadístico de la respuesta de las dos plataformas, con el fin de comprobar que los datos siguen una distribución normal. Para esto se utilizó la herramienta Minitab y una prueba de Anderson Darling, la cual determina que si el valor p se encuentra por encima de 0,05 nos permite afirmar con un nivel de confianza del 95% lo datos tienen una distribución de este tipo. En la Fig. 31 y 32, se encuentran los resúmenes de datos de los resultados del test 1 y 2 respectivamente. Figura 31. Informe resumen del test 1.
Summary Report for TIEMPO 1
Anderson-Darling Normality Test A-Squared 0,65 P-Value 0,071 Mean 274,73 StDev 115,96 Variance 13447,50 Skewness 0,926298 Kurtosis -0,125636 N 15 Minimum 151,00 1st Quartile 178,00 Median 261,00 3rd Quartile 350,00 Maximum 499,00 95% Confidence Interval for Mean 210,51 338,95 95% Confidence Interval for Median 200 300 400 500 181,74 335,81 95% Confidence Interval for StDev 84,90 182,89
95% Confidence Intervals
Mean
Median
200 240 280 320 360
Fuente: Autores.
69
Figura 32. Informe resumen del test 2.
Summary Report for TIEMPO 2
Anderson-Darling Normality Test A-Squared 0,55 P-Value 0,130 Mean 243,40 StDev 81,39 Variance 6624,26 Skewness -0,13752 Kurtosis -1,61478 N 15 Minimum 133,00 1st Quartile 166,00 Median 249,00 3rd Quartile 323,00 Maximum 362,00 95% Confidence Interval for Mean 198,33 288,47 95% Confidence Interval for Median 150 200 250 300 350 167,12 318,89 95% Confidence Interval for StDev 59,59 128,36
95% Confidence Intervals
Mean
Median
150 200 250 300
Fuente: Autores
En los dos resúmenes se puede evidenciar que el valor p es superior a 0,05.
푉푎푙표푟 푝 푡푒푠푡 1 = 0,071 푉푎푙표푟 푝 푡푒푠푡 2 = 0,130
Lo que lo anterior indica es que los dos siguen una distribución normal.
Por otro lado, se presenta un gráfico comparativo llamado gráfico de caja en la Fig. 33, el cual permite dar una de las primeras conclusiones y es que el método 1, es decir la plataforma sin las modificaciones presenta un mayor tiempo de respuesta que el método 2. Esta diferencia se encuentra bastante marcada, razón por la cual se espera que la prueba estadística permita comprobarlo.
70
Figura 33. Gráfico de caja.
Boxplot of TIEMPO 1; TIEMPO 2
500
400
300
Data 274,733
243,4 200
100 TIEMPO 1 TIEMPO 2 Fuente: Autores
La diferencia entre las medias es de 31.33 segundos. Para el experimento se realizó inferencia estadística, el cual es un proceso que permitiría rechazar o no una hipótesis que se plantee. Para este caso se asumió que las varianzas eran iguales.