COMPARACIÓN DE METODOLOGÍAS ESTADÍSTICAS PARA EL ANÁLISIS DE LAS VARIABLES REGISTRADAS POR LA RED DE CALIDAD HÍDRICA DE BOGOTÁ EN LOS RÍOS TORCA Y SALITRE DE LA CIUDAD DE BOGOTÁ D.C

OPCIÓN DE GRADO MODALIDAD SOLUCIÓN DE UN PROBLEMA DE INGENIERÍA.

ELABORADO POR:

PAULA ANDREA BALAGUERA VEGA JULIETH NATHALIA HERNÁNDEZ CHAVARRO

DIRECTOR DE TESIS:

CARLOS ANDRES PEÑA INGENIERO AMBIENTAL

CO-DIRECTOR TESIS

RONAL JACKSON SIERRA PARADA INGENIERO TOPOGRAFICO

UNIVERSIDAD SANTO TOMÁS FACULTAD DE INGENIERÍA AMBIENTAL BOGOTÁ D.C JULIO DE 2017

RESUMEN...... 5 ABSTRACT ...... 6 INTRODUCCION ...... 7 1. PLANTEAMIENTO DEL PROBLEMA ...... 8 2. JUSTIFICACIÓN ...... 10 3. OBJETIVOS ...... 12 3.1 OBJETIVO GENERAL ...... 12 3.2 OBJETIVOS ESPECÍFICOS ...... 12 4. MARCO TEÓRICO ...... 13 4.1 CALIDAD DE AGUA ...... 13 4.2 OPTIMIZACIÓN DE UNA RED DE CALIDAD HÍDRICA ...... 14 4.3 RED DE CALIDAD HÍDRICA...... 16 4.4 RÍO SALITRE ...... 20 4.5 RÍO TORCA ...... 22 4.6 MÉTODOS ESTADÍSTICOS ...... 24 4.6.1 ANÁLISIS JERÁRQUICO ...... 24 4.6.2 GEOESTADÍSTICA IDW Y KRIGING) ...... 25 4.6.3 ANÁLISIS DISCRIMINANTE ...... 27 4.6.4 RED NEURONAL ARTIFICIAL ...... 28 4.5.4.1 Casos de estudio: uso de redes neuronales artificiales en modelamiento de calidad de agua ...... 30 5. METODOLOGIA ...... 36 5.1 ESTADO ACTUAL DE LA RED Y SUS CARACTERISTICAS HISTÓRICAS...... 36 5.1.1 TRATAMIENTO ESTADISTICO DE LOS DATOS ...... 36 5.2 APLICACIÓN DE LAS METODOS UTILIZADOS EN PREVIO ESTUDIO DE LA RED DE CALIDAD HÍDRICA DE BOGOTÁ ...... 37 5.2.1 ANÁLISIS PRELIMINAR ...... 38 5.2.2 APLICACIÓN DE LOS MÉTODOS ESTADÍSTICOS ...... 39 6. RESULTADOS Y ANÁLISIS DE RESULTADOS...... 41 6.1 RESULTADOS DEL ANÁLISIS DE VARIANZA (KRUSKAL – WALLIS) ...... 41 6.2 RESULTADOS DE LA PRUEBA PAIRWISE WILCOX...... 43

2

6.3 DIAGRAMA MATEMÁTICO CON COORDENADAS CARTESIANAS (SCATTERPLOT) ...... 46 6.4 ANÁLISIS JERÁRQUICO - DENDOGRAMA ...... 48 6.5 ANÁLISIS LINEAL DE DISCRIMINANTES ...... 52 6.6 ANÁLISIS GEOESTADÍSTICO ...... 55 6.7 RED NEURONAL ARTIFICIAL ...... 62 7. PROPUESTA DE MEJORA ...... 68 8. RECOMENDACIONES ...... 71 9. CONCLUSIONES ...... 72 BIBLIOGRAFÍA ...... 75

3

TABLA DE GRÁFICAS

Gráfica 1: Mapa de la ubicación del río Salitre en la ciudad de Bogotá...... 20 Gráfica 2: Mapa de la ubicación del río Torca en la ciudad de Bogotá...... 22 Gráfica 3: Esquema del principio de funcionamiento de la red neuronal artificial. 28 Gráfica 4: Red Neuronal Artificial propuesta la predicción de chl-a y SM en la reserva Beaver...... 32 Gráfica 5: Red Neuronal Artificial llevada a cabo con el método backpropagation algorithm para el río Tou-Chen...... 33 Gráfica 6: Boxplot del parámetro “oxígeno disuelto” vs año de medición para el río Torca...... 44 Gráfica 7: Boxplot del parámetro “DQO” vs observaciones para el río Salitre...... 45 Gráfica 8: Scatterplot matrix de pH y oxígeno disuelto vs estación para el río Torca ...... 46 Gráfica 9: Scatterplot matrix de Fósforo total, Coliformes fecales y Nitrógeno total vs estación para el río Salitre...... 47 Gráfica 10: Dendograma de los parámetros fisicoquímicos para el río Torca...... 49 Gráfica 11: Dendograma de los parámetros fisicoquímicos sin coliformes fecales para el río Torca...... 50 Gráfica 12: Dendograma de los parámetros fisicoquímicos para el río Salitre...... 49 Gráfica 13: Dendograma de los parámetros fisicoquímicos sin coliformes fecales para el río Salitre...... 50 Gráfica 14: Diagramas de los respectivos grupos del análisis discriminante para el río torca con respecto a las estaciones...... 52 Grafica 15: Diagramas de los respectivos grupos del análisis discriminante para el río salitre con respecto a las estaciones...... 53 Gráfica 16: Plot de mosaico para el parámetro sustancias activas al azul de metileno versus estación para el rio Torca ...... 53 Gráfica 17: Plot de mosaico para el parámetro sustancias activas al azul de metileno versus estación para el río Salitre ...... 55 Gráfica 18: Mapa de las concentraciones de oxígeno disuelto para el mes de febrero...... 56 Gráfica 19: Mapa de las concentraciones de pH para el mes de marzo...... 57 Gráfica 20: Red neuronal artificial de los parámetros fisicoquímico y biológicos versus la estación para el río Torca...... 63 Gráfica 21: Red neuronal artificial de los parámetros fisicoquímico y biológicos versus la estación para el río Salitre...... 65

4

RESUMEN

En la actualidad, la ciencia y la tecnología han avanzado de manera significativa, ofreciendo diversas herramientas por las cuales se pueden realizar análisis más profundos y más precisos para estudiar a detalle el recurso hídrico. En Bogotá, como en otras muchas ciudades con numerosos habitantes, hay una problemática que ha venido creciendo en los últimos años, la contaminación persistente de los cuerpos de agua que se encuentran bajo su jurisdicción. Sin embargo, como se ha dicho anteriormente, hay herramientas que permiten que el monitoreo constante de estos cuerpos hídricos faciliten el análisis del estado actual de los mismos, como lo es la red de calidad hídrica de Bogotá (RCHB), la cual es un sistema de puntos de muestreo a lo largo de los cuerpos hídricos de interés que recolecta información continuamente. Es así como el siguiente proyecto representa una propuesta de mejoramiento de la red de calidad hídrica de Bogotá para los ríos Torca y Salitre mediante la aplicación de una Red Neuronal Artificial, la cual, es un modelo de interconexión de nodos que permite establecer tareas que serán aprendidas automáticamente por la red, entrenándola para que desempeñe una actividad en específico y que esto dé paso a la mejora continua del mismo sistema. Este proyecto tiene como fin la aplicación de diversas metodologías estadísticas, para evaluar cuál es la diferencia de la aplicabilidad de los métodos (Análisis Lineal de Discriminantes, Análisis Jerárquico, Kriging y Red Neuronal Artificial) y la diferencia que existe en los resultados finales, pudiendo así determinar cuál ha generado la información con mayor grado de confiabilidad y cuál aporta más a la propuesta de mejoramiento que será generada en este proyecto. Palabras claves: Red de calidad hídrica, río Salitre, río Torca, Análisis Lineal de Discriminantes, Análisis jerárquico, Análisis Geoestadístico, Red Neuronal Artificial.

5

ABSTRACT

Nowadays, there are diverse tools which can be used to realize deep analysis, that are more accurate and makes easier to read results of all what is related with water resources. Bogotá (as in many others cities with huge populations) has a problematic that has been growing in the last years, the persistent contamination in water bodies which are under their jurisdiction. Nevertheless, as it has been said previously, there are tools that allow constantly monitoring of those water bodies, to get information in real time, like the water quality networks; in this case, the Bogotá’s water quality network, which is a system of monitoring points along the main rivers of the city (Salitre, Torca, Fucha and rivers) The main objective of this project is to create an improvement approach for the water quality network, focused to the two the rivers named previously (Salitre and Torca) through the application of an artificial neural network or connectionist system, that basically is a model of nodes interconnected, which allow to establish tasks that will be learned automatically by the network. The idea is to train the network to develop a specific action, which will improve the system by itself. By now, in this paper will be shown the results of some statistics tests applied to the data obtained from the water quality network (linear discriminant analysis, hierarchical analysis, Kriging) taking into account that before this project, some students have realized an analysis for Tunjuelito and Fucha rivers respectively. So now, the idea is to contrast the methodologies applied for those rivers and see what is the difference between the information obtained for every river and how the methods work for every water body. Likewise, it is important to determinate another factors that affects directly in the information like population dynamics, domestic water spills, industrial water spills, anthropic activities, among others). Keywords: Artificial Neural Network, Lineal Discriminant Analysis, Hierarchical Analysis, Geoestatistical Analyst, Salitre River, Torca River, Water Quality Network.

6

INTRODUCCION

La gestión de recursos hídricos debe realizarse de forma eficiente, eficaz y sostenible, especialmente en áreas en donde no es efectivo el sistema hídrico. Así, las técnicas de optimización constituyen una herramienta de gran utilidad en el proceso de toma de decisiones para la mejora de la recolección de información como lo es para la red hídrica del rio Bogotá [2]. El siguiente trabajo tiene como finalidad, generar una propuesta de optimización sobre la red de calidad de agua de Bogotá para los ríos Torca y Salitre, los cuales hacen parte de los cuatro ríos más importantes del sistema hídrico de la capital. Para el desarrollo del proyecto se usarán las bases de datos de las campañas realizadas por la secretaria de ambiente entre los años 2009-2013, las cuales contienen los datos de los parámetros establecidos en la resolución 5731 de 2008 (pH, oxígeno disuelto, DBO, DQO, coliformes fecales, sólidos suspendidos totales, grasas y aceites, nitrógeno total, fosforo total y sustancias activas al azul de metileno), la ubicación de las estaciones de cada río, y demás características que serán evaluadas para el desarrollo de la propuesta. A la hora de generar la idea de optimización, la información será tratada estadísticamente para depurar los datos y así continuar con la aplicación de las metodologías utilizadas en el proyecto de grado anterior a este (propuesta de optimización de la red de calidad hídrica de Bogotá (RCHB) para los ríos Fucha y Tunjuelo en la ciudad de Bogotá D.C), las cuales son análisis jerárquico, Kriging (análisis geoestadístico), y análisis lineal discriminante. La innovación de este proyecto es la implementación y diseño de una red neuronal artificial, la cual, permitirá generar un sistema de comando libre para aplicar una nueva clasificación de la información existente por medio de una instrucción de predicción, lo cual, permitirá contrastar todos los métodos ya aplicados con este, y así determinar cuál genera los resultados más acertados y con la mayor confiabilidad. La finalidad del trabajo es mejorar los puntos de toma de muestras, omitiendo si es necesario estaciones o agregando más puntos de muestreo, mejorando los tiempos de recolección de datos y determinando que metodología es la que mejor se adapta según los resultados.

7

1. PLANTEAMIENTO DEL PROBLEMA

Bogotá por sus características es la ciudad capital de la República de y se constituye en el principal centro geográfico, político, industrial, económico y cultural del país. El crecimiento demográfico y el rápido proceso de desarrollo económico de Bogotá, a una altura de 2.630 metros sobre el nivel del mar, y con un área de 1587 Kms², es sede del gobierno y la más extensa de las ciudades de Colombia. Aquí se concentra el 17% de la población total de la nación (7.980.001), con la característica de poseer los más altos índices educativos.

La ciudad cuenta con muchos procesos dinámicos que están en constante interacción con el medio ambiente y en consecuencia de esto, el saneamiento que se debe tener es constante, por eso es de gran importancia llevar a cabo una red dinámica con las obras de saneamiento y de las propuestas del distrito para sanar los ríos, y una de estas ideas es la optimización de la red de calidad hídrica de la ciudad [1]. Los ríos Torca y Salitre son dos cuerpos de agua que hacen parte del sistema hídrico de Bogotá, ambos presentan problemáticas ambientales, puesto que gracias a la intervención humana, la contaminación que en ellos reside es altamente significativa.

El río Torca con una longitud de 13.06 km comienza su recorrido desde el conjunto residencial Bosque de Pinos (carrera 6 con Calle 153) hasta su entrega al río Bogotá. Este río nace en los cerros orientales y desemboca al sistema humedal Torca-Guaymaral a altura de la , en cercanía a los terrenos del cementerio Jardines de Paz, y a su vez drena al norte en la cuenca media del río Bogotá. La cuenca del río Torca se conforma por tres subcuencas principales: El Cedro, San Cristóbal y Serrezuela, que se inician en los cerros orientales de la ciudad y cuyos canales se encuentran revestidos [2]

La principal fuente de contaminación de este río o más conocido como canal Torca son las aguas residuales que llegan a él por medio de escorrentía o descarga directa, además de tener vertimientos de tipo industrial gracias a las canteras que se encuentran en el noroccidente de Bogotá [3].

La cuenca del río Salitre se encuentra ubicada en el sector centro-norte del Distrito Capital, limita por el norte con la cuenca del río Torca y el humedal La Conejera, por el occidente con el río Bogotá y el humedal Jaboque, al oriente con los municipios de La Calera y Choachí, y por el sur con la cuenca del río Fucha [2]; este río recorre muchas más localidades que el río Fucha (Engativá, Santa Fe, , Usaquén, Suba, y ), por ende, por actividad antropológica de igual manera tiene una problemática ambiental marcada, el vertimiento de residuos, aguas residuales y residenciales a lo largo de su cauce [4].

8

Por ello, es necesario que exista un monitoreo constante de estos cuerpos de agua, y en general, de los diversos ríos de Bogotá, puesto que, se necesitan establecer controles para evitar que la situación actual de los mismos empeore a medida de que pasan los años y así mitigar los problemas ambientales ya existentes. Para esta situación, ya existe la red de calidad hídrica de Bogotá, en donde, entidades como la EAAB se encargan del constante monitoreo y seguimiento de los niveles de contaminación de estos ríos mediante la medición de variables de calidad de agua [5].

Las redes de monitoreo al ser sistemas estáticos, requieren cierta infraestructura especial para poder llevar a cabo el seguimiento a un cuerpo hídrico; esto implica, la inversión de estaciones de monitoreo y una central de recepción de datos en donde se lleva a cabo el tratamiento de información, acorde a la finalidad de la red de calidad hídrica. El principal problema es que con el tiempo, se genera una desactualización de los equipos empleados, lo que conlleva al aumento de errores a la hora de realizar un diagnóstico real de un cuerpo hídrico [6]

9

2. JUSTIFICACIÓN

Las redes de monitoreo son sistemas que tienen como objetivo verificar el estado actual de un cuerpo hídrico, teniendo en cuenta los agentes externos que pueden llegar a alternar el equilibrio de este ecosistema. A través de los años, las redes de monitoreo van perdiendo características de calidad (bien sea porque no se hace el respectivo mantenimiento a los equipos y sistemas o porque simplemente la tecnología usada comienza a ser obsoleta). Cuando una red de monitoreo tiende a minimizar la calidad de la información que provee, es necesaria una optimización de la misma, no solo por la calidad de los datos sino que gracias a esta acción de mejora, se generan beneficios económicos para la entidad que esté encargada del seguimiento de la misma [7].

La calidad del agua se ha convertido en los últimos años en un tema de interés global, debido a que el mundo se desarrolla exponencialmente conforme Avanza el tiempo y esto implica que los recursos naturales sean sobreexplotados, generando un deterioro en el medio ambiente a un ritmo considerable. Sin embargo, se tiene en cuenta que en este ritmo acelerado de desarrollo, la tecnología se ha vuelto un aliado fundamental a la hora de generar soluciones a diversas problemáticas socios ambientales. La red de calidad hídrica de Bogotá tiene el propósito de suministrar información en tiempo real de cómo están los cuerpos que conforman el sistema hidrográfico de la ciudad; sin embargo, conforme pasan los años, se debe generar una constante actualización de los métodos e instrumentos de medición, para no caer en imprecisiones a la hora de valorar los cuerpos de agua en cuestión. El río Salitre y el río Torca son estratégicos en la labor que realiza la red de calidad hídrica de Bogotá, ya que son ríos que se ven sumamente afectados por la contaminación directa e indirecta que ejerce la población de la ciudad; una optimización a la red de calidad hídrica trae consigo una serie de beneficios a las decisiones ambientales que se tomen con respecto a estos ríos, puesto que si mejora la calidad de la información que se obtiene de la constante medición de la red, se puede determinar el verdadero estado de los ríos, para así, evaluar el impacto e implementar medidas de corrección para mejorar el estado de estos cuerpos hídricos [8]. Por ello, este proyecto busca generar una solución a la posible problemática que se pueda presentar en la red de calidad hídrica de Bogotá, valorando las estaciones de medición de la red, y generando una propuesta de optimización para determinar cuáles son los puntos débiles de esta y así proveer nuevas alternativas para que se genere una constante mejora.

10

Se deben considerar las ventajas de realizar una propuesta de mejora para la red de calidad hídrica de Bogotá. Primero se cuenta con los beneficios económicos ya que se pueden utilizar métodos matemáticos que evitan la implementación de sistemas que demandan un alto costo y que tiene grados de confiabilidad similares a los de un sistema convencional, así mismo, el uso de software reemplaza la mano de obra y otros costos directos del proyecto generando viabilidad a la optimización que se genera después del estudio respecto a la RCHB [9]. Además de ello, los beneficios técnicos que representa el hecho de generar una propuesta de optimización, debido a que se determina la situación actual de la red y esta sería la base de futuras adecuaciones físicas y tecnológicas que pueda llevar a que la calidad de la red con respecto a la información que brinda sea más óptima [10]. Ambientalmente hablando, el beneficio sería propicio debido a que la calidad de la información respecto al estado actual de la contaminación que tienen los ríos Salitre y Fucha serán más acertados, pudiendo así establecer medidas de intervención para mitigar la polución actual de los mismos [11] Finalmente, la idea de este proyecto es demostrar el poder de emplear aquellas metodologías que han venido evolucionando a través del tiempo, que combinadas con tecnologías de medición crean sistemas óptimos y dan paso a nuevas técnicas con sensores e inteligencia artificial [12].

11

3. OBJETIVOS

3.1 OBJETIVO GENERAL

Comparar metodologías estadísticas para el análisis de la Red de Calidad hídrica de Bogotá en los ríos Torca y Salitre de la ciudad de Bogotá D.C 3.2 OBJETIVOS ESPECÍFICOS

 Implementar las metodologías del análisis jerárquico, IDW y Kriging (análisis geoestadístico) y análisis lineal de discriminantes a las variables medidas por la RCHB para los ríos Salitre y Torca  Utilizar la metodología de la red neuronal artificial sobre los datos de los ríos Torca y Salitre.  Diseñar la propuesta de mejoramiento a la red de calidad de agua de Bogotá en los ríos Torca y Salitre de acuerdo a las metodologías aplicadas.

12

4. MARCO TEÓRICO

4.1 CALIDAD DE AGUA

Uno de los objetivos de una red de calidad hídrica es determinar qué tan contaminado se encuentra un cuerpo de agua específico. La contaminación hídrica en Colombia se puede dar por actividades industriales, domésticas, agropecuarias, entre otras [13]. La contaminación hídrica puede darse de dos formas, por fuentes naturales o por fuentes artificiales. - Fuentes naturales: Cuando el cuerpo hídrico tiene contacto directo con diferentes superficies, estas pueden contener sales minerales que pueden disolverse en el agua [14]. - Fuentes artificiales: Son aquellas fuentes que son consecuencia de las actividades humanas; las sustancias o elementos que son producidos por el hombre son mucho más difíciles de eliminar cuando están en presencia en el agua debido a la complejidad de los compuestos que son vertidos [14].

El agua tiene capacidad de auto recuperarse cuando está presente todo tipo de contaminantes en la misma, pero las concentraciones en las que se encuentran esos elementos o sustancias es tan alta que para ello se necesitan tecnologías alternas para el proceso de recuperación. La contaminación hídrica puede determinarse por parámetros físicos, químicos y biológicos. En la siguiente tabla se enlistan los principales parámetros que se tienen en cuenta a la hora de determinar el estado de un cuerpo de agua [15]. Tabla 1: Parámetros clasificados por su naturaleza (física, química y biológica)

Parámetros para determinar la calidad del agua Físicos Químicos Biológicos Bacterias Color pH coliformes Virus Olor DBO Animales Sabor DQO Plantas Oxígeno disuelto Temperatura (OD) Sólidos nitrógeno Microorganismos suspendidos Espumas Fósforo Conductividad Aniones y cationes

13

Compuestos Radiactividad orgánicos Fuente: [15]. A la hora de analizar un cuerpo de agua, se debe tener en cuenta cuáles son las condiciones en las que se está dando la contaminación hídrica, para así, seleccionar los parámetros de calidad en los que se enfocará dicho análisis. Para ello, es importante resaltar los contaminantes principales que están en contacto con los cuerpos hídricos. - Aguas residuales: Las aguas residuales contienen basura, detergentes, residuos orgánicos, inorgánicos y biológicos como la excreta humana. Estos residuos traen consigo una serie de contaminantes fisicoquímicos y biológicos [16]. - Residuos industriales: Estas contienen una serie de sustancias químicas las cuales provienen de diversas actividades económicas, se pueden encontrar una serie de metales pesados, compuestos orgánicos e inorgánicos (ácidos, cianuros, cloruros, entre otros) [16]. - Residuos de agricultura: estos residuos traen consigo las restos de pesticidas, fungicidas, herbicidas, entre otros (en donde se resaltan los compuestos de fosforo y nitrógeno) [16]. - Contaminantes físicos: entre estos se encuentran los residuos radioactivos, los sedimentos, los residuos de la actividad petrolera, y las aguas de termoeléctricas y plantas nucleares, las cuales, alteran la temperatura del cuerpo hídrico receptor [16].

4.2 OPTIMIZACIÓN DE UNA RED DE CALIDAD HÍDRICA

A través de que avanza el tiempo, el ambiente y los agentes que lo afectan directamente son cada vez más pronunciados por lo que ha crecido una constante preocupación por controlar las consecuencias de las acciones antropogénicas; el problema radica en que los sistemas de monitoreo actuales están diseñados con un solo propósito, y no consideran problemas futuros que puedan llegarse a presentar [19]. Además de ello, se consideran los límites impuestos por presupuestos, la capacidad limitada de los análisis de laboratorio y los constantes cambios en los objetivos de los sistema de monitoreo. Por ello, es que es importante tener en cuenta que una red de calidad hídrica debe estar sujeta a constantes mejoras para siempre tener un escenario real de lo que pasa con el cuerpo de agua que se está midiendo [19].

14

Cuando se busca optimizar una red de calidad hídrica hay que tener en cuenta la relación costo y beneficio de la recolección y tratamiento de datos, para ello se tienen en cuenta factores como los costos de campo (mediciones realizadas en los puntos establecidos o estacones móviles), los costos de laboratorio (dependiendo del parámetro medido, varían los valores del análisis de laboratorio por insumos como reactivos especiales) y los costos de mantenimiento y tratamiento de información, caso específico para las estaciones fijas y las personas que manipula y analizan la información recibida [21]. Si se quiere obtener una reducción de costos, se debe ser radical a la hora de eliminar acciones y/o elementos específicos, por ejemplo, si se elimina una estación, se reducen los costos de mantenimiento y tratamiento estadístico más no los costos de laboratorio, pero si en cambio, se elimina un parámetro de la lista de los objetivos de calidad de agua, puede que reduzca el costo de análisis pero no el costo de monitoreo in situ. Esto conlleva a que el encargado de la optimización debe tener en cuenta que no siempre la reducción de costos será sustancial y que siempre hay que equilibrar la eficiencia de la optimización con respecto a la calidad de la información con la rebaja de precios del continuo uso de la red de calidad hídrica [21]. A continuación se muestra cuales son aquellos pasos que se recomienda llevar a cabo a la hora de considerar la optimización de un sistema existente de monitoreo de calidad hídrica [20].

Seleccionar los Tener claros los parámetros Análisis de la objetivos de fisicoquímicos y covertural espacial monitoreo. biológicos

Análisis de la Análisis relación frecuencia espacio-temporal (tempoalidad)

1. Objetivos de monitoreo: en este caso, la entidad de control de la red neuronal artificial es quién define los objetivos de calidad de agua según sus metas e intereses [20].

15

2. Parámetros fisicoquímicos: estos parámetros se encuentran establecidos en la normativa colombiana, y de acuerdo a los objetivos se seleccionan los adecuados [20]. 3. Análisis de cobertura espacial: métodos como el análisis jerárquico y métodos geoestadísticos son usados para determinar cómo es la distribución de las concentraciones de los parámetros a lo largo de los cuerpos de agua y así, determinar la importancia de los puntos de muestreo [20]. 4. Análisis de frecuencia: métodos como el análisis de tendencia son útiles para determinar cuáles serán aquellos periodos de tiempo en los que se realizarán las mediciones de acuerdo a las características de la zona [20]. 5. Análisis relación espacio temporal: finalmente, cuando ya se han realizados métodos que puedan analizar la importancia de los puntos de muestreo y los periodos de tiempo de medición, se relacionan todos en métodos integrales que puedan dar resultados más acertados, en este caso, un método muy eficaz es red neuronal artificial [20]. De acuerdo a los pasos que se enlistaron anteriormente, los siguientes métodos son algunos de los que pueden ser útiles para poder llevar a cabo una optimización (dependiendo de las características de la red de calidad hídrica, los métodos se adecuarán a las respectivas condiciones) [20].

Intervalo de Análisis de Herramientas confianza tendencia geoestadísiticas

Análisis de Análisis correlación y multivariado regresión

Fuente: Guidance Manual for Optimizing Water Quality Monitoring Program Design. 4.3 RED DE CALIDAD HÍDRICA

Una red de calidad hídrica es un sistema de puntos de monitoreo donde se determina la calidad y cantidad de los cuerpos de agua existentes en el área, la cual puede contar con puntos fijos que miden parámetros de campo y puntos móviles donde se hace el monitoreo a través de comisiones. En el caso de Bogotá, se constituye la red por un sistema mixto de las dos anteriores. La RCH permite obtener, procesar y divulgar información de calidad de los ríos monitoreados de

16 forma confiable, clara y oportuna, para evaluar el cumplimiento de estándares de calidad según la normatividad ambiental vigente. Asimismo, facilita generar información base produciendo un récord histórico que admite definir comportamientos y perfiles de calidad, constituyéndose en una herramienta fundamental para la toma de decisiones [17]. - Parámetros del diseño: Los métodos utilizados en el monitoreo desde la recolección de las muestras, la preservación, hasta el transporte de las mismas, fueron los establecidos por el método estándar AWWA, edición 20ª. Los parámetros a analizar son: Tabla 2: Parámetros seleccionados para la optimización por el método estándar AWWA.

# PARÁMETRO UNIDAD MÉTODO DE ANÁLISIS LÍMITE DE DETECCIÓN 1 Arsénico mg/l-As IC Plasma 3500 As-D 0,003 2 Amonio mg/l-N Destilación titulación 4500-NH3-c 0,3 3 Bario mg/l-Ba IC Plasma 3500 Ba-C 0,0002 4 Cadmio mg/l-Cd IC Plasma 3500 Cd-C 0,0002 5 Caudal l/s Área velociad-volumétrico 0,1 6 Cianuros mg/l-CN Destilación colorimétrico 4500-CN-C-E 0,001 7 Cobre mg/l-CU IC Plasma 3500 Cu-C 0,001 8 Coliformes totales NMP/100 ml Sustrado definido <1 9 Cromo hexavalente mg/l-Cr(+4) Colorimétrico 3500 Cr-C 0,025 10 Cromo total mg/l-Cr IC Plasma 3500 Cr-C 0,001 11 Demanda biológica de oxígeno mg/l-O2 Electrométrico 5210-B 2 12 Demanda química de oxígeno mg/l-O2 Titulométrico 5220-B 5 13 E. Coli NMP/100 ml Sustrado definido <1 14 Fenoles totales mg/l Destilación colorimétrico 5330-b 0,05 15 Fósforo toal mg/l-p Colorimétrico 4500-P-C y E 0,01 16 Grasas y aceites mg/l Partición gravimétrica-5520-B 10 17 Manganeso mg/l-Mn IC Plasma 3500 Mn-C 0,0002 18 Mercurio mg/l-Hg Absorción atómica 3500 Hg-B 0,00025 19 Niquel mg/l-Ni IC Plasma 3500 Ni-C 0,001 20 Nitrógeno total mg/l-N Volumétrico 4500 N-B 0,3 21 Oxígeno disuelto mg/l-O2 Titulométrico 4500 O-C 0,1 22 pH Unidades Electrométrico 0,1 23 Plomo mg/l-pb IC Plasma 3500 Pb-C 0,001 24 Sólidos suspendidos totales mg/l Gravimétrico 2540 D 1 25 Sólidos sedimentables mg/L-hora Volumétrico cono imnoff 0,5 26 Sulfuros mg/l-S Titulométrico 4500-S=C-F 0,1 27 Tensoactivos (SAAM) mg/l Colorimétrica 5540-C 0,025 28 Temperatura °C Electrométrico 0,1 29 Zinc mg/l-Zn IC Plasma 3500 Zn-C 0,00002 Fuente: Acreditación de pruebas y ensayos. Laboratorio de Aguas. Dirección Servicios Técnicos de la EAAB-ESP. Para optimizar la red hídrica de Bogotá para los ríos Torca y Salitre se deben establecer conceptos e información para poder entender la dinámica y su ejecución.

17

Se define optimización como acción y efecto de optimizar. Este verbo hace referencia a buscar la mejor manera de realizar una actividad. El término se utiliza mucho en el ámbito de la informática [18]. La optimización matemática está constituida por un conjunto de resultados y métodos analíticos y numéricos enfocados a encontrar e identificar al mejor candidato entre una colección de alternativas, sin tener que enumerar y evaluar explícitamente todas esas alternativas. Un problema de optimización es, en general, un problema de decisión [19]. Antes de establecer una red de calidad hídrica, se deben tener en cuenta dos factores importantes, el primero es la definición del objetivo de la red de monitoreo, y segundo las características del río al que se implementará dicha red, es decir, se deben tener en cuenta variables tan básicas como la evapotranspiración, la precipitación, la pendiente, la forma, las dimensiones, la velocidad y el caudal del flujo [20]. Después de ello, se tiene en cuenta cuáles son las especificaciones esenciales del funcionamiento de una red de monitoreo, las cuales se enlistan a continuación [21]: 1. Componentes de la garantía de calidad: se tienen en cuenta cosas como las normas de calidad, la capacitación de trabajadores, la facilidad de operación de los equipos, los procedimientos de operación, entre otros [21]. 2. Facilidad de laboratorios: cómo se realizarán los procedimientos de análisis de información [21]. 3. Calibración, mantenimiento y control de los equipos: esto implica los costos, la mano de obra, y el seguimiento e inspección que se le deben hacer a los equipos de monitoreo [21]. 4. Control del análisis cualitativo: Se deben establecer los controles internos y externos de calidad, con respecto a la información generada en todo el proceso de obtención de datos. Es importante que este control se aplique a toda la red de monitoreo, integralmente hablando, involucrando los equipos, al personal a cargo, a los análisis de laboratorio, entre otros [21]. 5. Garantía de calidad de la información: Se basa en establecer protocolos de obtención de datos, como ejemplo, se recomienda que a la hora de muestrear, no se conforme con una única vez de muestreo, sino que se realice una o dos veces más para corroborar la información. Lo ideal es que se plantee el paso a paso de cómo se hará el análisis de la información, esto, asegurando que el margen de error de la información oficial de la calidad de agua del cuerpo en cuestión sea mínimo [21].

A la hora de diseñar una red de calidad hídrica, también se debe establecer inicialmente la frecuencia de monitoreo, los puntos de muestreo, los métodos que serán usados para el muestreo y las variables a tener en cuenta, esto con el fin de que la red genera la información que se requiere.

18

- Selección de las variables: Las variables dependerán de las fuentes de contaminación del cuerpo de agua y el uso del agua que tiene actualmente (industrial, agropecuario, doméstico, recreacional, entre otros) [22]. - Selección de puntos de muestreo: Así como las variables de interés dependerán del uso que se le da a la información que se obtiene en el monitoreo, de igual manera la ubicación de las estaciones dependerá de qué objetivo tenga la red de monitoreo, es decir, si se quiere conocer las concentraciones de contaminantes en puntos fijos como vertimientos (domésticos o industriales) o si se quiere conocer el comportamiento general de un cuerpo hídrico con respecto a los nutrientes que recibe a lo largo de su cuenca [23]. - Frecuencia de monitoreo: Para determinar cuáles serán los lapsos se debe tener en cuenta el objetivo de la red de monitoreo, así como las variables que se han establecido en primeras instancias, ya que no todas las variables necesitan ser monitoreadas en los mismos períodos, además de que un monitoreo innecesario podría incurrir en costos [24].

La red de calidad hídrica de Bogotá permite el constante monitoreo de los 4 ríos principales de Bogotá: Tunjuelito, Fucha, Salitre y Torca; esta tiene en total 28 puntos de monitoreo, distribuidos estratégicamente sobre los cuerpos de agua en cuestión, y por medio de estos, evalúa parámetros fisicoquímicos y biológicos del agua para así, generar un consolidado del estado actual de la calidad del agua de los ríos estudiados. Bogotá tiene en su jurisdicción ríos y quebradas que están en constante interacción con la población de la capital. Para este estudio, como se ha venido mencionando, se tomarán en cuenta los ríos Salitre y Torca [25]. Los criterios para el diseño de una red de calidad son:

- La localización de la estación de muestreo: es un factor clave que puede determinar la validez de la información que se pretende inferir, a través del análisis de las muestras colectadas en la misma. Haciendo referencia a la representatividad de las fases y/o matrices que se extraen de un tramo del río, efluente o sedimento y que sirven para definir las condiciones de calidad media del mismo, prevalecientes en el ámbito espacial y/o temporal que pretende identificar el estudio y objetivos de las tareas que se realizan en dicha cuenca. [26] - Pueden definirse tres niveles en el proceso de selección de las estaciones de monitoreo y puntos de toma, una primera aproximación mediante la macro locación o tramos del río que son representativos del nivel de calidad de toda la cuenca, la micro locación que implica la ubicación dentro del tramo precedente de la estación de muestreo y la selección final del punto o de los puntos de toma de muestras, que van a dar un valor representativo del área de monitoreo. [26] - El diseño establecido permite realizar el seguimiento en un punto compuesto por dos días intercalados, logrando así monitorear un punto compuesto 2

19

veces en un mismo día para obtener al final del diseño 20 datos por punto repitiendo la metodología planteada [5].

4.4 RÍO SALITRE

Gráfica 1: Mapa de la ubicación del río Salitre en la ciudad de Bogotá.

20

Fuente: Autores. El río Salitre nace en los cerros orientales con el nombre de quebrada Arzobispo, el cual es canalizado desde el parque nacional y tiene un papel importante como límite natural entre las localidades de Engativá y Suba, en donde cambia su nombre a Juan Amarillo, haciendo honor al humedal con el mismo nombre. Este río tiene una longitud total de 21,56 kilómetros desde su nacimiento en los cerros hasta su desembocadura en el río Bogotá, en la instancia de la planta de tratamientos de aguas residuales El Salitre [27]. El Salitre tiene un área de drenaje de 13.964 hectáreas, localizada en el sector centro - norte del Distrito Capital, su pendiente media del cauce es de 3,32% y su altura promedio es de 2870 m.s.n.m, donde la cota máxima está por el orden de los 3200 metros presentando corrientes naturales de agua de alta pendiente sobre los Cerros Orientales; un sector medio que es plano y comprende gran parte del sistema pluvial de la ciudad donde se han canalizado, entubado y rectificado los cursos naturales y un sector bajo donde se encuentran cuerpos amortiguadores naturales que entregan al río Bogotá y han sido reducidos en su capacidad por acción antrópica y la cota mínima está sobre los 2540 metros (el perímetro urbano va aproximadamente hasta los 2700 m.s.n.m) [28]. El rio salitre en los últimos años ha sido represado como medida preventiva para evitar mayor afluencia del agua, por la carga de contaminantes que son vertidos en sus aguas; el recorrido que hace el contaminante es: entre la carrera séptima y la circunvalar se empiezan a ver los problemas que afectan al río, pues algunos vertimientos empiezan a deteriorar sus cristalinas aguas, así mismo se realizan vertimientos directos de los baños del parque nacional, por la falta de adecuación de la zona, Como se ha mencionado el rio se divide en cuatro tramos, en el segundo tramo el rio esta canalizado en su totalidad, en este tramo se presentan problemas de indigencia, quienes dejan sus residuos en el canal, otro punto de vertimiento de aguas residuales es la carrera 24 con calle 45 al frente del estadio el campin y por la mitad de la carrera 30, aquí el rio aumenta su tamaño pero reduce su velocidad lo que provoca la acumulación de basuras y sedimentación en sus aguas, en este segmento también existen varios puntos de vertimientos de aguas domesticas donde solo drenan las aguas pluviales al canal pues las negras se dirigen al rio Fucha, los sectores críticos del rio son entre los ríos y la calle 80 pues las bajas pendientes del salitre ocasionan que la velocidad se disminuya trágicamente, generando problemas de sedimentación y de descomposición orgánica por este motivo se presentan olores fuertes en esta zona, a las alturas de la Avenida 68 el rio recibe las aguas de los canales rio negro y rio nuevo que trasportan las aguas del norte y parte de metrópolis, disminuyendo más la velocidad del rio debido a su carga contaminante; el río desemboca sus aguas cerca de la PTAR donde existen vertederos ilegales y es este punto es donde el rio recoge la mayoría de carga contaminada vertida entregando sus aguas tratadas al rio Bogotá . [29]

21

4.5 RÍO TORCA

Gráfica 2: Mapa de la ubicación del río Torca en la ciudad de Bogotá.

Fuente: Autores.

22

El Canal de Torca tiene una longitud de 4.24 kilómetros, que comienza desde el canal Serrezuela y termina su recorrido en el humedal Torca- Guaymaral. La cuenca cuenta con un sistema de alcantarillado, el cual a su vez está dividido por el sistema de saneamiento y el sistema de aguas lluvias. El sistema sanitario es el que se encarga de recoger todas las aguas residuales y las dirige a la planta de tratamiento de aguas residuales El Salitre, mientras que el sistema de aguas lluvias, dirige el agua recogida hasta el humedal torca, que posteriormente llegará a la cuenca media del río Bogotá [3]. Como se mencionó en el planteamiento del problema, la cuenca del río Torca se compone de 3 subcuencas (El cedro, San Cristóbal y Serrezuela) y de esta se desprenden las siguientes quebradas [30] [31].

QUEBRADAS CUENCA TORCA Quebradas Bosque Pino y El Cedro Quebradas Arauquita y San Cristóbal. Quebrada Soratama Quebrada Aguas Calientes Quebrada Patiño Quebrada San Juan Quebrada Floresta Quebrada El Novita Fuente: [31]. El humedal torca-Guaymaral se encuentra una altura de 2550 m.s.n.m, el cual es caracterizado por estar en un piso bioclimático altitudinal subandino o andino bajo, a continuación se enlista la información aportada por la estación meteorológica de Guaymaral [31].

HUMEDAL TORCA Característica Dato Temperatura 13,1*C 1305 Brillo solar horas/año Precipitación 773mm Humedad 74% Evaporación 947mm Radiación 342 cal/cm2 solar Fuente: [31].

23

El humedal de Torca-Guaymaral ha sufrido daños en su estructura ecológica debido a infraestructura vial y demás construcciones, y así mismo, el canal de Torca posee una serie de fuentes que contaminan sus aguas a lo largo de su recorrido, hasta finalmente desembocar en el río Bogotá. Las fuentes de contaminación son [2]. 1. Aguas residuales domésticas por vertimientos realizados directamente por la red de alcantarillado público (este problema se evidencia en el primer tramo) [2]. 2. Cargas orgánicas, sólidos suspendidos totales y coliformes fecales que provienen de los afluentes al canal (quebradas) así como el sistema de agua lluvias aporta a estos contaminantes [2]. 3. Vertimientos directos domésticos e industriales (segundo tramo del río, puesto que no se cuenta con sistema de alcantarillado) [2].

4.6 MÉTODOS ESTADÍSTICOS

Por el crecimiento exponencial de las actividades económicas globales y el desarrollo tecnológico, es importante que si se tienen medidas de seguimiento y control (como las redes de calidad hídrica), estas tengan una constante actualización y mantenimiento, para que de esta forma, sea posible tener información más acertada sobre el estado de los cuerpos de agua que se estén estudiando. Por ello, es importante saber que el cambio de tecnologías y optimizaciones de las redes de monitoreo tienen un costo significativo, y que esto repercute en si se decide realizar estos cambios o no. De esta manera, es que muchos programas informáticos permiten determinar cuáles son las mejoras que se pueden realizar a una red existente, y poder generar una optimización que no incurra en costos exagerados o cambios poco rentables.

4.6.1 ANÁLISIS JERÁRQUICO

Es un método estadístico de aprendizaje no supervisado usado para agrupar elementos que compartan similitudes [32]. Está diseñado para resolver problemas complejos con criterios múltiples. El proceso requiere que quien toma las decisiones proporcione evaluaciones subjetivas respecto a la importancia relativa de cada uno de los criterios y que, después, especifique su preferencia con respecto a cada una de las alternativas de decisión y para cada criterio. El resultado es una jerarquización con prioridades que muestran la preferencia global para cada una de las alternativas de decisión. El análisis proporciona la posibilidad de incluir datos

24 cuantitativos relativos a las alternativas de decisión; la ventaja es que adicionalmente permite incorporar aspectos cualitativos que suelen quedarse fuera del análisis debido a su complejidad para ser medidos, pero que pueden ser relevantes en algún caso [33]. La construcción de un modelo jerárquico, permite de una manera eficiente y grafica organizar la información respecto de un problema, descomponerla y analizar por partes, visualizar los efectos de cambios en los niveles y sintetizar información [33]. Una herramienta que es muy útil para poder sacarle provecho al análisis clúster es el dendograma, la cual, permite visualizar de una manera más gráfica la agrupación de información en clústeres [34].

Algunas de sus ventajas son: presenta un sustento matemático, permite desglosar y analizar un problema por partes, permite medir criterios cuantitativos y cualitativos mediante una escala común, incluye la participación de diferentes personas o grupos de interés para generar un consenso, es de fácil uso y permite que su solución se pueda completar con métodos matemáticos de optimización. [33]. Así mismo, existen técnicas que se basan más en el reconocimiento visual que en el procesamiento matemático puro.

4.6.2 GEOESTADÍSTICA IDW Y KRIGING)

La geoestadística es una rama de la estadística que permite estudiar, analizar y estimar fenómenos espaciales o temporales por medio de técnicas que permiten predecir valores implícitamente por información existente [35]. Su interés primordial es la predicción y simulación de dichos fenómenos Esta herramienta ofrece una manera de describir la continuidad espacial, que es un rasgo distintivo esencial de muchos fenómenos naturales, y proporciona adaptaciones de las técnicas clásicas de regresión para tomar ventajas de esta continuidad que se define como una aplicación de la teoría de probabilidades a la estimación estadística de variables espaciales. Cuando el objetivo es hacer predicción, la geoestadística opera básicamente en dos etapas, la primera es el análisis estructural, en la cual se describe la correlación entre puntos en el espacio, en la segunda fase se hace predicción en sitios de la región no muestreados por medio de la técnica Kriging [36].

El método Kriging es una interpolación óptima basada en una regresión realizada a los valores observados, los cuales están rodeados de información (puntos de información o “data points”) [37]. Este método tiene en cuenta la distancia y el grado de variación entre los puntos conocidos y los puntos en áreas desconocidas. Esta técnica tiene la ventaja de minimizar el error de la varianza de la información, teniendo un promedio de cero en los errores de predicción, esto debido a que no se realizan sobreestimaciones. En otras palabras, El Kriging es un método de

25 estimación el cual busca generar una estimación lineal de los valores de los puntos con información [38].

Matemáticamente, el método tiene la siguiente fórmula

En donde,

Z (si)= Es el valor que se tiene en un punto específico.

Λi: Es la ponderación (dada en la interpolación) y desconocida al ejecutar el método para un punto específico i.

So= La ubicación de la predicción.

N= el número de puntos medidos.

Esta interpolación es parecida al IDW (Inverse Distant Weighting) en algunos aspectos; el IDW estima el valor de cada cuadrícula o “grid” usando puntos de muestreo dentro de un radio específico, es decir que, los puntos que se encuentren más cerca tendrán mayor influencia sobre la interpolación que aquellos que se encuentren más lejos, por ello, es que el método Kriging es más preciso, ya que esta interpolación usa diferentes funciones de peso dependiendo de la distancia y la orientación de los puntos de muestreo con respecto al punto de referencia y la manera en que la información está clasificada en clústeres [39].

La interpolación -Inverse Distant Weighting, IDW tiene como fórmula general:

Donde es el valor estimado para el punto j ; n es el número de puntos usados en la interpolación; zi el valor en el punto i-ésimo y kij el peso asociado al dato i en el cálculo del nodo j. Los pesos k varían entre 0 y 1 para cada dato y la suma total de ellos es la unidad. Para establecer una función de proporcionalidad entre el peso y la distancia, la fórmula general queda como sigue: [40]

26

Donde 1 es un exponente de ponderación que controla la forma en la que el peso 푑푖푗퐵 disminuye con la distancia Esta familia de métodos permite la generación del MDE (modelo Digital de elevación), de una forma rápida y simple. Sin embargo, se trata esencialmente de una media ponderada y el resultado se encuentra siempre incluido dentro del rango de variación de los datos. Por este motivo, el correcto tratamiento de las formas cóncavas y convexas depende estrechamente de la distribución de los puntos originales y la presencia de datos auxiliares se hace muy conveniente. [40]

Los métodos mencionados anteriormente fueron utilizados primeramente por las estudiantes Lina Soto Cortes Y Angie Díaz león (propuesta de optimización de la red de calidad hídrica de Bogotá (RCHB) para los ríos Fucha y Tunjuelo en la ciudad de Bogotá D.C), para la optimización de la red hídrica de Bogotá en los ríos Fucha y Tunjuelo; se quiere en el presente trabajo realizar una verificación de las mismas para los ríos Torca y Salitre con el fin de comprobarlas y determinar cuál es la que más se asemeja al comportamiento de los datos de la RCHB para los cuerpos de agua ya mencionados.

4.6.3 ANÁLISIS DISCRIMINANTE

El análisis discriminante es una técnica estadística multivariante cuya finalidad es analizar si existen diferencias significativas entre grupos de objetos respecto a un conjunto de variables medidas sobre los mismos para, en el caso de que existan, explicar en qué sentido se dan y facilitar procedimientos de clasificación sistemática de nuevas observaciones de origen desconocido en uno de los grupos analizados [41]. Cuando se dispone de un cierto número de variables es el análisis discriminante, que permite resolver incógnitas sobre el verdadero comportamiento de los datos con respecto a categorías que el observador plantea. El método también se enfoca en la determinación de unas funciones de las variables originales, que permite decidir en qué clase debe estar cada elemento; utilizando como criterio de asignación la proximidad de cada elemento a las distintas clases o grupos existentes [42].

27

La construcción de las funciones discriminantes (combinaciones lineales de las variables originales) se realiza buscando aquellas que hacen máxima la separación entre grupos, lo que equivale a maximizar la variable entre grupos. [43]. La asignación de los elementos a clases se realiza mediante el criterio de Bayes: cada elemento se asigna a una clase para la que es mayor la probabilidad de pertenencia condicionada por los valores que toman las funciones discriminantes [44]

- Modelo matemático: Partiendo de “q” grupos donde se asignan a una serie de objetos y de “p” variables medidas sobre ellos (x, x1… xn), se trata de obtener para cada objeto una serie de puntuaciones que indican el grupo al que pertenecen (y, y1…yn), de modo que sean funciones lineales de (x, x1… xn) [41].

Tales que discriminen o separen lo máximo posible a los “q” grupos. Estas combinaciones lineales de las “p” variables deben maximizar la varianza entre los grupos y minimizar la varianza dentro de los grupos [41].

4.6.4 RED NEURONAL ARTIFICIAL

La red neuronal artificial es un método inspirado en las redes neuronales biológicas, en donde su funcionamiento se basa en la existencia de nodos (elementos simples de procesamiento) que están organizados en capas. Estos nodos están interconectados entre sí, creado enlaces de comunicación. Este sistema se basa en el aprendizaje por experiencia, es decir, aprender a desarrollar o llevar cabo acciones por medio de tareas programadas [45].

Gráfica 3: Esquema del principio de funcionamiento de la red neuronal artificial.

28

Fuente: [45].

Por lo tanto, el método de la red neuronal artificial se caracteriza por lo siguiente [46]: - Posee unidades de procesamiento que intercambian información por intercomunicación entre sí [46]. - Se utilizan para reconocer patrones [46]. - Con el tiempo, tiene la posibilidad de aprender y mejorar su procesamiento [46].

Una de las consideraciones que se deben tener en cuenta es si el sistema debe tener supervisión de un tercero o no, es decir, si es supervisado se referirá a si el observador o encargado del sistema tiene información sobre las salida de las acciones llevadas a cabo en la red neuronal para una serie de entradas que él mismo dará; si es no supervisado es porque las salidas no tienen una relación directa con las entradas del sistema [47].

Las redes neuronales pueden llegar a tener diez mil nodos o dendritas así como pueden tener tan solo 10, depende de que tan complejo sea el sistema y cuál sea el objetivo del creador de la misma. Así mismo, las redes pueden tener solo una capa de intercomunicación entre nodos y una capa de salida (que es la red neuronal más simple), pero las capas las define el usuario a razón de la complejidad de interacción entre nodos [47].

Las redes neuronales artificiales son métodos universales de solución de problemas, dependerá del algoritmo usado, el objetivo de la misma, la información de entrada, la programación de las capas ocultas o caja negra, entre otras características. A continuación se enlistan las ventajas y desventajas que tiene este método a la hora de aplicarlo.

29

Tabla 3: Ventajas y desventajas de la implementación de una red neuronal artificial.

VENTAJAS DESVENTAJAS Necesita una serie de entrenamientos Es un método que puede ser usado para sucesivos, lo que dificulta el proceso de predicciones a corto plazo y estimaciones. obtención de información. Una de las características de la RNA es Para que el funcionamiento de una RNA sea que puede establecer relaciones no óptimo, la información que se ingrese al lineales en el análisis de series de tiempo sistema debe ser confiable y de calidad No existe una metodología universal para Una RNA puede lidiar bien con la falta de calibrar, validar y entrenar una RNA, lo que información o información perdida. dificulta su aplicación, pues dependerá del objetivo de la misma. La RNA puede aprender a manejar muy Tiene pocas habilidades de generalización buen un conjunto de datos de entrada y de información generar respuestas efectivas. Fuente: [51].

4.5.4.1 Casos de estudio: uso de redes neuronales artificiales en modelamiento de calidad de agua

Como en todo proceso que lleve a cabo procesos matemáticos, es necesario determinar qué tan correcta es la predicción hecha por un modelo, para ello, existen criterios estadísticos que permiten determinar esta eficacia a la hora de predecir información. Uno de los más usados es el error cuadrático medio, el coeficiente de correlación y el coeficiente de determinación; esto se realizó en un estudio en el río Yamuna en india [48].

Los nodos o también llamados “pesos”, se someterán a un proceso de aprendizaje, en donde la estructura estará sujeta a constantes cambios (dependiendo de la información de entrada). La cantidad de nodos facilitará o dificultará el aprendizaje, es decir, si en la capa escondida o caja negra se encuentran pocos nodos, esto hará que los grados de libertad para aprender el proceso no sean suficientes [48].

30

Fuente: [48].

Así entonces, se lleva a cabo la calibración y validación del modelo, teniendo en cuenta que previamente es necesario hacer un tratamiento estadístico de los datos para homogeneizar la información. El objetivo del estudio es la simulación del comportamiento del oxígeno disuelto (OD) en el río; se tiene 72 patrones, de los cuales 48 serán para calibrar el sistema y 24 para validar el funcionamiento del mismo [48].

Se estipularon 3 casos hipotéticos para crear las interacciones, teniendo en cuenta que se tienen 2 estaciones (aguas arriba y aguas abajo), de esta manera se estableció [48].

1. Toda la información de las estaciones aguas arriba y aguas abajo excepto la información de oxígeno disuelto (aguas arriba). 2. Toda la información de las estaciones aguas arriba y aguas abajo excepto la información de oxígeno disuelto (aguas abajo). 3. Toda la información de las estaciones aguas arriba y aguas abajo.

Para este estudio se utilizó el algoritmo de programación hacia atrás o “error back propagation algorithm” [48].

En la reserva Beaver, en Arkansas, se utilizó la red neuronal artificial para predecir los valores de concentración de chlorophyll-a (chl-a) y material suspendido en el

31 lago, teniendo en cuenta que al ser parámetros físicos, estos se podían obtener de dos fuentes, la primera de imágenes Landsat obtenidas de los años 2001, 2002, 2003 y 2004, así como una serie de muestreos que realizaron los investigadores [49].

Tal como en el anterior caso de estudio, se usó el error cuadrático medio, el coeficiente de determinación y el coeficiente de correlación para calcular la veracidad del modelo a la hora de predecir los valores de chl-a y sólidos suspendidos. El número de bandas espectrales determinan el número de nodos (6) de la capa de entrada, con 5 nodos en la capa oculta o caja negra, y una tercera capa en donde se establece un nodo de salida (información de chl-a y sólidos suspendidos) [49].

Gráfica 4: Red Neuronal Artificial propuesta la predicción de chl-a y SM en la reserva Beaver.

Fuente: [49]. En China, para el río Hanjiang se usó la red neuronal artificial para determinar cuál era el comportamiento de los contaminantes en un número específico de días (Kth) teniendo en cuenta la legislación que estipula los límites permisibles de contaminantes en los sistemas hídricos, así como los puntos en donde se dan vertimientos por actividades industriales (Ws). La red se activa o genera un mensaje de advertencia cuando en la capa de salidas hay presencia de información de uno o más contaminantes, teniendo en cuenta que esto se sale del comportamiento “normal” estipulado en la capa de entrada y en las instrucciones dadas al modelo [50].

32

En Tainan, se realizó la construcción de un algoritmo multiobjetivo para para optimizar el manejo y control de la calidad de agua del río Tou-Chen ya que este presentaba diversos problemas de contaminación continua. En este caso de estudio se usó el método “backpropagation algorithm”, que sirve para calcular el error contribuido por cada una de las neuronas después de que una base de datos es procesada [52].

Gráfica 5: Red Neuronal Artificial llevada a cabo con el método backpropagation algorithm para el río Tou-Chen.

Fuente: [52].

Se seleccionó una muestra de entrenamiento y una muestra de testeo de la base de datos original, en donde se llevaron a cabo 50 repeticiones hasta que el error cuadrático medio fue menor a 0,1. El objetivo de la aplicación de la red neuronal fue la de determinar los puntos débiles de la calidad del agua de un río y que un controlador tuviera el poder de decisión sobre las instrucciones dadas al algoritmo y que fuera flexible a los diferentes escenarios de la cuenca del río Tou-Chen [52].

33

El último estudio citado en esta sección se desarrolla en Heilongjiang en el noreste de China, el rio mide 1890 km de largo de la parte alta y media del río, el método que es un modelo matemático en primer lugar utiliza los pocos datos disponibles del cuerpo hídrico donde se usó una red de monitoreo de calidad para calibrar el modelo expuesto, Este modelo se aplica posteriormente para extender el conjunto de datos y proporcionar información sobre las cuencas fluviales que no son experimentales controlados. En segundo lugar, utiliza un análisis de los conjuntos de datos experimentales y numéricamente extendidos con el fin de dividir toda la longitud del río en tramos homogéneos con respecto a la calidad del agua, lo cual gracias al a metodología optima se estimó los puntos donde debe ser instalada cada estación de monitoreo en cada tramo del rio, el cual consta de 15 estaciones de medición existentes. En este río, la DQO y el fueron identificados como los dos parámetros más relevantes con respecto a la calidad del agua. Para cada sección transversal del río en la que se dispone de datos numéricos, se representan los parámetros de calidad del agua como:

donde el índice iyj representan la sección transversal y los Parámetro de calidad considerados respectivamente, y a, b, c representan el valor más bajo, más alto, respectivamente, de la Calidad del agua en todo el alcance del río Ka Kb se puede interpretar como las desviaciones normalizadas de la calidad de agua de sus valores medios. Obviamente, los parámetros Ka y Kb son equivalentes cuando sólo se considera un parámetro de calidad del agua. Este no es el caso cuando los valores compuestos de Ka y Kb se consideran como múltiples parámetros de calidad del agua

34

El numerador 1/2 (aj þ bj) en la ecuación representa el promedio de los valores más bajos y más altos del agua, j el parámetro de calidad en el río, El parámetro Sjk en el denominador representa el valor umbral de la clase k para el agua el parámetro de calidad j en la norma nacional de calidad del agua (GB3838-2002), que tiene cinco clases (kmax ¼ 5). Si es mayor s la contaminación del parámetro de calidad del agua j, Mayor su correspondiente factor de peso Pj. La ecuación normaliza factores de peso para los diferentes parámetros de calidad del agua donde su suma es igual a 1.

35

5. METODOLOGIA

Este proyecto tendrá varias etapas establecidas, las cuales, son importantes para su desarrollo y ejecución. A continuación serán explicadas.

5.1 ESTADO ACTUAL DE LA RED Y SUS CARACTERISTICAS HISTÓRICAS.

Para determinar cómo se encuentra la red de calidad hídrica de los ríos Torca y salitre, se realizó una recopilación y revisión bibliográfica, donde principalmente se tuvo como referencia:

- Los valores registrados durante las cuatro campañas de monitoreo de la red de calidad hídrica entre los años 2009-2013. - El trabajo de grado de las estudiantes Lina Soto cortes y Angie Díaz León (propuesta de optimización de la red de calidad hídrica de Bogotá (RCHB) para los ríos Fucha y Tunjuelo en la ciudad de Bogotá D.C.), el cual sirve de base para la comprobación de las metodologías establecidas. - El Decreto 5731 de 2008, el cual establece los parámetros fisicoquímicos evaluados en la calidad hídrica del río Bogotá. - Bases de datos existentes, artículos, informes y demás bibliografía que ayude a determinar su estado para poder optimizarlo.

5.1.1 TRATAMIENTO ESTADISTICO DE LOS DATOS

Por parte de la red de calidad hídrica de Bogotá, se tienen series de datos de calidad de agua establecidos para los ríos Salitre y Torca (de igual manera se tienen para los ríos Fucha y Tunjuelo); la primera parte de este proyecto se basó en el tratamiento de las bases de datos, las cuales, se depuraron para tener información más confiable. Para ello se realizaron los siguientes pasos

1. De las bases globales de información, se seleccionaron las estaciones que correspondían a los ríos Salitre y Torca respectivamente (ya que las bases contienen la información de todas las estaciones de la red de calidad hídrica de Bogotá). Después de ello, se buscó ordenar los datos de forma ascendente y temporal.

2. Después de tener en cuenta los parámetros establecidos en la normativa de (Decreto 5731 de 2008) se extrajeron de la base de datos original solamente

36

las columnas correspondientes a los 10 parámetros que se tienen en cuenta en los objetivos de calidad de agua de la ciudad (pH, oxígeno disuelto, demanda biológica de oxígeno, demanda química de oxígeno, sólidos suspendidos disueltos, grasas y aceites, coliformes fecales, nitrógeno total, fósforo total y sustancias activas al azul de metileno). Para el río Torca solo se utilizaron datos desde el año 2010 ya que en el año 2009, se tenían establecidos otros puntos de monitoreo, que cambiaron en el año siguiente; en el caso del rio Salitre se utilizaron todas las campañas entre 2009-2013 exceptuando la estación PTAR ya que solo tenía información para la campaña 2009-2010.

3. Después de extraer la información necesaria para el estudio de las bases de datos originales, se identificaron los valores atípicos (2% del total de datos para ambos ríos) aquellos que se encontraban por encima de los límites superior e inferior. Los datos atípicos fueron eliminados de los parámetros pH y oxígeno disuelto, ya que fueron los únicos que presentaban mayor número de registro, y por ende, mayor variabilidad.

5.2 APLICACIÓN DE LAS METODOS UTILIZADOS EN PREVIO ESTUDIO DE LA RED DE CALIDAD HÍDRICA DE BOGOTÁ

Se aplicaron los métodos del trabajo de grado “Propuesta de optimización de la red de calidad hídrica de Bogotá (RCHB) para los ríos Fucha y Tunjuelo en la ciudad de Bogotá D.C” (especificados en el marco teórico) y posterior a ello, se aplicó un nuevo método para poder completar el análisis realizado a las bases de datos de la RCHB, y así, determinar cuál es el que arroja la información más completa y verídica. Las bases de datos, tienen la siguiente información: ESTACIÓNID, observaciones, mes, día, año, hora inicial, hora final y las mediciones para los respectivos parámetros. A continuación se explican los campos ESTACIONID y observaciones, los cuales, cuentan con subcategorías especiales.

Tabla 4: Descripción de las variables ESTACIÓNID y observaciones, pertenecientes a la base de datos de la RCHB

ESTACIONID OBSERVACIONES Las estaciones con las Para este campo se tienen las que cuenta este río son: siguientes categorías: RÍO - Bosque de pinos, Calle TORCA 161, Jardines de paz y - N/A: Hace referencia a la falta San Simón de información del día de

37

Las estaciones con las medición. que cuenta este río son: - Soleado. RÍO Carrefour - AV 68, TV91, - Nublado. SALITRE Alameda, Río Arzobispo, - Lluvia Parque Nacional y Calle 53

Fuente: autores 5.2.1 ANÁLISIS PRELIMINAR

Para el análisis preliminar, se utilizaron el test de Kruskal Wallis y la prueba de Pairwise Wilcox. Donde la prueba de Kruskal-Wallis es un método no paramétrico para probar si un grupo de datos proviene de la misma población y el test de Wilcox para comparar dos muestras están relacionadas El test de Kruskal Wallis es un test no paramétrico análogo al análisis de varianza (ANOVA), con una distribución chi- cuadrado. Es la prueba más utilizada para más de dos muestras independientes, siendo mucho más sensible que el test de la mediana. Este método se encarga de medir la tendencia central de las muestras, teniendo como hipótesis nula que las poblaciones testeadas tienen la misma mediana [43].

Cuando el análisis de Kruskal determina que los tratamientos (en este caso las variables cualitativas evaluadas) no tienen la misma varianza, se procede a realizar el test de pairwise wilcox, esta prueba sirve para determinar la diferencia inter- grupos [54]. No todos los parámetros tienen la misma significancia con respecto a todas las variables evaluadas, es decir, que no todas las variables influyen en el cambio de concentración registrado por la red de calidad hídrica, y para ello, se realizó este test. Para este trabajo con el nivel de significancia del 0.05, el cual indica la probabilidad bajo la cual no hay efecto o diferencia de obtener un resultado diferente al que se tuvo al inicio del estudio.

La prueba de pairwise es un método combinatorio de pruebas de software que, para cada par de parámetros de entrada a un sistema (típicamente, un algoritmo de software), prueba todas las posibles combinaciones, discretas de esos parámetros. Utilizando vectores de prueba cuidadosamente seleccionados, esto puede hacerse mucho más rápido que una búsqueda exhaustiva de todas las combinaciones de todos los parámetros, "paralelizando" las pruebas de pares de parámetros [39]. Para este tipo de test estadístico, el ajuste del p value por medio de Bonferroni y Holm son de los más conocidos, teniendo en cuenta que ambos se realizan estableciendo suposiciones arbitrarias. Bonferroni es el método más usado ya que es muy común al controlar la tasa de error familiar; la corrección o ajuste lo realiza encontrando el valor crítico (alpha) para un test individual dividiendo la tasa de error (que por defecto generalmente es 0,05) entre el número de test realizados [56].

38

Posterior a ello se aplicaron los métodos previamente mencionados en el marco teórico de este documento, para las técnicas se usaron los softwares: ArcMap (ESRI) y R Studio. A continuación se explican los pasos de cómo se realizó el análisis por medio de métodos estadísticos. 5.2.2 APLICACIÓN DE LOS MÉTODOS ESTADÍSTICOS

1. Análisis jerárquico: cuando se ha culminado la etapa de análisis de varianza, se realizó un análisis visual por medio de diagramas matemáticos con coordenadas cartesianas o diagrama de puntos, en donde se ve el comportamiento en el espacio de los parámetros versus cada una de las variables de referencia. Posterior a ello se complementa con los dendogramas, generados para comparar los parámetros entre sí, y determinar cuáles afectan directamente el comportamiento de los demás. Se usó el método Ward de varianza mínima (desarrollado por Joe H. Ward Jr.) en donde se calcula el error de la suma de los cuadrados para determinar la distancia entre los clústeres finales. Primero, el test se enfoca en calcular n-1 clústeres, posterior a ello se calcula el r2 y el error de la suma de los cuadrados, esto para comenzar a agrupar los clústeres de referencia inicial; entonces, aquellos grupos que tengan el menor error de la suma de cuadrados (o en su defecto el mayor r2) formarán el primer clúster, y así, sucesivamente se repite el proceso restando una unidad más al valor inicial n (número de categorías) [57]. 2. Análisis lineal de discriminantes: como se mencionó anteriormente en la parte teórica del documento, este método se usó para poder determinar si los datos originales pertenecen a los grupos iniciales de clasificación, o por si el contrario, pueden ser clasificados en un nuevo grupo. Primero se realizó el análisis discriminante global por variable, para ver cómo se comportan los parámetros y cómo cada uno afecta la discriminación realizada, posterior a ello se realizó el ALD individual, para analizar más a detalle el comportamiento de los parámetros vs cada una de las variables; el programa RSTUDIO arrojó gráficos como histogramas y plots de mosaico, de los cuales se realizó su respectiva interpretación. 3. Kriging/IDW: unas de las ventajas de estos métodos son los resultados visuales que arroja, ya que, esto permitió determinar desde una perspectiva más gráfica el comportamiento de los parámetros a lo largo de los cuerpos de agua. Los mapas se realizaron por mes (análisis mensual multianual) para cada uno de los parámetros, obteniendo así 120 mapas por río para su respectivo análisis, El método Kriging no pudo ser aplicado para todos los casos de estudio. 4. Red Neuronal Artificial: esta es la parte final del proyecto, ya que se diseñó un sistema de nodos, el cual permitió potenciar el sistema de medición ya existente y así poder determinar cuál es el comportamiento inicial de medición de esta red de calidad. El objetivo de esta programación es

39 primeramente, reclasificar los datos originales, seguido de un entrenamiento de neuronas, para así, poder predecir valores del caso de estudio. El procedimiento de la red neuronal se llevó a cabo en dos pasos importantes, primero el entrenamiento de la red, en donde se determinó (en la capa oculta) el número de neuronas que ayudarían a calcular correctamente los pesos finales correspondientes con cada una de las categorías de las variables estudiadas. Para el entrenamiento, se generó una base de datos aleatoria con el 70% de la información que se tiene para cada uno de los ríos.

Posterior a ello, se realizó la clasificación de la información predicha por la red neural, para ello, se generó una base de datos con el 30% de la información de cada uno de los ríos. En este caso, se corrió el código más de una vez, ya que en cada repetición se generaban nuevas muestras aleatorias, tanto los pesos generalizados de la red como la clasificación de la información cambiaban.

40

6. RESULTADOS Y ANÁLISIS DE RESULTADOS.

A continuación se mostrarán los resultados correspondientes a cada metodología planteada en el trabajo: Resultados del análisis de varianza (Kruskal – Wallis), resultados de la prueba Pairwise Wilcox, diagrama matemático con coordenadas cartesianas (scatterplot), análisis jerárquico – dendograma, análisis lineal discriminante, análisis geoestadístico y la red neuronal artificial, las cuales fueron arrojados por el programador; posterior a ello, se muestran los análisis de cada método. Se tiene en cuenta que por la cantidad de resultados obtenidos, aquí se muestran algunos, los más representativos de cada método y los demás serán mostrados en los anexos. 6.1 RESULTADOS DEL ANÁLISIS DE VARIANZA (KRUSKAL – WALLIS)

En las tablas 5 y 6 se resumen los resultados arrojados por este test, en donde, la significancia o no de un parámetro está dada por la siguiente simbología

Códigos de significancia: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

En donde la cantidad de asteriscos determina que tan fuerte es la influencia de la variable sobre los parámetros evaluados. En el caso de no encontrar simbología en la tabla, es porque la variable no actúa directamente en la variabilidad de la información registrada.

Como análisis general, la prueba de Kruskal – Wallis arrojó que la variable estación tiene un alto grado de significancia (p<0,05) para todos los parámetros, indicando que esta variable afecta significativamente la variabilidad de la información. Para los demás parámetros, dependiendo de su naturaleza, influenciarán ciertas variables, por ejemplo para el río salitre, las variables que influyen en la concentración son meses y observaciones en mayor medida, mientras que para el río Torca es fundamental el variable año.

Tabla 5: Resumen de los resultados arrojados por la prueba Kruskal Wallis para el río Torca.

ANÁLISIS DE VARIANZA (Significancia) Observaciones Estación Día Mes Año pH ** *** * *** Oxígeno disuelto *** . * DBO ** *** ** ***

41

DQO ** *** * *** SAAM *** Grasas y aceites *** * ** *** Coliformes fecales *** . *** Sólidos suspendidos *** totales Fósforo total *** *** ** *** *** Nitrógeno total *** ** *** Fuente: Autores.

Para el río torca, se ve en la tabla 5 que los parámetros sólidos suspendidos totales y sustancias activas al azul de metileno dependen únicamente de la estación, esto, se debe a que estos parámetros están fuertemente ligados con actividades antrópicas ya que los vertimientos domésticos e industriales tienen sólidos suspendidos totales y tensoactivos. Se aclara que los sólidos totales también se generan por procesos de desgaste del suelo, y esto complementa la cantidad generada por los vertimientos descargados directamente en el cuerpo de agua.

Tabla 6: Resumen de los resultados arrojados por la prueba Kruskal Wallis para el río Salitre.

ANÁLISIS DE VARIANZA (Significancia) Observaciones Estación Día Mes Año pH *** *** ** *** Oxígeno disuelto *** ** *** DBO ** *** ** DQO *** ** SAAM . *** * Grasas y aceites * *** * *** Coliformes

fecales Sólidos suspendidos * *** * ** totales Fósforo total *** *** Nitrógeno total . *** **

Para el río Salitre, se ve en la tabla 6 que el parámetro coliformes fecales presenta fluctuaciones en sus concentraciones por variables no tenidas en cuenta en la base de datos, como los vertimientos domésticos, vertimientos industriales y demás

42 actividades, por ello, el test de Kruskal – Wallis considera que ninguna de las variables aporta al cambio de coliformes fecales a lo largo del cuerpo de agua. 6.2 RESULTADOS DE LA PRUEBA PAIRWISE WILCOX.

Esta es la continuación de la prueba de Kruskal - Wallis; aquí se determinó cuál es la relación intergrupal de la información de las bases de datos. Para ambos casos, se tuvo en cuenta que la estación era la variable de mayor importancia ya que es la que de acuerdo a la ubicación registró valores que variaban por factores externos como las actividades antrópicas de la zona en donde se encuentra cada punto de muestreo. A continuación se muestran los resultados del test para estaciones en las tablas 7 y 8, en donde se ve el resumen de los resultados; en ellas se enlistan las estaciones que registran valores similares de los parámetros evaluados, esto con el fin de poder generar la propuesta de optimización con respecto a la eliminación o adición de puntos de monitoreo. Así mismo, de todos los resultados que podrán encontrarse posteriormente en los anexos, se adjunta en esta sección del documento un ejemplo del Boxplot generado por este test para el respectivo análisis de la relación intergrupal de los parámetros fisicoquímicos y biológicos. Tabla 7: Resultados del test pairwise wilcox en donde se contrasta los parámetros fisicoquímicos contra la variable “ESTACIONID” para el río Torca

PARÁMETROS ESTACIÓN ID Jardines de Paz y Calle pH 161 Jardines de Paz y San Oxígeno disuelto Simón Jardines de Paz y Calle DBO5 total 161 Jardines de Paz y Calle DQO total 161 sustancias activas al azul Jardines de Paz y Calle de metileno 161 Jardines de Paz y Calle Grasas y aceites 161 Sólidos suspendidos Jardines de Paz y Calle totales 161 Jardines de Paz y Calle Coliformes fecales 161

43

Jardines de Paz y Calle Fósforo total 161 Jardines de Paz y San Nitrógeno total Simón

Fuente: Autores.

Gráfica 6: Boxplot del parámetro “pH” vs estación para el río Torca.

Fuente: autores.

Para el Río Torca, como se ve en la tabla 7, las estaciones que mayor similitud tienen son calle 161 y jardines de paz, teniendo en cuenta que son estaciones que aunque espacialmente no se encuentren tan cerca, ambas están ubicadas en el tramo dos del río, en donde hay más influencia antrópica en las descargas en el canal (por parte de las zonas residenciales y comerciales).

Con respecto a las observaciones, para el río Torca no hay una condición climática que influya más que otra ya que las medias no presentan cambios muy significativos entre categorías. La categoría N/A para el parámetro de sustancias activas al azul de metileno y oxígeno disuelto, es la más representativa, sin embargo, no es posible determinar si la presencia o ausencia de la luz solar influye en el comportamiento de las concentraciones.

Tabla 8: Resultados del test pairwise wilcox en donde se contrasta los parámetros fisicoquímicos contra la variable “ESTACIONID” para el río Salitre.

PARÁMETROS ESTACIÓN ID pH Alameda,TV91, calle 53

44

Oxígeno disuelto Carrefour, TV91 DBO5 total Alameda,TV91, calle 53 DQO total Alameda,TV91, calle 53 Sustancias activas al azul de metileno Alameda,TV91, calle 53 Grasas y aceites Alameda,TV91, calle 53 Sólidos suspendidos Alameda,TV91, calle 53, totales Carrefour Coliformes fecales Calle 53 Fósforo total Alameda,TV91, calle 53 Nitrógeno total Alameda,TV91, calle 53

Fuente: Autores.

Gráfica 7: Boxplot del parámetro “pH” vs estación para el río Salitre.

Fuente: autores.

Para el río Salitre, como se ve en la tabla 8, las estaciones Calle 53, Alameda y TV91 tienen comportamientos similares con respecto a la variabilidad de las concentraciones de los parámetros y por la dinámica geográfica que tiene el flujo del canal, pues en estos puntos que se encuentran ubicados en los tramos dos y tres se encuentran vertimientos industriales, domésticos y algunos ilegales

45 aumentando la concentración de algunos parámetros por lo que se puede dar su similitud de datos.

Con respecto a la variable observaciones, se puede afirmar que la categoría “soleado” en los parámetros exceptuando DQO y grasa y aceites, es la variable que tiene un comportamiento diferente las otras tres categorías (N/A, nublado y lluvia) ya que su media se diferencia de las demás (aumenta o disminuye dependiendo del parámetro) por lo que se cataloga como la condición climática que afecta en mayor medida las concentraciones de los parámetros evaluados

Para ambos ríos, las variables mes y días, son variables que no presentan cambios muy pronunciados en sus medias, es decir que no se puede inferir que medir en el mes de enero los días viernes sea diferente a medir el mes de junio los días martes ya que los resultados arrojan que no hay diferencia en los resultados obtenidos por el periodo en el que se mida.

Los boxplot puestos como ejemplo (gráficas 6 y 7) muestran cuál es la importancia de la estación para los parámetros, pues es la variable que presenta mayor cambio en las medias registradas, hay parámetros en donde esta diferencia de medias es más marcada que en otros, pero en resumen, se quiere denotar que los boxplot afirman los resultados de la prueba de pairwise wilcox (Para mayor información, consultar los anexos)

6.3 DIAGRAMA MATEMÁTICO CON COORDENADAS CARTESIANAS (SCATTERPLOT)

Este es un método de gráfica de datos que sirve para el contraste de variables [58]. En este caso, se usó para contrastar los parámetros físico-químicos versus las variables de referencia que hayan sido relevantes en la comparación de pairwise, para así, poder complementar con los resultados obtenidos en la fase anterior del análisis de ANOVA. El objetivo principal de llevar a cabo este procedimiento gráfico fue determinar cuál es la relación preliminar (directa o indirecta) entre variables continuas [59]; la generación de estos gráficos es un paso complementario a previos test para poder complementar los análisis mostrados más adelante. Gráfica 8: Scatterplot matrix de sustancias activas al azul de metileno y fósforo total vs estación para el río Torca

46

Fuente: autores. Gráfica 9: Scatterplot matrix de Fósforo total, Coliformes fecales y Nitrógeno total vs estación para el río Salitre.

Fuente: autores. En las gráfica 8 y 9, se establece la relación entre los parámetros sustancias activas al azul de metileno y fósforo total, que para ambos ríos es un de las relaciones más fuertes (directamente proporcional). Así mismo, los parámetros DBO y DQO

47 también tienen a tener un comportamiento directamente proporcional, más fuerte en el río Torca. Para mayor información, revisar anexos. Teniendo en cuenta los resultados arrojados para los parámetros sustancias activas al azul de metileno y fósforo total la relación directamente proporcional se da en que las sustancias activas al azul de metileno reaccionan en medios alcalinos con componentes de los detergentes sintéticos, una de las principales fuentes aportadoras de fósforo [58]. Así mismo se ve que para ambos ríos la relación más marcada se ve entre la DBO y DQO, teniendo en cuenta que ambos parámetros están ligados por la cantidad de oxígeno que quiere la materia orgánica (con compuestos químicos por las descargas residuales y compuestos orgánicos en donde los agentes son las baterías aerobias) para ser sintetizada. Sin embargo, estos gráficos no pueden determinar una relación definitiva entre parámetros, teniendo en cuenta que pueden existir factores externos a los evaluados en este trabajo, que influyan en la relación que se da realmente entre los parámetros fisicoquímicos y biológicos tratados en este estudio puesto que el método de los scatterplots no detecta variables discretas. 6.4 ANÁLISIS JERÁRQUICO - DENDOGRAMA

Posterior al paso de generar los scatterplots, se hizo el análisis jerárquico para determinar qué parámetros fisicoquímicos tienden a parecerse a los demás. Para ambos ríos, las ramificaciones del dendograma se comportan de la misma manera, determinando que existen las siguientes relaciones.

 Demanda química de oxígeno y sólidos suspendidos totales.  Demanda biológica de oxígeno y grasas y aceites.  Nitrógeno total  pH, oxígeno disuelto, sustancias activas al azul de metileno y fósforo total.

El programa permitió realizar una clasificación por grupos (a parte de las ramificaciones iniciales) para formar grupos más específicos, dado el caso las divisiones involucren muchos parámetros. Se estableció que se dibujaran 7 rectángulos en las ramas, señalando los clústeres finales. Al aplicar el análisis jerárquico, se formaron inmediatamente dos clústeres en donde uno está conformado por el parámetro coliformes fecales y el otro está formado por los demás parámetros del estudio (tal como se especificó en la sección 6.1.3). Se determinó entonces que los coliformes fecales tienen un comportamiento aislado, puesto que no está influenciado por el cambio de concentraciones de los demás parámetros.

48

Gráfica 10: Dendograma de los parámetros fisicoquímicos para el río Torca.

Fuente: autores. Gráfica 11: Dendograma de los parámetros fisicoquímicos para el río Salitre.

49

Fuente: autores. Al realizar la clasificación jerárquica en presencia del parámetro “coliformes fecales” (como se ve en la gráficas 10 y 11), se denota que los demás parámetros no se definen por sus diferencias y son clasificados como un gran clúster, lo que impide establecer la relación entre ellos; este comportamiento puede darse por el recorrido que hacen los ríos pues en algunos de sus tramos debido a la sedimentación y carga orgánica existe mayor presencia de coliformes. Este parámetro es un parámetro biológico que depende de la presencia de vertimientos domésticos (al estar presente principalmente en excrementos humanos y animales) por lo que estos resultados no presentan relación inicial con los demás parámetros, ya que los coliformes fecales en particular dependen en tal caso de la dinámica poblacional de la zona de estudio. Posterior a ello, cuando se realizó el análisis jerárquico sin el grupo de coliformes fecales, ya se generaron más ramificaciones en los respectivos dendogramas.

Gráfica 12: Dendograma de los parámetros fisicoquímicos sin coliformes fecales para el río Torca.

Fuente: autores.

Gráfica 13: Dendograma de los parámetros fisicoquímicos sin coliformes fecales para el río Salitre.

50

Fuente: autores.

Entonces, al ser excluido el parámetro coliformes fecales, los dendogramas generaron respectivamente dos grandes ramificaciones o clústeres para ambos ríos con los parámetros igualmente clasificados (como se ve en las gráficas 12 y 13). El primer gran grupo se formó teniendo en cuenta los parámetros DQO y sólidos suspendidos totales; los sólidos suspendidos totales permiten que la adsorción de contaminantes sea mayor, lo que implica mayor cantidad de oxígeno para poder oxidar los diversos compuestos presentes en el agua.

La segunda ramificación tiene contenido en su clasificación a los parámetros pH, oxígeno disuelto, sustancias activas al azul de metileno y fósforo total como la división principal y los parámetros DBO y Grasas y Aceites en otro grupo pero con características similares; sin embargo la cercanía entre los pesos de cada uno de los parámetros en este clúster varia para cada caso, el río Torca presenta una relación entre oxígeno disuelto, sustancias activas al azul de metileno y fósforo total y mantiene el pH dentro del grupo pero con una relación menos fuerte (gráfica 12), mientras que el río salitre asocia el pH con el oxígeno disuelto, y el fósforo total con las SAAM (gráfica 13).

La relación pH y oxígeno disuelto, está dada entre otros factores por la temperatura, ambos tienen una relación inversamente proporcional a este parámetro, teniendo en cuenta que cuando la temperatura aumenta, se rompen las moléculas de agua, liberando así iones de hidrógeno y oxígeno, el oxígeno sale por medio de

51 evaporación mientras que los iones de hidrógeno acidifican el agua. Por otro lado, la relación entre los parámetros sustancias activas al azul de metileno y fósforo total se da por la composición de los tensoactivos descargados a lo largo de los cuerpos de agua (esto, teniendo en cuenta que ambos ríos relacionan estos dos parámetros) contienen fosfatos en su composición.

Finalmente, la relación entre los parámetros DBO y Grasas y Aceites se da ya que las grasas y aceites son mezclas de hidrocarburos con componentes orgánicos, que en contacto con el agua envuelven a las comunidades microbianas que están presentes en los cuerpos de agua, generando una acción asfixiante para ellas ya que gracias a la composición semi-hidrófila de las grasas y aceites, el oxígeno no puede ser usado por dichas comunidades para degradar los componentes biológicos de este contaminante.

6.5 ANÁLISIS LINEAL DE DISCRIMINANTES

A continuación se mostrarán los resultados del análisis discriminante para cada uno de los ríos. Gráfica 14: Diagramas de los respectivos grupos del análisis discriminante para el río torca con respecto a las estaciones.

Fuente: autores. Una de las variables que tiene mayor importancia a la hora de determinar la fluctuación de los valores registrados por la red es la estación; para el río Torca, se ve que la estación Jardines de paz se aglomera espacialmente junto a las demás estaciones (gráfica 14), demostrando, que los resultados registrados por esta estación son similares a la estación calle 161, y en casos específicos a la estación San simón.

52

Gráfica 16: Plot de mosaico para el parámetro coliformes fecales versus estación para el rio Torca

Fuente: autores.

De acuerdo al análisis lineal discriminante individual, para la estación 1 (bosque de pinos) se dio la clasificación más acertada con respecto a la original para todos los parámetros, teniendo en cuenta que es la única estación que se encuentra en el tramo 1. Así como en el análisis general, las tres estaciones del tramo 2 comparten similitudes, y por ello, 9 de los 10 parámetros distribuían la información equitativamente entre ellas, salvo el parámetro coliformes fecales (gráfica 16) en donde la información de las 4 estaciones era muy similar y la distribución fue más equitativa entre las estaciones 2 y 3 (calle 161 y jardines de paz). Para la variable año en el rio torca, hay una tendencia en la clasificación de los datos, ya que más del 90% de la información se clasifica como registrada en el año 2011; esta clasificación final se debe a que la información en gran medida realizada por la red de calidad hídrica se realizó en el año 2011, el año 2010 no posee gran información, por lo que es posible que los datos registrados en este año sean similares a los de otros años. Así mismo, la red de calidad hídrica para el rio Torca tenía registrada información del año 2009 para este río, sin embargo, esta información pertenece a estaciones que no son contempladas en los siguientes períodos por la red, por lo que la información no ha sido incluida y puede que esto afectará la clasificación final.

Grafica 15: Diagramas de los respectivos grupos del análisis discriminante para el río salitre con respecto a las estaciones.

53

Fuente: autores En el caso del rio Salitre, la variable estación mostró alta significancia (gráfica 15), demostrando que la estaciones 1, 2 y 6 (Alameda, Río Arzobispo TV 91) se encuentran aglomeradas espacialmente en otras estaciones (Carrefour, Calle 53 y Parque nacional). Para el rio Salitre si se tuvo en cuenta la información del año 2009 la cual se clasifica en su totalidad en el año 2011 según el método, pero en general no se estableció que los datos pudieran variar entre años, de tal forma que permitiera determinar si el dato pertenecía a un periodo de tiempo en específico, puesto que los datos de los parámetros oscilan entre rangos definidos y no hay variaciones significativas entre años.

Para la variable observaciones en los dos ríos (Salitre y Torca), la clasificación de la información en nuevas categorías desiste de dos de las antiguas categorías (n/a y lluvia) teniendo en cuenta que la información se adapta mejor a las categorías “nublado” y “soleado” descartando lluvia que aglomera la mayoría de sus datos en ”nublado” (89% para el río Torca y el 80% para el río Salitre). En el caso de la variable observaciones, se puede decir que a excepción de los sólidos suspendidos totales, coliformes fecales y grasas y aceites, que clasifica todos sus datos en la variable soleado, se clasifican por iguales tanto soleado y nublado, la gráfica no tiene en cuenta ni lluvia ni N/A pues clasifica su información en soleado.

54

Gráfica 17: Plot de mosaico para el parámetro sustancias activas al azul de metileno versus estación para el río Salitre

Fuente: autores. Explicando uno de los parámetros, se puede observar que el él plot mosaico para el parámetro SAAM versus las estaciones (gráfica 17) se concluye que de las seis estaciones, los datos se distribuyen tres de ellas (alameda, río arzobispo y AV68) y que la estación parque nacional es la que mayor número de datos acoge. Para la variable mes, en el caso de los dos ríos (Salitre y Torca), se denota que la clasificación nueva tenía sus complicaciones, esto debido a que inicialmente se especificó que no todos los meses del año poseían información de mediciones realizadas por la red de calidad hídrica, lo que dificultaba tener un patrón de referencia mensual para la nueva clasificación; en general, se ve que la mayoría de la información se clasifica como realizada en los meses de septiembre, octubre y noviembre. 6.6 ANÁLISIS GEOESTADÍSTICO

En todo el trabajo, se ha realizado un análisis puntual de la información obtenida por cada una de las estaciones de los dos ríos (Salitre y Torca); para ello, se generaron interpolaciones por medio de los métodos Kriging e IDW para cada uno de los parámetros por mes, los mapas resultantes permitieron determinar cuál es el comportamiento de estos parámetros a lo largo del río y los cambios de concentraciones de acuerdo al tramo y estación en las que se miden.

55

Gráfica 18: Mapa de las concentraciones de oxígeno disuelto para el mes de febrero para el río Torca

Fuente: Autores.

56

Gráfica 19: Mapa de las concentraciones de pH para el mes de marzo para el río Salitre.

Fuente: autores.

57

- pH El pH es un parámetro que está en función de la temperatura y la profundidad del cuerpo de agua, en este caso de un humedal (Juan Amarillo y Guaymaral – Torca), que es un cuerpo lentico en donde se dan muchos procesos fisicoquímicos y microbiológicos, la temperatura del cuerpo de agua aumenta, disminuyendo así los niveles de este parámetro [60], de igual forma, los humedales se caracterizan por ser ambientes con naturaleza silicia (pobres en caliza) los cuales mantienen pH neutro o algunas veces cercanos a 6 (un poco más ácidos) [61]. En general este parámetro siempre se mueve en el mismo rango (6,5-9,0). En el rio torca, Los valores más altos se registran en la estación jardines de paz puesto que esta estación se encuentra en el punto en que el canal de torca se convierte en humedal, no hay valores atípicos en algún mes en específico. Se puede apreciar en los mapas (revisar anexos) que este parámetro tiende a registrar los mayores valores en la estación 3, Jardines de Paz, y después de ello, cuando el efluente llega al humedal, el pH disminuye. Para el rio salitre (ejemplo gráfica 19) se puede observar en los mapas que la estación Av 68 es la que presenta los mayores valores en todos los meses, esto se debe a que es una zona industrial, donde existe mayor carga de vertimientos; los valores más bajos se pueden observar en la estación río arzobispo y parque nacional pues están ubicadas en la cuenca alta donde el agua no ha recibido grandes cargas de vertimientos, en la cuenca baja del rio se pueden observar los datos más altos de pH en esta parte del rio por su descomposición anaerobia de materia orgánica, hace que se genere una cantidad de ácidos grasos volátiles para disminuir el pH del rio. - Oxígeno disuelto El oxígeno disuelto se encuentra en diversas concentraciones a lo largo de la masa de agua, también se ve afectado por la temperatura (como el pH), la presión atmosférica, el viento y procesos biológicos (fotosíntesis y respiración) [62]. Para el río torca (ejemplo gráfica 18), la concentración de oxígeno disuelto tiende a disminuir a través de los meses medidos, esto en sí, es un comportamiento normal de este parámetro, teniendo en cuenta que aguas abajo, se encuentra el humedal, en donde se producen muchos procesos biológicos, en donde se consumen grandes cantidades de oxígeno disuelto, así mismo, estos bajos niveles de oxígeno disuelto pueden determinar qué tan contaminado está el cuerpo de agua [63]. Para el rio salitre se puede observar en todos los meses que a medida que el río hace su recorrido, las concentraciones para este parámetro van disminuyendo, para el oxígeno disuelto. La estación Av 68 es la que mayor variabilidad tiene en los datos, ya que en este tramo medio del río se empieza a ver la disminución de

58 oxígeno disuelto puesto que los organismos anaerobios hacen presencia en el río por la descarga residual del sector. - Demanda biológica de oxígeno La DBO sirve para determinar qué tanto oxígeno es requerido para degradar la materia orgánica, cuando este parámetro se encuentra a niveles altos, indica que la materia orgánica necesita de mayores cantidades de oxígeno para realizar los procesos de degradación [64]. Este parámetro es inversamente proporcional al oxígeno disuelto, por lo que, en los mapas, se ve que este parámetro aumenta significativamente en la estación calle 161; en este punto se une el canal San Cristóbal y más adelante al canal serrezuela, los cuales traen consigo grandes cantidades de aguas de escorrentía provenientes de canteras [65]. Sin embargo, los niveles no sobrepasan el límite permisible de la norma por lo que puede decirse que es un cuerpo de agua medianamente contaminado. Para el rio salitre se puede ver que las concentraciones más altas en todos los meses ocurren en el tramo 3 y 4 donde están las estaciones Av 68 y calle 53, ningún valor ha pasado el limite normativo. - Demanda química de oxígeno La DQO es un parámetro que permite medir la oxidación de los compuestos orgánicos e inorgánicos presentes en el agua [66]. Este parámetro está ligado con la demanda biológica de oxígeno y siempre tiende a registrar valores mayores, ya que se necesita más oxígeno para oxidar compuestos orgánicos que para la demanda de organismos en un cuerpo de agua. Cuando los valores de DQO son mayores indican un alto grado de contaminación, así como la DBO. Para el rio torca, los niveles de DQO en el canal no sobrepasan los límites permisibles (salvo los meses de mayo y julio que se registran valores atípicos) por lo que podría considerarse como un cuerpo de agua medianamente contaminado. Para el rio salitre se puede apreciar que la DQO tiene un comportamiento similar a la DBO, en la mayoría de los meses se puede decir que los valores altos de la concentración están en las estaciones Av 68, tv 91 y alameda, la última estación (alameda) no tiene la mayor carga de concentración la tiene la estación Av 68, se puede decir de esto que esta estación amortigua un poco la cantidad de materia orgánica, este comportamiento no se da en el mes de agosto, donde alameda presenta la mayor concentración y es el mes que no cumple con la normativa. - Sólidos suspendidos totales Los SST es la suma de todos los minerales, metales y sales disueltas en el agua, las cuáles se dan por procesos antrópicos en donde se hagan intervenciones directas en suelos [67]. No hay como tal un comportamiento fijo a través de los meses para este parámetro en el río Torca, es decir que dependiendo de la época, pueden variar las concentraciones de SST en cada punto medidos [61].

59

En general, las estaciones Calle 161 y Jardines de paz son las estaciones que registran los valores más altos de sólidos suspendidos, esto teniendo en cuenta lo mencionado anteriormente sobre la actividad de las canteras, y además de ello, que en el tramo dos, se encuentra la entrada directa de otras quebradas y drenajes, que traen consigo sólidos suspendidos, así como que en este tramo, se generen vertimientos domésticos y/o industriales. Para el parámetro de solidos suspendidos totales en el rio salitre, sin importar el mes se puede decir que los mayores niveles de solidos se encuentran en las estaciones Av 68, Alameda y Tv 91, en general se cumple la normatividad en este parámetro, para las estaciones de Rio arzobispo y parque nacional los niveles son bajos pues como en todos los parámetros a estar en la cuenca alta existen pocas intervenciones antropogénicas, para este parámetro es fundamental que se trate de que la cantidad de solidos suspendidos no se de en grandes cantidades para que pueda llevarse a cabo el proceso de fotosíntesis. - Grasas y aceites Las grasas y aceites son compuestos de origen orgánico, ya que están constituidas por sustancias vegetales y animales, así como también tiene hidrocarburos de petróleo. Este parámetro puede producir acidificación en el agua, lo cual hace que el nivel de pH del agua aumente, y así mismo impide que el CO2 se libere en la atmósfera, disminuyendo los niveles de oxígeno disuelto en el cuerpo de agua en el que esté presente [69]. Para el rio torca, en el parámetro grasas y aceites, en el mes de octubre, se ve que hay un valor de 336, mientras que los demás datos oscilan entre 3,6 y 8. Se puede concluir que ha sido un problema de digitación por parte del observador, ya que, en esta zona (aguas arriba) no existen fuentes de contaminación conocidas, y menos que se registre un valor tan grande en un solo día. En general, las mayores se concentran entre la estación calle 161 y la estación Jardines de paz, ya que el caudal del canal no es muy grande, el transporte de las grasas y aceites toma su tiempo en llegar hasta el humedal, por lo que primero se registran concentraciones altas en la estación cale 161 y cuando aquí bajan, aumentan en jardines de paz, registrando la misma cantidad inicial, pero adicionando la de los canales Serrezuela y El Redil. Para el rio salitre, el parámetro grasas y aceites en la estación calle 53 se ve la más alta concentración del parámetro, donde algunos de sus valores pasan el límite permitido por la normativa, los valores se tienen un comportamiento similar en las estaciones Rio arzobispo, Parque nacional, Av 68. En los años 2011 y 2013 los valores son más altos que en los demás años, - Sustancias activas al azul de metileno

60

El parámetro sustancias activas al azul de metileno está directamente relacionado por las descargas de aguas domésticas e industriales al canal de los establecimientos (colegios, universidades, empresas, restaurantes, entre otros) y viviendas que se encuentran a lo largo de la cuenca del río Torca. Así como en casos anteriores, este parámetro se encuentra en grandes cantidades en el tramo dos, ya que es donde se realizan mayor cantidad de descargas (teniendo en cuenta las puramente industriales), y así progresivamente las concentraciones se estabilizan en un rango de 0,5 a 2,5 mg SAAM/L en el último punto de registro, es decir, en el humedal, ya que al ser mayor el cuerpo de agua, las cargas se disuelven, registrando menores cantidades. Para el rio salitre las concentraciones se mantienen en los tramos uno y dos entre (0,02 y 0,19 mg/L) pero en el tramo tres del rio se ve un aumento considerable (3 mg/L aproximadamente), en el año 2010 se ven las concentraciones más altas respecto a los demás años. - Fósforo total. El fósforo total tiene dos tipos de fuente, la natural que se da por desprendimiento de suelos y descomposición de rocas y la forma artificial, aportada por detergentes y otras sustancias químicas usadas en la industrial. En general, para el rio torca, ninguna de las estaciones cumple con los objetivos de calidad que se impone la secretaría de ambiente, inclusive en el tramo 1, se registran concentraciones mayores a los 0,2 mg/L que exige la norma, y a lo largo del tramo dos, las concentraciones superan el miligramo por litro (1 mg/L) establecido. Esto, como ocurre con las grasas y aceites y las sustancias activas al azul de metileno, se debe a los vertimientos domésticos e industriales constantes que se realizan a lo largo del segundo tramo del canal [61]. Para el rio salitre en las estaciones de la cuenca alta las concentraciones de fosforo son bajas, en las estaciones Av 68 y calle 53 empiezan a aumentar, encontrando concentraciones por encima de 2 mg/L, estas concentraciones se puede relacionar a la descomposición natural del parámetro y a las descargas que se realizan en el río a través de su recorrido. En estas últimas estaciones se puede decir que las aguas se encuentran contaminadas. - Nitrógeno total El nitrógeno se encuentra en el agua gracias a dos fuentes, la antrópica que en esta caso se da por vertimientos con excrementos y secreciones de orina (de animales y humanos), así como en compuestos industriales como los fertilizantes (teniendo en cuenta que al norte la ciudad hay muchos campos con especies vegetales que solicitan un constante cuidado con este tipo de productos [68]. Para el río Salitre existe un comportamiento variable, ya que en las estaciones Rio arzobispo y parque nacional tiene una concentración baja (promedio de 1 mg/L)

61 pero por la dinámica de este parámetro y sus proceso químicos relacionados, se ve un aumento en la mayoría de los meses del parámetro en las estaciones Av 68, Calle 53, Alameda, superando los 18 mg/L en esta parte del rio. Para el rio torca, en general, las estaciones calle 161, jardines de paz y San Simón registran valores que oscilan entre los 5 y 25 mg/L, ya que, gracias a los vertimientos y los afluentes naturales al canal, llegan compuestos nitrogenados en todas sus formas (mayormente en forma de nitritos y nitratos) que terminan en el humedal concentrándose con nitrógeno que se encuentra depositados a lo largo del cuerpo de agua por el ciclo natural del mismo. El parámetro coliformes fecales está ligado con el nitrógeno total, teniendo en cuenta que los desechos fecales son la principal fuente de la presencia de esto organismos en el agua, además de que este grupo de organismos sobreviven fuera del tracto gastrointestinal por las condiciones dadas en el ambiente en el que se encuentran (humedad, pH, materia orgánica, entre otros) [69]. En general, se ve que en todas las estaciones del tramo dos se superan las concentraciones permisibles establecidas en los objetivos de calidad de la secretaría de ambiente (1,0E5), y como se explicó anteriormente, todo se debe a los vertimientos de aguas domésticas e industriales. Para el rio torca a lo largo de los meses de medición, se ve que las variaciones de coliformes fecales se mantienen en el rango del número más probable de 1,0E5 a 1,0E7, exceptuando valores atípicos registrados en los meses de febrero y agosto. Además, se ve como las concentraciones disminuyen (aunque no en gran medida) en el humedal, debido al área de cuerpo de agua, agregando también que ahí hay presencia de organismos y seres vivos que igual aportan coliformes fecales al agua. En el rio salitre, el parámetro no tiene una tendencia fija, tiene una gran variabilidad, en el mes de octubre se ve la mayor concentración registrada por la red de calidad hídrica; este parámetro al igual que en el rio torca no cumple con la normativa en la mayoría de sus datos. Hay un fenómeno en el río Salitre, pues las concentraciones más altas para muchos de los parámetros se da entre calle 53 y AV68, pero cuando pasan por la estación TV91 tienden a disminuir. Por ello, aunque las estaciones se parezcan entre sí, es fundamental conservar estos puntos de monitoreo. Los respectivos mapas utilizados para el análisis de esta sección se encuentran en los anexos. 6.7 RED NEURONAL ARTIFICIAL

62

Por último, se implementó el algoritmo de una red neuronal artificial, con el propósito de analizar la información y así, generar nuevas clasificaciones para las variables estación, mes, año y observaciones - Río Torca Gráfica 20: Red neuronal artificial de los parámetros fisicoquímico y biológicos versus la estación para el río Torca.

1 1.61165 1 pH 1.7481 0.27648 1.4269 0.846970.16327-1.217970.40173 0.99999

-0.38959-0.24181 DO 1.24299 1.00485 -0.36853 1.11125 0.27227 BosqueP 1.652610.86749-1.08564

1.15757 BOD 2.43841 -1.0641 0.47944 -1.27961 0.8798 0.950571.00418 -0.8572 0.60257 1.0239-1.10269 1.6787 COD 0.19528 1.12544 -1.08823 -1.0921-1.51016 -0.79952 Calle161 0.07121 -0.917992.37251 -0.68115 -0.28692 TDS 0.50391 -0.2837 0.2932 -2.61113 -0.12482 0.86682

1.804552.78559-0.24005 F.G -3.17959 0 0.47214 1.31162 0.39517 -0.24659

1.02689 -0.22555 Jardines 6.107691.61501-3.41782 MBAS -9.02514 5.80184 2.9126

-0.60429 -0.795030.07114 8.534680.41547 -0.28255 -1.58657-6.30987 Phosphorus -0.29696 0.50016 1.52333 2.06249

-0.023162.551320.83718 0.00001-1.30456 Ssimon Faecal_coliform 2.776 0.436720.14830.91225 -0.5551

0.93671.2279-1.695290.508240.97111 Nitrogen -2.20474

Error: 32.634824Fuente: autores. Steps: 2224 Tabla 11: Resumen de los resultados arrojados por la red neuronal para la reclasificación de datos en las estaciones del río Torca.

prediction BosqueP Calle161 Jardines Ssimon BosqueP 12 1 0 0

63

calle161 0 2 0 0 Jardines 0 17 10 12 Ssimon 2 0 0 0

Fuente: autores. Para la estación Torca, se realizaron 3 pruebas para las cuatro variables de estudio, en donde se obtuvo que la mejor clasificación para la estación fue la obtenida en el primer intento (gráfica 20), en donde se tenían en cuenta todas las estaciones; esta clasificación arrojó que la mayoría de los datos (69% del total de la muestra del test de la red) pertenecían a la estación Jardines de Paz (tabla 11). Para los otros intentos, solo se tienen en cuenta las estaciones bosque de pinos y jardines de paz. Jardines de paz es la estación que se encuentra en el punto de entrada de afluente al humedal de Torca y Guaymaral. En los métodos usados anteriormente, se estipuló que la estacón Jardines de Paz era la estación que al presentar similitudes con calle 161 y san simón, era la que podría no tenerse en cuenta para la optimización. Sin embargo, los resultados de la red neuronal establecieron que a pesar de presentar similitudes, es una estación que registra valores con mayor rango de variabilidad. Para la variable año, en las repeticiones del algoritmo se determinó que la información de la muestra del test de la red neuronal, pertenecía en su mayoría al año 2011 (comportamiento que se evidenció en las tres reproducciones del código). En definitiva, coincide con el registro de datos original de la red de calidad hídrica, ya que el año en donde se realizaron mayores registros por parte de la red fue en el año 2011. Esto demuestra que la cantidad de datos puede hacer que la red neuronal arroje resultados más precisos, puesto que no se realizarían sesgos tan pronunciados si todos los años tuvieran la misma cantidad de registros. Para la variable observaciones, se determinó que las mediciones por parte de la RCHB se realizaron en dos condiciones climáticas (soleado y nublado), sin embargo, es en la condición “nublado” en donde se clasifica la mayoría de los datos de la muestra del test de la red neuronal en las tres réplicas del código. En los métodos aplicados a lo largo de este estudio, se evidenció el mismo comportamiento con respecto a esta variable, ya que predominaban en los registros de los observadores que generaron la base de datos de la red de calidad hídrica. Se tiene en cuenta que el campo “N/A” estaba sujeto a que el observador no registro la condición del día, por ello, la semejanza de los datos registrados bajo esta condición fácilmente son clasificados en las dos grandes categorías “soleado” y “nublado”. La variable mes presentó problemas a la hora de correrse el código, ya que se tuvieron que llevar a cabo seis intentos, de los cuales 3 arrojaron resultados, mientras que los otros tres no concluían el proceso de intercepto entre capas. Sin

64 embargo, los resultados arrojaron que las mediciones de la red de calidad hídrica se clasifican en los meses de agosto, septiembre y octubre. Esto da a entender que esta época (meses más fríos) son los que dan la variabilidad de la información y en los que es clave realizar mediciones y ahorrar costos a la hora de elegir la frecuencia de medición, esto concuerda con la información aportada por la clasificación de la variable observación, en donde la condición “nublado” es la de mayor relevancia, por lo que es importante medir en aquellos meses en donde el clima de la ciudad sea frío. - Río Salitre Gráfica 21: Red neuronal artificial de los parámetros fisicoquímico y biológicos versus la estación para el río Salitre.

Fuente: autores.

65

Tabla 12: Resumen de los resultados arrojados por la red neuronal para la reclasificación de datos en las estaciones del río Salitre.

Carrefour Prediction Alameda Calle 53 - AV68 ParqueN Rio Arz. TV91 Carrefour - AV68 0 0 0 2 0 0 ParqueN 18 19 16 17 23 17 Rio Arz. 0 0 0 3 0 0

Fuente: autores. En el caso del río Salitre, se realizaron 6 intentos de los cuales se presenta la misma tendencia, dando por resultado que la información es clasificada en 3 de las estaciones originales: Parque Nacional, Carrefour - AV68 y Rio Arzobispo, siendo las estaciones donde se reclasifican el 70% de los datos originales, pudiendo ser estos los valores ideales y la clasificación más eficiente que encontró el programa (gráfica 20 y tabla 12), las otras tres estaciones que no entran en la nueva clasificación Alameda, calle 53 y TV 91 pueden presentar valores similares, como se ha visto en los métodos anteriores, lo que comprueba que las metodologías implementadas anteriormente coinciden en los resultados arrojados para la variable estación. Con respecto a los años, solo se realizaron dos intentos pues arrojo el mismo resultado, esta clasificación no cuenta con los años 2009 y 2013, pues son los años que menor información presentan, se puede ver que el año 2009 clasifica su información en 2010 y 2012, el 2010 en los años 2010 y 2013, esto sucede ya que el programa ajusta las clasificaciones a la calidad de los datos organizándolos donde mejor se agrupan. Esta variable no aporta gran significancia al estudio en el rio salitre. Para la variable observaciones, la metodología de la red neuronal nos afirma que en su nueva clasificación, la información de la muestra del test se agrupan en nublado y soleado, donde aporta en gran medida al estudio pues las otras metodologías excluyen en sus resultados, lluvia o vacío (entendido como N/A en el estudio). Se deduce entonces que si la muestra se toma un día lluvioso o nublado, está en la mayoría de los casos la clasificará como Nublado, el día que se toma la muestra siendo soleada se clasifica al 100% en la misma categoría, sin clasificarla en otro grupo, la información vacía (N/A) o que no fue registrada se clasifica en nublado. Por ende, como se dedujo para el río Torca, los días nublados serán claves para realizar las mediciones pues es esta condición climática la que da más variabilidad a las concentraciones de los parámetros fisicoquímicos y biológicos.

66

Para la variable meses donde se realizaron tres intentos, se puede ver que la información se clasifica en general en el último trimestre del año (octubre, noviembre y diciembre), donde la mayoría de datos se organizan en el mes de noviembre, esto se puede dar a que es el trimestre del año donde más se registra información, pues el estudio para la RCHB no tomo la misma cantidad de muestras todos los meses, lo que puede alterar el resultado. Estos resultados concuerdan en parte con los resultados del río Torca, en donde se demostró que medir en el último cuatrimestre del año se puede registrar mayor variabilidad de los parámetros que se están midiendo, y así, ahorrar costos para no tener que medir todo el año.

67

7. PROPUESTA DE MEJORA

Para la optimización de una red de calidad hídrica deben tenerse en cuenta tres puntos fundamentales:

 Puntos de muestreo  Frecuencia de monitoreo  Parámetros que se medirán.

Los parámetros en este estudio están establecidos por El Decreto 5731 de 2008, por lo cual debe establecerse el mínimo de 10 parámetros, pero, para un estudio más amplio se podrían tener en cuenta parámetros como temperatura, caudal u otro de los 34 parámetros registrados en los monitoreos pasados para este estudio.

La frecuencia de monitoreo representa un costo elevado por los recursos que esta requiere, donde la red de calidad hídrica debe enfocarse en la importancia de la calidad y cantidad de datos, por ello, para determinar el día de medición, teniendo en cuenta que según el método de Kruskal Wallis, se establecieron los días de medición teniendo en cuenta el rango de variación de las concentraciones de los parámetros (días en donde se registran valores que se alejan de la media de concentración) y la cantidad de información que existe de cada día de medición, ya que, esto determinará el comportamiento que tiende a tener el parámetro en los puntos de monitoreo.

Días de medición Río Río Salitre Torca Miércoles Lunes Viernes Miércoles Sábado Sábado

La variación que se da entre días no es muy marcada, sin embargo, en aquellas pequeñas diferencias entre los rangos de cambio de los valores registrados, se determinó que los días expuestos previamente, son los más óptimos, teniendo en cuenta que el lunes y miércoles son días claves en las actividades industriales y comerciales de la zona y así contrastar con días de baja actividad (viernes y sábado)

Para el mes, como se explicó en la sección de conclusiones, se debe tener en cuenta el comportamiento bimodal del clima de la ciudad, teniendo en cuenta que la precipitación es una de las variables que más influyen en los cambios de concentración de los parámetros fisicoquímicos y biológicos. Se establecen entonces meses en temporada seca (febrero, marzo y diciembre) y meses en temporada fría (septiembre y octubre) para realizar las mediciones.

68

Meses de medición Río Salitre Río Torca Febrero Marzo Octubre Septiembre Noviembre Octubre Diciembre Diciembre

Dos semanas de cada uno de los meses mencionados anteriormente, con dos muestras diarias compuestas (duración de dos horas) para cada punto, de 6:00 a.m a 8:00 a.m y de 4.00 p.m a 6:00 p.m, esto teniendo en cuenta las condiciones de inseguridad que se dan al medir en horas de la madrugada (como se hacía anteriormente) sin tener variaciones significativas en las concentraciones registradas.

La mayor cantidad de datos anuales (192 datos para el río Torca y 240 para el río salitre) permitirá tener mayores registros para alimentar la red neuronal artificial y así codificar con instrucciones más rigurosas el algoritmo, obteniendo resultados aún más puntuales.

Los puntos de monitoreo del estudio son 4 estaciones para el río Torca y 6 estaciones para el río salitre y después del desarrollo del estudio, se consideró que:

1. Para el río Torca se cambiaron los puntos originales de monitoreo (adición de la estación calle 161 y la localización de los anteriores puntos). En general, aunque la calle 161 y jardines de paz tengan tanta similitud, son clave ya que la calle 161 está ubicado en un punto de alta influencia antrópica y jardines de paz es la estación que se encuentra en la entrada del afluente al humedal torca y sirve para comparar las concentraciones de los parámetros registrados por la estación San Simón, en el punto de salida del humedal con los datos de entrada. 2. Para el río Salitre, la similitud de registros se dan en las estaciones calle 53, TV91 y Alameda (como se ha mencionado a lo largo del estudio). El análisis de la red neuronal artificial ha arrojado que ninguna de las estaciones que se acaban de mencionar son necesarias pues con las tres estaciones restantes se obtendrían los mismos datos. Por ello, se establece que no se tomará en cuenta la estación calle 53, teniendo en cuenta los resultados del análisis geoestadístico, está ubicado en un punto en donde las concentraciones tienden a mantenerse en el mismo rango en los que registra Carrefour – AV68. Las estaciones Alameda y TV91 están antes del humedal juan amarillo y después del mismo, por lo que pueden ser consideradas como estaciones de control. De igual manera, es recomendable contar con la información nuevamente la estación PTAR (descontinuada de la red en el 2010) para poder determinar cuáles son las variaciones de las concentraciones después del tratamiento.

69

Al verificarse las metodologías sobre la información obtenida de la RCHB, se puede decir que se necesitan otros factores para mejorar el análisis de datos, como la estimación de cargas de los vertimientos realizados a lo largo de los ríos Torca y Salitre, ya que se necesitan conocer en algunos tramos las descargas permanentes que se generan para un análisis más profundo, y con ello el estudio arrojaría resultados que aporten a determinar mejor la calidad del agua si se hacen estudios de estos vertimientos1.

Así mismo, teniendo en cuenta que la variable observaciones influye en la variación de los datos, más específicamente la categoría “nublado”, se podría tener más certeza de cómo influye la precipitación si se agrega esta información a la base de datos para su posterior análisis, dejando solo dos variables tiempo seco y húmedo para no generar confusiones en las bases de datos.

Al tener en cuenta que la información necesita ser confiable en un 100% para la implementación de un sistema de tratamiento de datos (como la red neuronal) es necesaria la constante capacitación del personal que realiza la recopilación de la información generada por la red de calidad hídrica, para disminuir error de registro y que la información describa la situación real de los cuerpos de agua en estudio.

1 el cual estudia la frecuencia acumulada de los datos históricos de flujo durante un periodo determinado. Una curva de caudales relaciona los valores de caudal con el porcentaje de tiempo en que esos valores se han alcanzado o excedido. [73]

70

8. RECOMENDACIONES

1. Se recomienda en primera instancia aplicar lo propuesto en la optimización 2. Se sugiere verificar que la red neuronal artificial es un método viable para los otros dos cuerpos de agua del sistema hídrico de la ciudad (río Tunjuelo y río Fucha). 3. A medida de que se recolecten mayor número de datos, se pueden mejorar las instrucciones de la red neuronal artificial, aplicando el “backpropagation algorithm” para obtener resultados más precisos. 4. El trabajo de ser aplicado puede reducir costos por la remoción de la estación del río Salitre, lo cual reduciría gastos de medición en campo y al aumentar el número de mediciones, se obtendría una idea más real de la calidad de agua de ambos ríos.

71

9. CONCLUSIONES

A lo largo del desarrollo del proyecto, se concluyó que la variable mes no aporta significativamente a la variabilidad de los datos registrados. Sin embargo, teniendo en cuenta el carácter bimodal del clima en la ciudad de Bogotá, es importante tener en cuenta meses representativos de cada época (temporada seca (febrero, marzo y diciembre) y meses en temporada fría (septiembre y octubre).) a la hora de plantear la continua mejora de la red de calidad hídrica. La variable día así mismo, para ambos ríos, no influye directamente en el cambio de concentraciones de los parámetros fisicoquímicos y biológicos, pero para establecer la frecuencia, por medio de los boxplot se pudo determinar qué día podría ser clave la medición.

En el caso específico de la variable observaciones, la cual se clasifica en lluvia, N/A, soleado y nublado se concluyen de las metodologías descartan la opción de N/A en primera instancia ya que no hay gran cantidad de datos clasificados en esta categoría. Para la categoría “lluvia”, los datos registrados con esta característica se clasifican entre las dos categorías dominantes (soleado y nublado), excluyéndola por su baja influencia en la información registrada. Siempre existirá un umbral de error por parte del observador ya que por razones de olvido o distracción, no se registra la información correctamente, así mismo, pasa con algunos valores de los parámetros fisicoquímicos y biológicos en la base de datos

El método de Kruskal Wallis determinó que la variable más significativa es la estación, ya que es una variable que nos ayuda a determinar el comportamiento de los cuerpos de agua en cuestión en zonas de alto impacto por actividades antrópicas, como es en el caso del rio salitre que se tienen estaciones aguas arriba del rio y estaciones antes de ser tratadas en la PTAR, mostrando todo el comportamiento del rio a lo largo de la ciudad, ya que allí fueron ubicadas por problemáticas ambientales puntuales.

El río Salitre con la ayuda de las metodologías planteadas para ahorrar costos, y tiempo; podría sólo tener en cuenta cinco de las seis estaciones establecidas, dejando como referencia las estaciones Río arzobispo (estación fija), Parque Nacional, Carrefour AV 68, Alameda (estación fija) y tomar una de las dos que tienen similitud de datos, Calle 53 o TV91, pues estas estaciones son ubicadas en zonas residenciales por ende aportan una información parecida.

Para el río Torca se dedujo que de las cuatro estaciones con las que cuenta, la información de la estación Jardines de paz es muy similar a la registrada por la estación Calle 161 y San Simón, por temas de cercanía entre puntos de muestreo. Sin embargo, no se puede considerar la eliminación de esta estación ya que es un punto clave del trayecto del río, puesto que allí es donde el río torca y el humedal

72 de Torca y Guaymaral convergen; además, el río Torca en el año 2009 contaba con solo 3 estaciones, las cuales no lograban registrar de la manera más óptima, por ello, se consideró la implementación de otra estación.

El análisis jerárquico es un método que evalúo la relación entre parámetros fisicoquímicos, posterior a ello, al generarse los dendogramas el criterio del evaluador genera las clasificaciones de los grupos de parámetros. El análisis jerárquico no establece relaciones entre parámetros de acuerdo a sus características fisicoquímicas sino a los valores registrados; por lo que no debe establecerse como un único criterio de decisión y debe ser complementado con otros métodos para el análisis final del comportamiento de la información. El método ayudo a determinar que en el parámetro coliformes es independiente a los demás parámetros.

El análisis geoestadístico permitió ver el comportamiento espacial de los parámetros fisicoquímicos y biológicos por una característica de temporalidad (mensual multianual), con el fin de ver la distribución de la información registrada a nivel promedio. Este análisis fue de gran ayuda para ver cómo era el fenómeno de dispersión de las concentraciones de los parámetros a lo largo de los dos ríos, donde se puede observar y corroborar los demás métodos, ayudando así a complementar el análisis general del estudio.

Para el río Torca, al momento de realizar las interpolaciones, se usó el método IDW ya que con el método Kriging las interpolaciones no tenían en cuenta los rangos establecidos y salía una imagen unicolor; esto podría ser porque no se tiene gran cantidad de puntos de muestreo, así como el distanciamiento entre puntos que no es muy grande. En el caso del rio salitre al contar con mayores puntos de muestreos fue posible usar el método Kriging y IDW, los cuales mostraron similitud.

Al realizar el análisis de discriminantes de forma individual, se evidenció que la clasificación variaba para las variables estación y observaciones, concluyendo que para el río Torca se necesitan sólo 3 estaciones y para el río salitre 5 estaciones, para medir lo que se hace actualmente. En definitiva, En este método se determinan los pesos de cada parámetro y esto permitió determinar la importancia de cada una de las variables, ya que gracias a la reclasificación/readecuación de la información, las variables se evaluaron inter-grupalmente, permitiendo así determinar el comportamiento de los datos registrados y así, generar las conclusiones del presente estudio.

La red neuronal artificial es el modelo de clasificación considerado el valor agregado de este estudio. Cuando se llevó a cabo este método, se expuso a la variación de la información, ya que el algoritmo debe correrse más de una vez para cada una de las variables, y esto incurrió en que de todas las veces que se corrió el código, permitiera escoger la clasificación que mejor se adaptara a los resultados arrojados por otros métodos. Este método tiene muchas ventajas como la auto organización

73 de la información de entrada que el programador aporta así como la flexibilidad a la hora de entrenar el algoritmo. En conclusión, la red neuronal artificial arrojó una buena clasificación, que para cuando se tenga más información de las mediciones de la red de calidad hídrica, el programa pueda tener instrucciones más complejas de clasificación y así obtener clasificaciones aún más acertadas. Para este estudio función la red neuronal artificial con los comandos más básicos, arrojando resultados que se asemejan al análisis lineal de discriminantes, con menos sesgos entre interacciones.

La metodología de las redes neuronales al simular las conexiones del cerebro humano, puede manipular su información para una toma de decisiones y poder resolver problemas, por ello este método es muy útil al tener el control la persona que codifique el algoritmo, y con ello, se pueden obtener los resultados más exactos al ser el controlador quién da las ordenes de función. Uno de los casos más particulares en este estudio fue el comportamiento aislado de coliformes fecales, lo que complicaba el análisis de resultados al ser comparado con los demás parámetros; lo que se puede concluir es que el método de RNA para coliformes fecales realizó un ajuste para que se pudiera hacer en análisis, determinando que la muestra microbiológica era tan alta que no tenía relación con los otros parámetros, y que actuaba diferente de acuerdo a su origen (actividades antrópicas).

El método estadístico que arrojó la mejor re clasificación de la información tratada fue la red neuronal artificial, ya que tuvo un error menor a la hora de generar los resultados finales, así como estos eran mucho más fáciles de interpretar.

Así mismo, se comprobó que las metodologías empleadas en el estudio de los ríos Fucha y Tunjuelito para la optimización de la red de calidad hídrica de Bogotá (análisis clúster, análisis lineal de discriminantes, análisis geoestadístico) funcionaron adecuadamente con los datos del presente estudio, interpretando que son eficientes para la optimización de la red hídrica del río.

74

BIBLIOGRAFÍA [1 Universidad Fransisco jose de Caldas. (2015) Universidad Fransisco jose de ] Caldas. [Online]. https://www.udistrital.edu.co/universidad/colombia/bogota/caracteristicas/

[2 Secretaria Distrital de Ambiente. (2015, septiembre) Informe Tecnico No. ] 01575. [Online]. http://www.ambientebogota.gov.co/c/document_library/get_file?uuid=698885eb -239e-4c23-89ca-99d18bef5865&groupId=586236

[3 Corporación Autónoma Regional, "Adecuación hidráulica y recuperación ] ambiental río Bogotá," Bogotá D.C,.

[4 Ericka Johanna Díaz Mendivelso, Mauricio Ruíz Flores, and Jennifer Alejandra ] Suárez Silva, "Aguas residuales del río Salitre, como una cuestión sociocientífica para el fortalecimiento del pensamiento crítico en docentes en formación inicial," Bogotá D.C, 2014.

[5 Secretaría Distrital de Ambiente. (2008, Agosto) Red de calidad hídrica. ] [Online]. http://ambientebogota.gov.co/red-de-calidad-hidrica

[6 Universidad Pontificia Bolivariana, "Red de Monitoreo Ambiental en la Cuenca ] Hidrográfica del Río Aburrá - Medellín en Jurisdicción del área Metropolitana - Fase III," Medellín, 2011.

[7 World Health Organization, Water Quality Monitoring - A practical guide to the ] design and implementation of freshwater quality studies and monitoring programmes. Ginebra, 1996.

[8 Water Quality Monitoring Program Design. Perth Western, 2009. ]

[9 Raziyeh Farmani, Godfrey Walters, and Dragan Savic, "Evolutionary multi- ] objective iptimization for the design and operation of water distribution network: total cost vs reliability vs water quaility," Exeter, 2006.

[1 N B Harmancioglu, Y Icaga, and A Gul, "The use of and Optimization Method In 0] Assessment of Water Quality Sampling Sites," Izmir, 2004.

75

[1 Kijin Nam, "Optimization of Paths and Locations of Water Quality Monitoring 1] Systems in Surface Water Enviroments," Georgia, 2008.

[1 Agustín Alejandro Moreno Tovar, Mauricio Toro Botero, and Luis Fernando 2] Carvajal, "Revisión de criterios y metodologías de diseños de redes para el monitoreo de la calidad del agua en ríos.," Medellín, 2008.

[1 Universidad del Valle, "Conceptos básicos de la contaminación del agua y 3] parámetros de medición," Cali, 2002.

[1 Universidad de Catambria, "La contaminación del agua," Catambria,. 4]

[1 Luis Echarri, "Contaminación del agua," Pamplona, 2007. 5]

[1 National Intitute of Open Schooling, "Water pollution," New Delhi,. 6]

[1 Secretaria Distrital de Ambiente.. (2008) calidad del recurso Hidrico. [Online]. 7] http://ambientebogota.gov.co/documents/10157/220042/calidad_del_recurso_h idrico2008.pdf

[1 Julian Pérez Porto and Ana Gardey. (2009) deficiones. [Online]. 8] (http://definicion.de/optimizacion/)

[1 Universidad Nacional Abierta y a Distancia. (2014) Fundamentos de 9] Optimización.. [Online]. http://nuyoo.utm.mx/~jjf/rna/guia_foe.pdf

[2 Internation Institute For Sustainable Development, "Water Quality Monitoring 0] System Design," Winnipeg, 2015.

[2 World Metereological Organization, "Planning of Water Quality Monitoring 1] Systems," Geneva, 2013.

[2 World Meteoreological Organization, "Planning of Water Quality Monitoring 2] Systems," Geneva, 2012.

[2 G. Asadollahfardi, "Water Quality Management," 2015. 3]

76

[2 Autoridad Nacional del Agua - DGCRH, "Protocolo de Monitoreo de la Calidad 4] de los Recursos Hídricos ," Lima,.

[2 Javier Andrés Escobar Pintor and Nataly Moreno Dueñas, "Determinación de 5] los coeficientes de oxigenación y desoxigenación para la curva de comportamiento de oxígeno disuelto del río Fucha," Bogotá, 2016.

[2 Ministerio de Desarrollo Social y Medio Ambiente. (2014) Diseño de redes de 6] monitoreo,estadísticas, precisión de las determinaciones analíticas, control de calidad. [Online]. http://www.ingenieroambiental.com/7/manual05.pdf

[2 Jardín Botánico José Celestino Mutis, "Proyecto No. 410 PEL: COMUNIDAD 7] REALIZACIÓN DE ACCIONES DE SENSIBILIZACIÓN A LA ENTORNO AL CUIDADO DE LA CUENCA DEL RÍO SALITRE," Bogotá D.C,.

[2 CORPORACION AUTONOMA DE CUNDINAMARCA. (2005) Plan de 8] Ordenación y Manejo Ambiental de la cuenca de río Bogotá. [Online]. https://www.car.gov.co/index.php?idcategoria=11553&download=

[2 SDA (Secretaria Distrital de Ambiente), "Recorrido por el río Salitre hizo la 9] secretaría Distrital de Ambiente para verificar su estado," EL TIEMPO, julio 2008.

[3 Secretaría Distrital de Ambiente. Ríos, Quebradas y Canalas - Alinderamiento 0] de Quebradas. [Online]. http://ambientebogota.gov.co/rios-quebradas-y- canales

[3 Ellie Marie López Barrera, Ángela María Plata Rangel, and Milena M Fuentes 1] Cotes, Humedal Torca-Guaymaral: Iniciativas para su conervación. Bogotá D.C: Fondo de Publaciones Universidad Sergio Arboleda, 2015.

[3 Kun Mei et al., "Optimization Water Quality Monitoring Networks Using 2] Continuos Longitudinal Monitoring Data: A Case os Study of Wen-Rui Tang River, Wenshou, China," Wenshou, 2011.

[3 Toskano Hurtado and Bruno Gérard. (2014) El proceso de analisis jerárquico 3] (AHP) como herramienta para la toma de decisiones en la selección de proveedores. [Online]. http://sisbib.unmsm.edu.pe/bibvirtualdata/tesis/basic/toskano_hg/cap3.pdf

77

[3 Universidad de Granada, "Ejemplos de Análisis Clúster ," Granada,. 4]

[3 Escuela Superior Politécnica del Litoral, "Marco teórico Conceptual de la 5] Geoestadística," Quito,.

[3 Ramon Giraldo Henao. (2013) Introducción a la geoestadistica.. [Online]. 6] http://www.docentes.unal.edu.co/rgiraldoh/docs/LIBRO%20DE%20GEOESTA DISTICA.pdf

[3 Geoff Bohling, Kriging. Lawrence, 2005. 7]

[3 Jorge Zavaleta Sánchez, "Kriging: Un método de interpolación sobre datos 8] dispersos," México D.F, 2010.

[3 Department of Cartography and Geoinformatics, Kriging Interpolation. 9] Nagyszombat, 2008.

[4 Escuela de Ingeniería de Minas. (2014, agosto) Conceptos construccion del 0] MDE. [Online]. http://www6.uniovi.es/

[4 Santiago de la Fuente Fernandez. (2011, agosto ) Universidad Autonoma de 1] Madrid. [Online]. http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACION /DISCRIMINANTE/analisis-discriminante.pdf

[4 Antonio Vaamonde Lise, Aldo Barreiro Felpeto Castor Guisande González, 2] Tratamamiento de datos con R, STATISTICA y SPSS.: Diaz de Santos, 2011.

[4 Cástor Guisande Gonzáles, Antonio Vaamonde Liste, and Aldo Barreiro 3] Felpeto, Tratamiento de datos con R, Statistica y SPSS.: Díaz de Santos, 2011.

[4 UNIVERSIDAD COMPLUTENSE DE MADRID. Analisis Discriminante :El 4] procedimiento discriminante. [Online]. http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/ma teriales/analisis_datosyMultivariable/23discr_SPSS.pdf

78

[4 Pol A. Palmer and J. Montaño Moreno, "¿Qué son las redes neuronales 5] artificiales? Aplicaciones realizadas en el ámbito de las adicciones," ADICCIONES, vol. 11, no. 3, p. 14, 1999.

[4 Damián Jorge Matich, "Redes Neuronales: conceptos básicos y aplicaciones.," 6] Rosario, 2001.

[4 Jure Zupan, "Introduction to Artificial Neuronal Network (ANN) Methods: What 7] They Are and How to Use Them," Tarragona, 1994.

[4 Sorin Vlad, "On the prediction Methods Using Neural Networks," Suceava, 8] 2005.

[4 Archana Sarkar and Prashant Pandey, "River Water Quality Modelling using 9] Artificial Neural Network Technique," Uttarakhand, 2015.

[5 S. S. Panda, V. Garg, and I. Chaubey, "Artificial Neural Networks Application in 0] Lake Water Quality Estimation Using Satellite Imagery," Arkansas, 2004.

[5 I. Zaheer and C. G. Bar, "Application of Artificial Neural Network for Water 1] Quality Management," Lowland Technology International , vol. V, no. 2, p. 6, 2003.

[5 Wen Ching-Chung and Lee Chih-Sheng, "A neural network approach to 2] multiobjective optimización for water quality management in a river basin.," Water Resources Research, vol. 34, no. 3, p. 9, March 1998.

[5 John Quick. (2011, Enero) R-Bloggers. [Online]. https://www.r-bloggers.com/r- 3] tutorial-series-one-way-anova-with-pairwise-comparisons/

[5 John H. McDonald, "Handbook of Biological Statistics," Baltimore, 2008. 4]

[5 The Pennsilvania State University. Cluster Analysis. [Online]. 5] http://sites.stat.psu.edu/~ajw13/stat505/fa06/19_cluster/09_cluster_wards.html

[5 Tal Galili. (2013, Enero) R-bloggers. [Online]. https://www.r- 6] bloggers.com/scatterplot-matrices/

79

[5 Antony Unwin, Graphical Data Analysis with R.: CRC Press, 2015. 7]

[5 Andrea del Pilar Gónzales Torres , "Evaluación de la caga de fósforo al río 8] Bogotá relacionado con el uso de detergentes en la capital," Universidad de los Andes, Bogotá D.C, Tesis de pregrado 2005.

[5 Francisco Fuentes and Arturo Massol-Deyá, "Manual de laboratorios: ecología 9] de microorganismos," Mayagüez, 2002.

[6 Juan María Fornés Azcoiti, "La Geologia e Hidrogeologia en la Investigacion de 0] Humedales," Madrid, 2009.

[6 G Ramón and G Moya, "Evolución del contenido de oxígeno disuelto en las 1] aguas de los embalses de la serra de Tramuntana (Mallorca) estudio comparado," Mallorca, 1984.

[6 María Dolores Curt Fernández de la Mora, "Fitodepuración en humedales: 2] conceptos generales.," Pontevedra,.

[6 Ninoschtka Freire Morán, "Demanda biológica de oxígeno: calidad de agua," 3] Guayaquil,.

[6 Viglemira Poloche Rojas, "Revisión de la documentación existente sobre las 4] áreas de protección de la zona de influencia del río frío en Chía y el río torca en el norte de Bogotá," Bogotá D.C, 2015.

[6 Luz Edith Barba, "Conceptos básicos de la contaminación del agua y 5] parámetros de medición," Santiago de Cali, 2002.

[6 Adam Sigler and Jim Bauder, "Well educated: educación en el agua de pozo," 6] Universidad Estatal de Montana, Bozeman, Documento informativo.

[6 María Isabel Toapanta Vera. Repositorio de ESPOL. [Online]. 7] https://www.dspace.espol.edu.ec/bitstream/123456789/6161/8/GRASASYACEI TES.pdf

[6 Gloria Lucía Cárdenas Calvachi and Iván Andrés Sánchez Ortiz , "Nitrógeno en 8] aguas residuales: orígenes, efectos y mecanismos de remoción para preservar el ambiente y la salud pública," Universidad y Salud, vol. XV, no. 1, 2013.

80

[6 Ciencia y Tecnología para el Desarrollo, "Indicadores de contaminación fecal 9] en aguas," Texmelucan, 1996.

[7 Gudberto J. León , "Apuntes de métodos estadísticos I," Mérida,. 0]

[7 Antonia Guillén Serra, Ágata Carreño Serra, and Neus Canal Díaz, "Fases del 1] análisis estadístico de los datos de un estudio," Bogotá,.

[7 Carolina Peña Guzmán, "Procesos de monitoreo a la calidad hídrica del río 2] Bogotá realizados por la Corporación Autónoma Regional de Cundinamacar - CAR -," Bogotá D.C, 2010.

[7 Canadian Water Quality Guidelines for the Protection of Aquatic Life, "CCME 3] WATER QUALITY INDEX 1.0 User’s Manual," Alberta, 2001.

[7 Agung Setianto and Tamia Triandini, "COMPARISON OF KRIGING AND 4] INVERSE DISTANCE WEIGHTED (IDW) INTERPOLATION METHODS IN LINEAMENT EXTRACTION AND ANALYSIS," Gadjah Mada University, 2013.

[7 Superintendencia de Sociedades, "Desempeño del sector de minería 2012- 5] 2014 informe," Bogotá D.C, 2015.

[7 IDEAM. (2007) protocolo para el monitoreo y segumiento del agua. [Online]. 6] http://documentacion.ideam.gov.co/openbiblio/bvirtual/021172/Protocoloparael monitoreoyseguimientodelagua.pdf

[7 Takur Dahiro, "P – VALUE, A TRUE TEST OF STATISTICAL SIGNIFICANCE? 7] A CAUTIONARY NOTE," Zaria, 2008.

[7 Environmental Systems Research Institute. Comparar métodos de 8] interpolación. [Online]. http://desktop.arcgis.com/es/arcmap/10.3/tools/3d- analyst-toolbox/comparing-interpolation-methods.htm

81