Modelo Estimativo del Tiempo Entre Estaciones en el TransMilenio

Camilo Sandoval Ardila

CAPÍTULO 1. INTRODUCCIÓN

La simulación es una herramienta que permite representar parte de la realidad y evaluar alternativas modificaciones de algún aspecto y ver la respuesta de un sistema a dichos cambios (Pursula, 1999). Sin embargo, realizar un modelo que refleje la realidad, en la disciplina del transporte, no es una tarea sencilla por la complejidad de sus sistemas. Previamente se necesita identificar todos los elementos, actores y variables relevantes en el sistema y entender en buena medida como interactúan para el resultado. Usualmente en la ingeniería de transporte, los simuladores de eventos discretos son utilizados para la simulación del tráfico a escala micro, pero rara vez se utilizan para simular sistemas de transporte completos de una ciudad.

El TransMilenio, el BRT de Bogotá, es un sistema que usualmente se modela por medio de modelos macro (agregados) que predicen flujos. La empresa TransMilenio S.A cuenta con su propio modelo macro en el Software Emme. Este modelo le permite a la empresa predecir la demanda futura por medio de las asignaciones en la red de matrices origen-destino. Con ese aumento estimado, se diseña la operación en otro software diferente. Para este tipo de situaciones de transporte, los modelos de simulación discreta han sido poco utilizados.

A pesar de esto, desde 2012, el profesor Ciro Amaya de Ingeniería Industrial de la Universidad de los Andes, ha liderado el diseño de un simulador de eventos discretos de todo el sistema TransMilenio en el software Arena. Lo particular de este modelo, a diferencia de los modelos utilizados por TransMilenio previamente expuestos, es que permite, entre otras, simular a cada usuario que ingresa al sistema, cada bus que se despacha y la decisión de la ruta de cada usuario. De esta forma el tiempo de espera de los usuarios, las colas en las estaciones y la carga de cada bus puede ser estimada con mucho detalle por este simulador. Esto significa que este modelo es más detallado y permite arrojar resultados que el modelo del TransMilenio no puede. Para un buen funcionamiento, el modelo necesita algunos submodelos que logren representar de forma más fidedigna la realidad. Por ejemplo, el modelo cuenta con un submodelo que logra estimar el tiempo de detención de un bus

en una estación en función de abordajes, desabordajes y ocupación del bus. A pesar de modelar correctamente la operación, hoy en día, existen algunos algoritmos que no permiten que el modelo arroje resultados reales.

Uno de los submodelos que se deben mejorar es la velocidad de los buses. El modelo asigna una velocidad media espacial de operación constante de 25 km/h para cada uno de buses que son despachados sin importar la troncal o la ruta que está tomando. Con esta velocidad, el modelo se permite calcular los tiempos de espera, de recorrido y demás, utilizando la distancia entre estaciones. Sin embargo, en la vida real esto no es cierto. Existen múltiples factores que infieren en la velocidad de los buses. Sin embargo, no existe una metodología o modelo que permita realizar una mejor estimación.

Por esta razón en este trabajo se presenta un modelo que logre encontrar una velocidad promedio de un bus por medio de distintos parámetros que se diferencian en la ruta o el corredor en el que el bus esté operando. La metodología implementada buscara, no encontrar la velocidad del bus, sino un tiempo de viaje entre dos estaciones. Con esto, calcular la velocidad resulta una tarea muy sencilla teniendo en cuenta que el modelo ya cuenta con las distancias entre estaciones.

CAPÍTULO 2. REVISIÓN DE LITERATURA

El tiempo total en un viaje de transporte público está constituido por varios elementos. Entre ellos están el tiempo de ingreso y egreso a la estación, los tiempos de espera, los tiempos de viaje y los tiempos de parada. Por esta razón, el desarrollo de modelos que permitan estimar tiempos de viaje han sido objeto de estudio en distintos trabajos en todo el mundo. Estimar el tiempo de viaje total en un mismo modelo es una tarea muy compleja dada la alta variabilidad de estos en la vida real. Por esta razón las investigaciones se han enfocado en estimar un elemento del conjunto.

C. Zhang y J. Teng (2013) desarrollaron un modelo con el fin de estimar el tiempo de parada de un bus y aplicaron el modelo a un caso de estudio en el sistema de buses públicos de Shanghái. Este modelo uso de datos históricos y reales de la flota de buses al igual que el presente trabajo. Los registros utilizados para el desarrollo del modelo fueron AVL (Automatic Vehicle Location) y APC (Automatic Passengers Counters). Con el primero fue posible determinar la ubicación de los bus (Sistema GPS) y con el segundo la cantidad de usuarios que ingresaban al bus en una determinada parada. El estudio se divide en una primera fase donde estima el tiempo que toma el ingreso y la acomodación de los pasajeros en el bus y una segunda, donde calcula el tiempo total de parada. En el

primer modelo se tiene en cuenta la cantidad de pasajeros que quieren ingresar al sistema, la ocupación actual del bus y la capacidad del mismo. En la segunda fase se incluyen otros factores como el tiempo que toma el abrir y cerrar puertas y el tipo de pago que presenta el bus. Se desarrolla una ecuación para buses donde el tiquete se paga al entrar al bus y es obligatorio entrar por la puerta delantera, y un segundo modelo para buses donde los usuarios pueden entrar por todas las puertas. Este segundo modelo, puede resultar en un complemento del modelo propuesto en el siguiente ensayo puesto que solo calcula el tiempo en el cual el bus esta en movimiento.

Por otro lado, Robert L. Bertini y Ahmed M. El – Geneidy desarrollaron un modelo en 2004 que buscaba estimar el tiempo de viaje de los buses en Portland, Oregón utilizando una base de datos de despachos. Este trabajo es muy similar al realizado en el presente informe puesto que la base de datos proporcionada es muy similar a la proporcionada por TransMilenio S.A y segundo, el modelo utiliza regresiones lineales. Esto quiere decir que, al igual que el trabajo de Zhang y Teng, los autores utilizan AVL para poder desarrollar su modelo. Sin embargo, Bertini y El-Geneidy encontraron modelos, no solo para el tiempo de recorrido, sino también, para el tiempo de espera del bus durante la carga y descarga de pasajeros. El modelo desarrollado en el presente informe se enfoca en el tiempo de recorrido mas no en el tiempo de espera del bus.

Existe otro proyecto en el cual se estudia los efectos de la congestión de los usuarios en el tiempo de viaje, velocidad de operación y el tiempo de espera (Tirachini, Hensher, & Rose, Crowding in public transport systems: Effects on users, operation and implications for the estimation of demand, 2013). Utilizan los servicios de bus público de Sídney, Australia para estimar el impacto de la congestión de usuarios en el tiempo de recorrido del bus. El mismo A. Tirachini, en otra investigación en el 2013, estudió el impacto de los métodos de pagos en el tiempo de viaje. En este, el autor evalúa la conveniencia de utilizar pago con tarjeta magnética (Tipo Tarjeta de Crédito), lector de tarjeta sin contacto (Método utilizado actualmente en el SITP), efectivo o compra de pasaje fuera de los buses para optimizar el tiempo de viaje. Con este, busca determinar el método de pago más eficiente y genere menos demoras.

Todos los ejemplos previamente expuestos son utilizados para poder estimar el tiempo de viaje total de los usuarios a partir de los elementos que lo componen. Como estos, existen infinitos otros que han llegado a diferentes tipos de modelos para sistemas de transportes públicos diferentes (Tren, Metro, BRT). A continuación, se presenta la metodología implementada para el sistema BRT TransMilenio.

CAPÍTULO 3. METODOLOGIA

3.1.1 Determinación del tiempo y las estaciones de parada del bus

La metodología planteada busca estimar la velocidad de los buses por medio del tiempo de viaje entre una estación 풊, a una estación 풋, que pertenezcan al Sistema de TransMilenio. Para esto se utilizó al igual que los trabajos mostrados en el CAPÍTULO 2 bases de datos con información AVL. Recordemos que AVL es un sistema de información que permite determinar la ubicación de los buses automáticamente. Se adquirió una muestra que consistía en la posición del bus de TransMilenio durante 13 días por instantes de tiempo muy pequeños o al realizar alguna acción como abrir puertas, cerrar puertas, prender o arrancar el bus, exceso de velocidad, etc. Esto se logró gracias al sistema de GPS que cada bus del TransMilenio tiene instalado. A continuación, se puede apreciar una muestra de la base de datos que se obtuvo, así como la información que esta contiene.

Figura 1. Muestra de la base de datos

De la información presentada en las tablas, se utilizaron las siguientes columnas:

• Tiempo: Fecha y Hora exacta en la cual se registró la posición del bus • Tipo: Evento realizado por el vehículo en el registro correspondiente. • Longitud: Longitud en coordenadas UTM • Latitud: Latitud en coordenadas UTM

Ahora bien, lo primero que se hizo fue separar por días todos los registros y se eliminaron todas las entradas que no se necesitaran. Para esto se tomaron los registros desde que abre puertas en una estación hasta que las cierra. Estas entradas incluyen el Tipo “Abrir Puertas” y “Cerrar Puertas”. Así, la base de datos paso de 27,402 a 1,115 registros. Con esta base de datos es posible determinar el tiempo que se demora de la estación 풊 (desde que cerró puertas) a la estación 풋 (hasta que abrió puertas). Por medio de las coordenadas y Google Maps, se determinó en que estación se encontraba el bus en cada entrada y con la secuencia de paradas del bus, se determinó la Ruta que estaba

sirviendo. A continuación, se aprecia otro ejemplo del procesamiento de datos planteado anteriormente.

Tabla 1. Muestra del primer procesamiento de datos.

Tiempo Tipo Longitud Latitud Estación Ruta 17/01/2017 6:57:43 Abrir puertas -74.16955 4.59729 Portal Sur B11 17/01/2017 6:58:32 Puertas cerradas -74.16955 4.59729 Portal Sur B11 17/01/2017 7:05:17 Abrir puertas -74.142453 4.595575 Venecia B11 17/01/2017 7:05:52 Puertas cerradas -74.142457 4.595575 Venecia B11 17/01/2017 7:07:29 Abrir puertas -74.134365 4.594262 Alquería B11 17/01/2017 7:07:54 Puertas cerradas -74.134372 4.594262 Alquería B11 17/01/2017 7:12:13 Abrir puertas -74.110393 4.597477 SENA B11

Al mismo tiempo que se encontró en que estación se encontraba el bus, se determinó la troncal en la que se encontraba utilizando el mismo sistema de numeración utilizado por el sistema de TransMilenio:

Figura 2. Nomenclatura utilizada por TransMilenio S.A

El resultado final del procesamiento de datos fue una base de datos con distintos parámetros que podrían afectar el tiempo de recorrido del bus. A continuación, se explica cada uno de estos parámetros y como se obtuvieron.

3.1.2 Determinación de la distancia entre estaciones

Para determinar la distancia entre dos estaciones no basta con determinar la distancia cartesiana entre las dos coordenadas ya que las vías del TransMilenio no siguen líneas rectas de estación a estación. Por esta razón, fue necesario utilizar otra base de datos con el nombre de “Tabla Maestra de Servicios Troncales” proporcionada por TransMilenio SA. En esta base de datos se encontró la distancia que recorre un bus entre estaciones dependiendo la ruta que este tiene. Dependiendo de la ruta que se está haciendo, el TransMilenio varía en el vagón de parada, y el camino que recorre. El H73 y el J70 son dos rutas que salen de la troncal Norte y tienen parada en la Avenida Jiménez. Sin embargo, el primero utiliza el corredor de la Caracas mientras que el segundo el de la

Carrera 30 y sus distancias recorridas son distintas. En la Tabla 2, se muestra las distancias Acumuladas (m) y no Acumuladas (m) que un bus recorre haciendo la Ruta M47. Podemos apreciar que junto al nombre de la estación se encuentra el vagón donde debe parar el bus.

Tabla 2. Ejemplo de la ruta M47 obtenido por medio de la base de datos

Estación Distancia (m) Distancia Acumulada (m) Portal Sur T2 - 0 Perdomo B - 3 848 848 Madelena B - 3 934 1,782 Sevillana A - 3 1,025 2,807 Venecia A - 3 570 3,377 Alquería B - 3 1,051 4,428 NQS Calle 38A Sur B - 3 1,103 5,531 NQS Calle 30 Sur A - 3 602 6,133 Guatoque-Veraguas A - 2 ó 5 3,261 9,394 Tygua - San José A - 2 ó 5 800 10,194 San Victorino C - 3 1,900 12,094 Las Nieves A - 3 550 12,644 San Diego B - 4 ó 6 700 13,344 Museo Nacional A - 2 ó 5 540 13,884

Se puede complementar esta base de datos con la previamente mostrada en este informe para poder tener de un par de estaciones 풊,풋 un tiempo en segundos y una distancia en metros.

3.1.3 Determinación de otros parámetros.

Existen otros aspectos muy importantes que pueden afectar el recorrido de un bus. En un proceso de análisis con el asesor de la tesis y después de revisar la literatura, se pudieron determinar algunos de esos parámetros. La cantidad de semáforos y de estaciones intermedias son factores que pueden aumentar tiempo de trayecto del bus. Es muy común que en estaciones se formen colas de buses lo que generan cogestión en ese tramo. Por esta razón, se determinaron estos dos parámetros para todos los pares de estaciones.

Un último parámetro que se tuvo en consideración fue la hora de la parada del bus. Este parámetro es muy importante porque una gran cantidad de buses en servicio genera mayor congestión en los corredores generando atrasos adicionales. En horas pico, es necesario maximizar la oferta para suplicar la alta demanda de usuarios. Al aumentar los servicios, la probabilidad de que dos o más

buces lleguen a una misma estación y paren en el mismo vagón es muy alta y por ende deben esperar generando trancón en la flota que viene detrás.

Con el fin de regular la flota de buses activa, TransMilenio habilita de forma proporcional a la demanda los servicios activos. Esto quiere decir que, entre más demanda, más buses estarán circulando y entre menos demanda, mas buses irán a los patios. A continuación, se puede apreciar la distribución horaria de viajes del TransMilenio en un día normal en 2015.

Figura 3. Distribución horaria del TransMilenio en el 2016.

Con esta tabla se puede esperar que, en los picos, se genere más congestión y por ende los tiempos de viajes sean más largos. Ahora para poder ajustar esta distribución a la base de datos se generó una función discreta 풇(풕) dividendo todas las entradas por el valor máximo diario. Esto quiere decir que 풇(풕) varía entre 0 y 1.

1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 00:00 04:00 08:00 12:00 16:00 20:00

Gráfica 1. Función de Demanda

Lo que se busca con esta función es simular la demanda del sistema. Para tiempos donde 풇(풕) sea muy cercanos a uno, la congestión será mayor y se generaran demoras adicionales. Por el contrario, para 풇(풕) muy cercanos a 0, la congestión será nula y no se generarán demoras adicionales. El resultado obtenido de toda la información obtenida fue una base de datos de N = 494.

Tabla 3. Muestra de Base de Datos

Salida Llegada Rut tiempo Distancia Semáforo Día y hora Distribución Tronca Paradas a (s) (m) s l Intermedias Calle 72 Flores A52 80 357 2 19/01/2017 0.78827754 AA 0 7:13:43 Calle 72 Flores A52 83 357 2 20/01/2017 0.80909550 AA 0 7:09:57 Calle 76 Calle 72 A52 117 550 2 19/01/2017 0.79852412 AA 0 7:11:57 Calle 76 Calle 72 A52 83 550 2 20/01/2017 0.81421632 AA 0 7:08:08 Alcalá Prado G5 82 640 0 23/01/2017 0.97488277 BB 0 6:18:20 Calle 100 Calle 127 B12 202 2474 0 24/01/2017 0.98075874 BB 2 6:31:06 Calle 100 Calle 127 B12 263 2474 0 24/01/2017 0.4859007 BB 2 8:29:26

A continuación, se presenta una breve descripción de cada uno de los parámetros que pueden llegar a alterar el tiempo entre estaciones de los buses

• Salida: Estación donde el bus cerro puertas. • Llegada: Estación donde abrió puertas. • Ruta: Ruta Actual que el bus está recorriendo

• Tiempo: tiempo que tomo al bus desde que cierra puertas en la estación de salida y abrir puertas en la estación de llegada • Distancia: Distancia recorrida entre el vagón de la estación de salida y el vagón de la estación de llegada. • Semáforo: Cantidad de semáforos entre la estación de Salida y la estación de llegada. • Día: Hora y Fecha en la que el bus abrió puertas en la estación de llegada. • Distribución: Variable que mide la congestión del sistema dependiendo la hora. • Troncal: La primera letra muestra la troncal a la que pertenece la estación de salida. La segunda letra muestra la troncal a la que pertenece la estación de llegada. • Estaciones intermedias: Estaciones intermedias donde el bus no paro entre la estación de salida y la estación de llegada.

Luego de obtener la base de datos final, se procedió a obtener un modelo de regresión lineal multivariable, el cual es de la forma,

푓(푥1, 푥2, … , 푥푛) = 훽0 + 훽1푥1 + 훽2푥2 + ⋯ + 훽푛푥푛

Con este modelo se busca estimar una variable dependiente por medio de distintas variables independientes 푥1, 푥2, … , 푥푛. El objetivo de este modelo es estimar los coeficientes 훽0, 훽1, 훽2 … 훽푛. Para esto se utilizó el software R y su herramienta Linear Model (lm). Por medio del comando Summary se puede obtener una tabla como las mostradas en el 0. En primera instancia, la tabla esta discretizada en las distintas variables independientes del modelo. En la segunda columna está el valor del coeficiente para cada una de estas variables. En la siguiente columna se presenta el error estándar de dicha estimación. La tercera y cuarta columna muestra el valor de la prueba t y la probabilidad de que la estimación obtenida sea menor a 0. Por último, se obtiene una columna que mide la significancia de la variable en el modelo por medio de un sistema de clasificación de asteriscos. Una variable que presente 3 asteriscos, es aquella que es muy significante para el modelo. Al contrario, si la variable no presenta asteriscos, significa que la variable y su coeficiente no son significativos para el modelo. Podemos observar que las últimas dos columnas están relacionadas entre sí. Las variables muy significativas son aquellas que presentan probabilidades de ser menos a 0 casi nulas.

En la segunda sección del resultado de Summary muestra el coeficiente de determinación múltiple y ajustado. El coeficiente de determinación ajustado tiene en cuenta la cantidad de variables dependientes del modelo. En un modelo multivariable entre más variables dependientes se incluyan,

mayor será el coeficiente de determinación sin importar la significancia de estas variables. Esto supone un problema, puesto que la inclusión de una variable en un modelo necesita la estimación del mismo, aumentando así la dificultad de estimar el modelo, y al mismo tiempo logrando resultados menos o igual de convincentes. Este problema se resuelve por medio del coeficiente de determinación ajustado que cual castiga el coeficiente al aumentar el número de variable independientes.

Ahora bien, se siguieron dos enfoques distintos con el fin de realizar un análisis más profundo de los resultados obtenidos. El primero fue un modelo que logre estimar el tiempo para la totalidad del sistema. Por medio de este modelo se podría determinar el tiempo que tomaría a un bus de una estación 풊 a una estación 풋 que pertenezcan al sistema, independientemente de la troncal a la que pertenezcan. El Segundo enfoque es discreteando para cada troncal. En este, se estimó un modelo distinto para cada troncal. Sin embargo, solo se calcularon estos modelos para las troncales que se tuvieran suficientes datos para lograr una muestra significativa. Para cada modelo se partió con la premisa que la distancia, la cantidad de semáforos, la distribución y las estaciones intermedias eran variables significativas para la estimación del tiempo entre estaciones. Sin embargo, para aquellos casos donde la variable no lo fuera, se corrió un nuevo modelo sin esa variable.

CAPÍTULO 4. RESULTADOS

A partir del procesamiento de datos previamente expuesto, se logró obtener los siguientes resultados. En primera instancia como se mencionó anteriormente se realizó el modelo de todo el sistema. El resultado obtenido se encuentra a continuación.

Modelación Sistema Completo N = 494

Según estos resultados, todas las variables son significantes para el modelo. Sin embargo, la distancia y la cantidad de semáforos entre las estaciones son las variables más significantes. En segunda instancia, la cantidad de estaciones intermedias y la congestión del sistema (variable

Distribución) son variables menos significativas. En el CAPÍTULO 5 se extiende el análisis de los resultados.

Del segundo enfoque, realizando distintos modelos para cada una de las troncales se obtuvieron los siguientes resultados. El análisis de los mismos se encuentra en la sección 5.1.1.

Troncal de Suba N = 45

Troncal Del Norte N = 79

Troncal NQS Central N = 103

Troncal NQS Sur N = 181

CAPÍTULO 5. ANÁLISIS DE RESULTADOS. 5.1.1 Análisis de variables Independientes

La primera variable que se analizará es la cantidad de semáforos entre las dos estaciones. Para la troncal del Norte y la troncal de Suba, los modelos arrojan que la cantidad de semáforos no es significativa. Este resultado es lógico para la Troncal Norte puesto que, en casi la totalidad de su longitud, esta troncal no presenta semáforos (Estacón Terminal hasta Estación Calle 85). Sin embargo, en la troncal de Suba si existen semáforos regularmente en la totalidad del su tramo. Para esta troncal, la cantidad de semáforos sí debió ser significativa. Esta inconsistencia de los resultados se puede presentar dado la magnitud de la muestra que se usó para este modelo. De los datos proporcionados, solo 45 de estos iniciaban y terminaban en una estación perteneciente a esta troncal. Al mismo tiempo, muchos de estos datos contenían el mismo par de estaciones, disminuyendo así la diversidad de los datos. Al tener una muestra tan limitada, el modelo que se obtiene difícilmente puede considerarse representativa, puesto que la muestra tampoco lo es.

Por otro lado, la cantidad de semáforos es un parámetro que si afecta el tiempo de viaje en las troncales de la NQS Sur y la NQS Central. La significancia obtenida en estos modelos es de 3 asteriscos cada uno, lo cual nos muestra que la cantidad de semáforos es clave para determinar el tiempo de viaje. Según estos modelos, por cada semáforo que se presente, el tiempo de viaje aumentara 14.5 y 23.5 segundos respectivamente.

El segundo parámetro que se analizara son las estaciones intermedias entre cada parada. Con este parámetro se quería probar si en las estaciones se generaban congestiones a la hora de salida y entrada de los buses que, si paran en las estaciones, generando demoras en los buses que siguen su recorrido. Sin embargo, este parámetro solo es significativo para la troncal del Norte. Este parámetro está directamente relacionado con la cantidad de vagones de las estaciones y la longitud de las mismas.

Hoy en día, existen estaciones con dos o tres vagones y también existen vagones que permiten que uno o dos buses se detengan a cargar y descargar pasajeros al mismo tiempo. Las estaciones de la Pepe Sierra y la 142 tienen dos vagones cada uno con la capacidad de dos buses al mismo tiempo. Por otro lado, la 146 es una estación con dos vagones de un bus cada uno y una tercera estación inaugurada en 2016 con la posibilidad también de solo un vagón al mismo tiempo. Este tipo de estaciones son más susceptibles a generar congestión ya que en el caso que lleguen dos buses que paran en el mismo vagón al mismo tiempo, el segundo se ve obligado a esperar turno en el carril de sobrepaso obligando a los otros buses que usan este carril a detenerse y generar demoras.

La variable distribución buscaba simular la congestión del sistema. Sin embargo, podemos apreciar que en la mayoría de los modelos esta variable no fue significativa. Para la única que esta variable tiene alguna relevancia es para la troncal NQS Central. Sin embargo, la significancia solo fue de un asterisco. En promedio, en un día, el sistema de TransMilenio se encuentra en una congestión del 0,43, recordando que esta variable varía entre 0 y 1. Según el modelo de la NQS Central, el coeficiente asociado a esta variable es de 23.8 segundos. Esto quiere decir que un bus despachado en hora pico solo generara una demora adicional de 13 segundos a comparación de un bus despachado en hora valle cuando la demanda del sistema se encuentra muy por debajo de la capacidad del sistema. Esto nos muestra que el peso de esta variable es muy poca para los modelos propuestos.

Las demoras generadas por la congestión son generadas por que la demanda del sistema supera la capacidad de esta. Sin embargo, esto sucede solo en las horas pico. Esto quiere decir que la variable debería reflejar demoras solo cuando el sistema se encuentra por encima de la capacidad del sistema. En la Figura 4 se puede observar en naranja una línea conceptual de la capacidad del sistema. Cabe resaltar que esta no es la capacidad verdadera del sistema, solo es una línea representativa de utilidad para explicar la inconsistencia de la variable “Distribución”. Todas las horas que se encuentren por debajo de la línea de la capacidad, son horas donde no debería haber congestión alguna en el sistema, por lo tanto, las demoras deberían ser 0. Por otro lado, para los picos, si existe congestión y por ende se esperan demoras. Esto se puede traducir de la siguiente manera:

푐 푓(푡) = 0 푝푎푟푎 푓(푡) ≤ 푚푎푥

푐 푓(푡) = 푓(푡) 푝푎푟푎 푓(푡) > 푚푎푥

Para horas con una función de distribución menores a la división entre la capacidad del sistema y la máxima demanda, la función deberá ser 0 asegurando una demora de 0 segundos. Por otro lado, para las horas picos, la función dada por la ¡Error! No se encuentra el origen de la referencia. se mantiene. Se esperaría que, con este ajuste, la significancia de la variable aumente considerablemente.

1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0

Figura 4. Modelo explicativo de la alternativa

5.1.2 Verificación del Modelo

Para la verificación del modelo, se obtuvieron, por parte de Transmilenio S.A., el tiempo total de viaje de dos rutas en un días donde no se presentaron demoras fuera de lo normal. Se discretizaron las rutas en par de estaciones origen y destino y se determinaron cada una de las variables que necesita el modelo. Para esto, se utilizó de nuevo la base de datos proporcionada por Transmilenio S.A. para determinar la distancia entre estaciones, Google Maps para determinar los semáforos entre estaciones, y la información de Rutas para determinar las estaciones intermedias.

Las rutas de prueba fueron: J70 y F1. Para la primera ruta, el trayecto desde el Portal Norte hasta la estación de Aguas es de 44:56 minutos. Por otro lado, desde el Portal Norte hasta el Portal de las Américas, al servicio F1 le tomó 1:37:00. Se estimó cada par de paradas consecutivas de cada servicio para luego realizar un acumulado. Cabe recordar que el modelo propuesto calcula el tiempo promedio de recorrido mas no tiene en cuenta el tiempo en el cual el bus está detenido, con las puertas abiertas, esperando a que los usuarios se bajen y se suban. El servicio J70 solo circula en las horas pico de la

mañana. Como no se tiene la hora exacta del inicio del viaje, se supuso un valor aproximado y promediado para todas las estaciones de 0.8 en la escala de distribución previamente explicada. Utilizando el modelo para todo el sistema se obtuvo que el tiempo que dura el bus recorriendo el servicio J70 es de 43 minutos aproximadamente. En la Tabla 4 4 se puede apreciar el tiempo que tomaría entre cada una de las estaciones, así como los parámetros para cada par de estaciones. Teniendo en cuenta que el modelo no concibe la espera en la estación, el tiempo de espera que permite el modelo para igualar el tiempo real es de 13.7 segundos por estación.

Tabla 4.Tiempos de viaje de la ruta J70

Estación Estación Distancia Semáfor Hor Estaciones Tiempo Salida Llegada (m) os a Intermedias (s) Portal Norte Toberín 1,209 0 0.8 0 131.3 Toberín Calle 146 2,308 0 0.8 2 208.8 Calle 146 Calle 142 199 0 0.8 0 33.7 Calle 142 Alcalá 551 0 0.8 0 67.7 Alcalá Prado 788 0 0.8 0 90.6 Prado Calle 127 1,165 0 0.8 0 127.0 Calle 127 Av. Jiménez 14,602 13 0.8 20 1,397.4 Av. Jiménez Museo del Oro 2,342 5 0.8 0 340.3 Museo del Oro Aguas 1,261 2 0.8 0 176.2 Total Real 00:44:56 Total Estimado ( Incluyendo 19.1 segundos de parada por estación) 00:45:44

Para la segunda ruta se realizó exactamente el mismo procedimiento, obteniendo un tiempo de espera promedio para cada estación de 6 segundos. A pesar de ser tiempos de carga y descarga muy bajos, el modelo si genera estimaciones correctas de la realidad. Recordemos que el coeficiente de determinación fue de 0.8607, queriendo decir que el 86% de los datos se ajustan de manera correcta al modelo.

Ahora bien, una segunda metodología es determinar un tiempo de espera promedio, para poder calcular un tiempo de recorrido completo del bus. Con la base obtenida también es posible determinar los tiempos de espera de los buses mientras los pasajeros cargan y descargan. Por medio del tiempo entre los registros “Abrir Puertas” y “Cerrar Puertas” en una misma estación se calculó el tiempo que tomo a el bus volver a iniciar su recorrido. Por medio de Visual Basic se generó una macro que discretizara estos tiempos por estaciones. El resultado obtenido fue una tabla como la mostrada en la Tabla 5.

Tabla 5.Distribución de tiempos de espera de los buses

Estación t1 t2 t3 t4 t5 t6 t7 t8 Alcalá 24 ------Alquería 25 12 9 15 30 18 37 14 Av. 68 26 ------Av. Chile 16 24 6 - - - - - Av. El Dorado 13 17 11 23 16 17 - - Bosa 8 14 17 15 5 23 7 11 CAD 40 22 15 14 18 16 20 10 Calle 100 15 35 31 31 32 - - - Calle 106 15 26 14 14 26 17 - - Calle 116 23 17 12 20 15 - - - Calle 127 15 18 19 17 23 - - -

En la tabla, podemos apreciar en la primera columna las distintas estaciones que la base de datos incluía. En las siguiente se tienen los distintos tiempos de espera que se obtuvieron. Existen estaciones como Alcalá o Aenida 68 que solo se presentaban una vez la base de datos por lo que solo tiene un registro de tiempo de espera. Sin embargo, existen otras estaciones como el Portal Sur con 33 tiempos espera registrados o Venecia y Virrey con 22 tiempos de espera cada uno. Para calcular el promedio un promedio de espera para todas las estaciones, se decidió utilizar solo aquellas estaciones que tuvieran más de 10 registros, con el fin de utilizar muestras más significativas. Existen 16 estaciones con más de diez registros entre las cuales se incluyen, Universidad Nacional de la Troncal NQS Central, San Mateo de la Troncal NQS Sur y San Victorino de la Troncal de la Décima. El resultado que se obtuvo fue un tiempo de espera promedio de 19.1 segundos.

Recordemos que en la ruta J70 se había obtenido un tiempo viaje sin incluir tiempos de espera de 42 minutos y 53 segundos. Aplicando el tiempo promedio en cada una de las estaciones se encuentra un tiempo total de recorrido de 45 minutos y 44 segundos. Esto quiere decir que utilizando el modelo y un tiempo promedio de esperar se obtuvo solamente un error de 1,8% con respecto al tiempo real que dura el bus en hacer esta ruta.

Por el otro lado la ruta F1 se obtuvo un tiempo total de viaje (incluyendo 19,1 segundos de tiempo de espera) de 1:47:04. Esto resulta en un desfase de 10 minutos aproximadamente y un error de 10,4%. La diferencia entre este ejemplo y el anterior es la cantidad de paradas que hace el bus. El F1 tiene 46 paradas mientras que el J70 solo 9. Recordemos que todo modelo tiene un error asociado siempre que se tenga un coeficiente de determinación menor a 1. Esto quiere decir que para cada par

de estaciones el tiempo que se calcula tiene un error. Si la ruta presenta muchas paradas, el error se acumulará y generará un tiempo de viaje total de recorrido más desajustado. Adicionalmente, se debe tener en cuenta que el tiempo de espera promedio utilizado cuenta, de igual manera, con un error asociado que aumenta al realizar más paradas. Hay estaciones donde el tiempo de espera más largo, principalmente en estaciones donde está empezando la ruta como portales, Banderas o Alcalá. Dado que el portal Sur es la estación con mayor registro, el tiempo obtenido está sobre dimensionado.

CAPÍTULO 6. CONCLUSIONES

Este trabajo de investigación permitió generar un primer modelo que permite estimar el tiempo de viaje de los buses del sistema de TransMilenio. Este modelo fue creado a partir de una regresión lineal de multiples variables y datos reales de buses de TransMilenio. Se encontró que teniendo en cuenta la red semafórica, la hora de despacho, la distancia recorrida y la frecuencia de paradas del bus es posible determinar un modelo que logre estimar el tiempo de recorrido del bus entre dos estaciones. Este modelo puede resultar de suma importancia para todos los softwares que busquen modelar la operación del sistema. Con este modelo lineal se busca obtener mejores resultados del modelo programado por los estudiantes de maestría William Aguirre y Miguel R. Campos para así, hacer de esté, un modelo útil para la empresa de TransMilenio.

A partir de lo que se encontró en este proyecto de grado, es importante tener en cuenta que entre más paradas tenga la ruta, más desfasado estará el modelo a la realidad. Un ajuste que se le podría hacer al modelo es castigar el resultado final de la sumatoria de los tiempos entre estaciones dependiendo la cantidad de estaciones en las que paró.

Para futuras investigaciones se pueden considerar nuevos parámetros que busquen una mejor estimación del modelo y evaluar su significancia a las distintas troncales. Una variable muy interesante a estudiar es el estado del pavimento. En casos como el La Troncal de Norte y la Troncal Caracas, el pavimento es una variable que genera muchos retrasos a los viajes de los usuarios.

CAPÍTULO 7. REFERENCIAS Bertini, R. L., & El-Geneidy, A. M. (2004). Modeling Transit Trip Time Using Archived Bus Dipatch System Data. JOURNAL OF TRANSPORTATION ENGINEERING, 56-67.

Pursula, M. (1999). Simulation of Traffic Systems - An Overview. Journal of Geographic Information and Decision Analysis, 1-8.

Tirachini, A. (2013). Estimation of travel time and the benefits of upgrading the fare payment technology in urban bus services. Transportation Research Part C: Emerging Tecnologies, 239-256.

Tirachini, A., Hensher, D. A., & Rose, J. M. (2013). Crowding in public transport systems: Effects on users, operation and implications for the estimation of demand. Transportation Research Part A: Policy and Practice, 36-52.

ZHANG, C., & TENG, J. (2013). Bus Dwell Time Estimation and Prediction: A Case in Shanghai - China. 13th COTA International Conference of Transportation Professionals, 12.