Escola Tècnica Superior d’Enginyeria Informàtica Universitat Politècnica de València Estudio sobre patrones de accidentes en la ciudad de València Trabajo Fin de Máster Máster Universitario en Gestión de la Información Autor: Joaquín Montesinos Muñoz Tutor: César Ferri Ramírez 2017-2018 Estudio sobre patrones de accidentes en la ciudad de València 2 Resumen Los accidentes de tráfico son una de las causas más frecuentes de lesión y muerte en la población adulta en el mundo. Existen factores que pueden afectar a las condiciones de la conducción como puede ser el tráfico intenso o la meteorología adversa, y de una manera indirecta provocar que aumenten los accidentes de tráfico. Este proyecto se elabora con el fin de detectar patrones y situaciones propensas a accidentes de tráfico y de este modo poder reducir el número de muertes por siniestralidad. Para la realización del proyecto se llevará a cabo la implementación de un sistema de análisis, predicción y visualización que utiliza tecnologías de procesado de datos y tecnologías de visualización web. Los diferentes análisis y visualizaciones podrán ser utilizados para encontrar patrones de accidentes a nivel nacional, provincial y local, estudiando en estos la relación entre accidentes, clima y tráfico recogidos a través de los datos históricos de diferentes portales de datos abiertos. Además, se generará una aplicación que sea capaz de estimar el número de accidentes que sucederá en las calles de Valencia y en sus carreteras periféricas. Para dicha tarea se utiliza un modelo de aprendizaje automático basado en regresión lineal que se nutre de datos históricos y datos a tiempo real, todo esto integrado mediante una herramienta de visualización interactiva que permite la simulación de diferentes escenarios. Consideramos que la herramienta resultado del Trabajo de Fin de Máster puede servir para conocer qué factores son más propensos a producir problemas en el tráfico, concienciar a los conductores, y de este modo reducir el número de accidentes y de víctimas mediante técnicas de prevención. Palabras clave: Accidentes, Tráfico, Meteorología, Datos abiertos, Aprendizaje automático, Predicción, Visualización, Análisis de datos, Dashboard. 3 Estudio sobre patrones de accidentes en la ciudad de València Abstract Traffic accidents are one of the most frequent causes of lesions and death in the adult population worldwide. There are some factors that can affect to conduction conditions such as intense traffic or adverse meteorology, and in an indirect way they can increase the number of traffic accidents. This project has been developed with the purpose of detecting patterns and situations liable to traffic accidents and, in this way, decrease the number of deaths. To achieve the main purpose of the project, a system based on analysis, prediction and visualization is going to be implemented using data processing and web visualization technologies. The different analysis and visualizations could be used to find patterns of accidents at a national, provincial or local level, by studying the relationship between accidents, weather and traffic collected thanks to the historical data available in many open data portals. Moreover, it is going to be developed an application able to predict the number of accidents that are going to happen on the streets of Valencia and on its peripherical roads. For this task, it is going to be developed an automatic machine learning model based on linear regression which has been trained by using historical data and that uses real time data to predict the number of accidents in real time. All these features are going to be integrated through an interactive visualization tool that allows the simulation of different scenarios. It is considered that the tool developed on the End Master Thesis allows to know which factors are more liable to produce traffic problems, to raise awareness among drivers and, in this way, to reduce the number of accidents and deaths through prevention techniques. Keywords: Accident, Traffic, Meteorology, Open data, Machine learning, Prediction, Visualization, Data analysis, Dashboard. 4 Índice 1. Introducción ............................................................................................................................ 10 1.1. Contexto y motivación .................................................................................................... 11 1.2. Objetivos ......................................................................................................................... 12 1.2.1. Objetivo general ...................................................................................................... 12 1.2.2. Objetivos específicos ............................................................................................... 13 2. Estado del arte ......................................................................................................................... 14 3. Tecnologías y metodologías .................................................................................................... 16 3.1. Metodología .................................................................................................................... 16 3.2. Herramientas y tecnologías ............................................................................................. 17 4. Fuentes de datos ...................................................................................................................... 20 5. Preparación de Datos ............................................................................................................... 26 5.1. Relación entre tablas ....................................................................................................... 26 5.2. Día y fecha de accidentes ................................................................................................ 27 5.3. Municipios y Cartografía ................................................................................................ 28 5.4. Accidentes en España, comunidades autónomas y Valencia .......................................... 29 5.5. Accidentes en la provincia de Valencia .......................................................................... 31 5.6. Tráfico en Valencia ......................................................................................................... 31 5.6.1. Análisis del flujo de tráfico a la entrada y salida de Valencia ...................................... 32 5.7. Predicción de accidentes en Valencia ............................................................................. 34 5.7.1. Modelos de regresión lineal .................................................................................... 35 5.7.2. Análisis del modelo de predicción de accidentes en la periferia de Valencia ......... 35 5.7.3. Análisis del modelo de predicción de accidentes en Valencia ................................ 38 6. Visualización de datos............................................................................................................. 42 6.1. Accidentes en España, en las comunidades autónomas y en Valencia ........................... 42 6.2. Como actúan los accidentes en la provincia de Valencia ................................................ 45 6.3. Flujo de Tráfico a la entrada y la salida de Valencia ...................................................... 46 6.4. Predicción de accidentes en Valencia y periferia ............................................................ 48 7. Conclusiones ........................................................................................................................... 50 7.1. Futuras mejoras ............................................................................................................... 52 7.2. Crítica constructiva ......................................................................................................... 52 8. Bibliografía ............................................................................................................................. 53 9. Anexos..................................................................................................................................... 55 9.1. Descripción de columnas ................................................................................................ 55 5 Estudio sobre patrones de accidentes en la ciudad de València Índice de figuras Figura 1. Evolución del número de fallecidos en vías 1960-2016 .............................................. 11 Figura 2. Ciclo de la metodología CRISP-DM. .......................................................................... 16 Figura 3. Logo R. ........................................................................................................................ 17 Figura 4. Logo PHP. .................................................................................................................... 18 Figura 5. Logo JavaScript. .......................................................................................................... 18 Figura 6. Logo JQuery. ............................................................................................................... 18 Figura 7. Logo AJAX. ................................................................................................................. 18 Figura 8. Logo D3.js. .................................................................................................................. 19 Figura 9. Logo CARTO. ............................................................................................................. 19 Figura 10. Logo Fusion Tables. .................................................................................................. 19 Figura 11. Logo Dirección General de Tráfico. .......................................................................... 20 Figura 12. Logo Agencia Estatal de Meteorología...................................................................... 22 Figura 13. Logo Portal de Transparencia y Datos Abiertos del Ayto. de Valencia. ................... 22 Figura 14. Logo Instituto Nacional de Estadística. ..................................................................... 23 Figura 15. Logo del Instituto Geográfico Nacional. ................................................................... 23 Figura 16. Logo policía local de Valencia. ................................................................................. 25 Figura 17. Relación general entre tablas. .................................................................................... 26 Figura 18. Relación entre tablas para el estudio en Valencia capital. ......................................... 27 Figura 18. Algoritmo de fecha en accidentes. ............................................................................. 28 Figura 19. Estructura de datos de la leyenda, el gráfico circular y el gráfico de barras. ............. 30 Figura 20. Estructura de datos de la leyenda de puntos negros. .................................................. 30 Figura 21. Estructura de datos del radar horario. ........................................................................ 30 Figura 22. Estructura de datos del radar diario. .......................................................................... 30 Figura 23. Muestra de datos procesado añadidos a Carto. .......................................................... 31 Figura 25. Visualización de espiras en Valencia. Muestra la espira 2232 de la V-31. ............... 32 Figura 25. Muestra de datos que resultan del procesado. ............................................................ 34 Figura 27. Número de accidentes entre 2011 y 2015 por carretera. ............................................ 35 Figura 28. Valores de la regresión lineal. .................................................................................... 37 Figura 29. Modelo de regresión lineal generado para predicción de accidentes en la periferia de valencia. .............................................................................................................................. 38 Figura 30. Calles de Valencia con mayor número de accidentes durante el año 2016. .............. 39 Figura 31. Valores de la regresión lineal. .................................................................................... 40 Figura 32. Modelo de regresión lineal generado para la predicción de accidentes en la ciudad de valencia. .............................................................................................................................. 41 Figura 33. Dashboard de accidentes en España. ......................................................................... 43 Figura 34. Dashboard de accidentes en la comunidad Valenciana. ............................................ 43 6 Figura 35. Dashboard de accidentes en Valencia. ....................................................................... 44 Figura 30. Mapa interactivo del histórico de accidentes en la provincia de Valencia. ............... 46 Figura 31. Flujo de salida de tráfico en Valencia. ....................................................................... 47 Figura 32. Flujo de entrada de tráfico en Valencia. .................................................................... 47 Figura 39. Herramienta para predicción de accidentes en la periferia de Valencia. ................... 49 Figura 40. Geometría de las calles de Valencia usadas para la herramienta de predicción de accidentes. .......................................................................................................................... 50 7 Estudio sobre patrones de accidentes en la ciudad de València Índice de Tablas Tabla 1. Columnas de la TABLA_ACCVICT ............................................................................ 21 Tabla 2. Columnas de la TABLA_PERS. ................................................................................... 21 Tabla 3. Columnas de la TABLA_VEHIC. ................................................................................ 21 Tabla 4. Columnas de la tabla de Meteorología. ......................................................................... 22 Tabla 5. Columnas de la tabla de tráfico. .................................................................................... 23 Tabla 6. Columnas de la tabla de datos de municipales. ............................................................. 23 Tabla 7. Columnas de las tablas cartográficas en Carto. ............................................................. 24 Tabla 8. Columnas de la tabla de accidentes de tráfico en Valencia. .......................................... 25 Tabla 9. Espiras por carretera para entradas y salidas. ................................................................ 33 Tabla 10. Generando variable predictora. ................................................................................... 37 8 9 Estudio sobre patrones de accidentes en la ciudad de València 1. Introducción Según la organización mundial de la salud, los traumatismos debidos a accidentes de tráfico se encuentran dentro de las principales causas de muerte en el mundo (OMS, 2012). Dentro de los países de europeos, España se sitúa por debajo de la tasa europea de muertes por accidente, posicionándose como uno de los mejores países del mundo en cuanto a seguridad vial (DGT, 2017). A pesar de estos positivos datos, la cifra de accidentes y muertes por año dentro del territorio español asciende a 89.000 accidentes y 1.300 muertes entre los años 2011 a 2015. Estas cifras no pueden ser despreciadas y más cuando hablamos de vidas humanas. Esta situación invita a buscar urgentemente una solución que permita reducir el número de víctimas de accidente viales. Son numerosos los factores que contribuyen a la presencia de accidentes. Sería interesante analizar estos factores con el objetivo de reducir el número de accidentes de tráfico. Estos factores abarcan campos como patrones de conducción, agentes meteorológicos, tráfico en carreteras, calendario, infraestructuras viales, disposición y geometría de las carreteras, vehículos, factores humanos, etc. La gran cantidad de factores que influyen en los accidentes de tráfico hace imposible su análisis a través de las técnicas tradicionales. En los últimos años técnicas como el Big Data han permitido la realización de estos análisis de una forma eficiente y empleando un tiempo mucho menor que el utilizado por otras técnicas obteniendo, además, consiguiendo unos resultados más precisos. Para cumplir con este objetivo, este trabajo se propone el desarrollo de una plataforma web que permita una visualización interactiva donde elaborar un estudio de los accidentes de tráfico ocurridos tanto a nivel nacional como provincial. Esta plataforma se focalizará finalmente en la ciudad de Valencia y en su periferia, zona de la cual se han conseguido registros de datos de los factores prioritarios en los que se centra el estudio: accidentes, meteorología y tráfico. La web presentara diferentes tipos de visualización permitiendo al usuario comprender y estudiar la información a conveniencia, generando así una experiencia de estudió de datos más amena al lector. Adicionalmente, la plataforma web también dispone de un apartado de predicción, el cual estima el número de accidentes que sucederán en las carreteras de la ciudad de Valencia y su periferia. Con todo esto se pretende prevenir y conocer cómo se desarrolla el tráfico en la ciudad y en sus aledaños y de este modo conseguir una gestión más eficiente y rápida los sistemas de alerta y prevención. Para el estudio, se procesan conjuntos masivos de datos procedentes de portales de datos abiertos, tanto históricos como en tiempo real, además de un conjunto de datos referente a accidentes producidos en la ciudad de Valencia, el cual no se encuentra en el catálogo de datos abiertos de la ciudad y que ha sido solicitado exclusivamente para este proyecto. Este proyecto busca abordar problemas que afectan al desarrollo sostenible de la sociedad mediante análisis de datos, con el fin de impactar positivamente en la sociedad. Gracias a estos estudios, se puede mejorar la atención en carreteras y la logística de cuerpos de policía y de centros médicos encargados de atender a los heridos y actuar ante los accidentes. Además, mediante estos estudios se busca mejorar las 10
Description: