¿Cuánto gastan los bomberos londinenses en salvar gatitos?: El Open Data respondePaloma Recuero de los Santos 26 abril, 2017 En este segundo post, continuación de «Ciudades Inteligentes: Exprimiendo Open Data con Power BI» analizaremos el problema y conoceremos las medidas que tomaron los Bomberos de Londres a la vista de estos resultados, para intentar paliar la situación. Hipótesis Ha llegado el momento de plantearnos qué información queremos extraer de los datos, qué respuestas estamos buscando. Algunas preguntas pueden estar claras desde el principio del análisis. Otras, sin embargo, irán surgiendo según los datos nos vayan revelando información. El problema: La señal de alarma que nos ha llevado a plantearnos el análisis es el incremento del número de intervenciones del cuerpo de bomberos para realizar estos servicios, y el coste asociado. Figura 1: Imagen de la campaña lanzada en 2016. Empezamos a plantear hipótesis que intentaremos contrastar con los datos. Con las conclusiones que obtengamos, buscaremos estrategias o definiremos iniciativas que nos permitan solucionar el problema o reducir/minimizar sus efectos. Hipótesis 1: El número de servicios se va incrementando cada año. Si no se plantea ninguna medida correctiva el coste seguirá aumentando. Hipótesis 2: El tipo de animal implicado en el incidente es fundamental a la hora de discriminar si realmente es necesaria la intervención del cuerpo de bomberos o no. La ubicación del incidente (rural o urbano) también puede estar relacionada con el tipo de animal Lo primero que conviene hacer es echarle un vistazo a los datos. Cargarlos en forma de tabla, ver los nombres de los campos (algunos nos resultarán descriptivos, otros no), y probar algunos filtros. Esta breve exploración previa nos ayudará a elegir qué campos pueden aportar información más relevante para cada informe. *En un análisis más complejo, estaríamos en la fase de seleccionar qué atributos nos proporcionan una mayor “ganancia de información” (information gain), permitiéndonos segmentar los datos de forma más eficaz. Por ejemplo, cuales son los atributos que nos permiten agrupar y predecir los valores del campo “IncidentNominalCost” (coste del servicio). Para trabajar sobre la Hipótesis 1, elegimos la visualización “Line Chart”. Seleccionamos el campo sumatorio CallYear y lo arrastramos bajo la etiqueta “Axis” para que represente este valor en el eje vertical (ordenadas) y campo PumpCount lo arrastramos bajo la etiqueta “Values” para que aparezca en el eje horizontal (abscisas). Si seleccionamos directamente los campos en la lista los puede añadir en un orden que no es el que nos interesa por eso es mejor arrastrarlos directamente a su posición final. Figura 2: El campo CalYear (año) debe aparecer bajo la etiqueta “Axis”, mientras que el campo “PumpCount” (número de casos) debe aparecer bajo la etiqueta “Values” leyenda. Obtenemos así el primer panel del informe, en el que se aprecia la evolución del número de servicios de rescate por año. Figura 3: Evolución del número de casos por año. Para hacer un análisis más eficiente de esta gráfica conviene aplicar algunos filtros. Dado que del año 2017 sólo tenemos algunos datos del primer cuatrimestre, vamos a cortar por año completo. Aplicamos el filtro: Figura 4: Ejemplo del filtro avanzado. Sólo muestra los años anteriores a 2016. Aplicado el filtro, la nueva gráfica sería la siguiente: Figura 5: Evolución del número de casos por año (filtrada). Podemos probar con otra visualización de los datos, “Funnel” donde es más fácil apreciar el valor total del número de servicios realizados por año. Cambiar de una a otra es tan fácil como seleccionar en el panel de visualización el nuevo formato con el que queremos que nos presente los datos. Power BI hará el resto del trabajo. Figura 6: Ejemplo de visualización “Funnel”. Se puede apreciar claramente un incremento de las actuaciones entre 2009 y 2011, cómo a partir de ese punto empieza a disminuir (ya veremos por qué), para volver a repuntar el 2016. La muestra no es muy grande, pero si se aprecia una tendencia al incremento progresivo del número de casos. La evolución del coste del servicio por año no es exactamente lineal ya que el coste del servicio viene determinado por el número de horas dedicadas y puede variar en cada caso. Claramente, en 2011 ha habido un cambio de tendencia en la evolución del coste, que se ha vuelto a revertir en 2015. Figura 7: Evolución del coste de servicio por año. Para trabajar sobre la Hipótesis 2, elegimos la visualización “Pie Chart”. Seleccionamos el campo sumatorio CallYear y lo arrastramos bajo la etiqueta “Axis” para que represente este valor en el eje vertical (ordenadas) y campo PumpCount lo arrastramos bajo la etiqueta “Values” para que aparezca en el eje horizontal (abscisas). Figura 8: Número de servicios por tipo de animal. Claramente, la mayor parte de los incidentes tiene que ver con animales pequeños. Al pasar el puntero por cada sector del diagrama podemos ver el dato concreto y el porcentaje sobre el total (49,61% gatos, 17,91% pájaros, y 17,79% perros). https://empresas.blogthinkbig.com/wp-content/uploads/2017/04/3_Visualizacion_Pie.mp4 Si lo traducimos a costes, y volvemos a visualización “Clustered Column Chart”, podemos ver el gasto público dedicado a rescatar gatos en el periodo 2009-2016: ¡866.834 GBP!, de ellos 115.404 GBP sólo en 2016. Figura 9: Coste del servicio por tipo de animal en 2016. En este mismo periodo 2009-2016 se han dedicado 307418 GBP a “rescatar” pájaros, 11084 GBP a rescatar ardillas. Tan sólo entre 2009-2010 el cuerpo de bomberos ha tenido 34 salidas para rescatar ejemplares de estos pequeños roedores en apuros. El analizar la distribución de avisos según el parámetro “Animal Group Parent” nos ha revelado información de gran interés. Vamos a finalizar este análisis completándolo con información sobre su distribución geográfica. Para analizar la distribución geográfica, elegimos la visualización “Map”. Seleccionamos el campo Borough y lo arrastramos bajo la etiqueta “Location”, el campo AnimalGroupParent bajo la etiqueta “Legend” y el campo PumpCount lo arrastramos bajo la etiqueta “Size”. https://empresas.blogthinkbig.com/wp-content/uploads/2017/04/4_Visualizacion_mapa.mp4 Mientras que la distribución de avisos relativos a gatos y perros es bastante homogénea en las zonas más urbanas: Figura 10: Distribución geográfica de avisos referentes al rescate de gatos (en amarillo) y perros (en naranja). La relativa a otro tipo de animales de mayor tamaño como vacas, toros, ciervos etc. resulta más dispersa y asociada a zonas rurales, como era de esperar. En estos casos, al tratarse de animales de gran tamaño, lo más probable es que sí que se haga imprescindible la participación de los bomberos para resolver la situación. Figura 11: Distribución geográfica de avisos referentes al rescate de animales de gran tamaño como toros (en rojo), vacas (en gris) y ciervos (en azul). Por ello, como hemos mencionado antes, el parámetro “AnimalGroupParent” se perfila como uno de los parámetros que aporta mayor información a la hora de discriminar o al menos priorizar los servicios. Si aparecen algunos puntos “fuera de campo” puede deberse a duplicidades o errores en los nombres de códigos postales o nombres de ciudades que coinciden a uno y otro lado del Atlántico. En esos casos, podemos hacer click directamente sobre esos puntos y excluirlos de la gráfica. Figura 12: Ejemplo de datos claramente erróneos por duplicidades de nombres, códigos numéricos etc. PowerBI también nos permite visualizar segmentaciones. Podemos segmentar los datos del informe por un valor concreto, por ejemplo, por año o por ubicación geográfica. Como ejemplo, vamos a segmentar el número de servicios realizados en 2016 relativos a animales “pequeños” (perros, gatos, pájaros, erizos, hamsters, ardillas, patos etc). Para realizar esta segmentación, elegimos la visualización “Slicer”. Seleccionamos el campo Borough (Distrito) y, automáticamente, todos los demás paneles del lienzo ofrecen la información correspondiente a ese segmento concreto que, en este caso, corresponde a un distrito. Figura 13: Aspecto del lienzo con dos visualizaciones diferentes (tabla y funnel) tras aplicar la segmentación Borugh =“City of London” Todavía podríamos profundizar más con PowerBI y realizar un análisis del texto incluido en el campo “FinalDescription”. Por ejemplo, para agrupar y analizar con mayor detalle aquellos en los que se menciona la intervención previa de la RSPCA (“…ASSIST RSPCA…”), u ocurrencias como “Trapped” o “Stuck”. Este tipo de “Text Analytics” puede llevarse a cabo también con PowerBI gracias a su integración nativa con R. Conclusiones: Tomamos medidas Todo el análisis anterior nos ha servido para confirmar la Hipótesis 1 que se podría reformular como: “Si no se toman medidas, el consumo inadecuado de recursos públicos en este tipo de servicios seguirá aumentando año a año” Si a esto le sumamos los siguientes datos: Los ciudadanos de Londres sienten un gran amor por los animales (puede parecer un tópico, pero los datos que hemos analizado lo corroboran) El buen ciudadano que llama a los bomberos para socorrer a un animalito no paga de su bolsillo el coste del servicio…. ¿O si lo paga? Parece evidente sacar la conclusión de que el ciudadano que da el aviso NO es consciente del coste incurrido en realizarlo. No se da cuenta del derroche en dinero público (y el mal uso de un recurso de emergencia) que supone llamar a los bomberos para que rescaten a un hámster, una paloma atrapada en un sedal o ayuden a un gato a bajar de un tejado. Aquí se planteaba un problema al que había de que dar una solución que debía repercutir en un uso más eficiente de los recursos públicos y en dar mejor servicio a los ciudadanos. En este caso se planteó una campaña de concienciación ciudadana 2012: La Campaña En Julio de 2012, el Cuerpo de Bomberos de Londres lanzó la campaña: Figura 14: Campaña de los Bomberos de Londres 2012: “I am an animal, get me out of here”. El objetivo de la campaña era educar a los ciudadano sobre cómo poder seguir siendo “buenos samaritanos” en caso de encontrar animales en situaciones delicadas sin por ello hacer un mal uso de recursos públicos. La campaña tenía dos ejes: Por una lado, el de informar del coste que supone para la ciudadanía en general el dar este tipo de avisos directamente a los bomberos Y por otro, mostrar cuál sería la vía alternativa más adecuada a la que recurrir en este tipo de situaciones. En este caso, llamar a la RSPCA (Royal Society for the revention of Cruelty to Animals). Esta campaña tuvo un inmediato efecto positivo sobre la población que se refleja en el descenso del número de avisos registrado a partir de 2012. Figura 15: Noticia sobre el descenso de servicios de rescate animal. Sin embargo, en 2015 se registró un nuevo cambio de tendencia con un rápido incremento del número de casos. Los bomberos usaron las redes sociales para difundir la campaña. Figura 16: Campaña de los Bomberos de Londres 2012. Figura 17: Campaña de la BBC. Y, en Febrero de 2017, se publicó un mapa interactivo: Figura 18: Mapa Interactivo Se pone de manifiesto la necesidad de que este tipo de campañas se repitan periódicamente para no perder efectividad. Conclusión final La mayor disponibilidad de datos en abierto sobre los servicios públicos, y de distintas herramientas que permiten combinarlos, analizar patrones y visualizar modelos se pueden traducir rápidamente en ahorros costes, y en ciudadanos satisfechos e involucrados con su entorno. Este ha sido un ejemplo muy sencillo, pero con resultados palpables. Si en 2016 descontamos las salidas del Cuerpo de Bomberos relativas a percances de animales domésticos o de pequeño tamaño, las que consideramos “evitables”, el ahorro hubiera sido de £215.160. Si tenemos en cuenta el potencial que supone el poder aplicar Data Science a todo el arsenal de datos que hoy en día recogen y almacenan instituciones y empresas, nos damos cuenta de la gran oportunidad de mejorar nuestro entorno y nuestras vidas. ¡Aprovechémosla! https://empresas.blogthinkbig.com/wp-content/uploads/2017/04/5_Conclusion.mp4 Para mantenerte al día con LUCA visita nuestra página web, suscríbete a LUCA Data Speaks o síguenos en Twitter, LinkedIn y YouTube. Usos inverosímiles del Open Data: dónde aterrizar con tu paracaídasLUCA elige Hortonworks con Hadoop como su plataforma para ofrecer Big Data as a Service en España
Roberto García Esteban ChatGPT y Cloud Computing: un matrimonio bien avenido ChatGPT (quizá no sepas que son las siglas de Chat Generative Pre-Trained Transformer) está en boca de todos por su impresionante habilidad para generar textos que parecen escritos por...
Olivia Brookhouse ¿Puede la Inteligencia Artificial entender las emociones? Cuando John McCarthy y Marvin Minsky iniciaron la Inteligencia Artificial en 1956, se sorprendieron de cómo una máquina podía resolver rompecabezas increíblemente difíciles en menos tiempo que los humanos. Sin...
Javier Martínez Borreguero Automatización, Conectividad e Inteligencia Aumentada al servicio de una reindustrialización competitiva, disruptiva y sostenible Por segundo año consecutivo vuelvo a participar en el Advanced Factories (AF 2023), la mayor exposición y congreso profesional dedicado a la Industria 4.0 del sur de Europa. Un...
Nacho Palou Medidas para reducir la brecha digital de género sin esperar 32 años El informe Sociedad Digital en España 2023, de Fundación Telefónica, dedica un apartado específico para analizar la brecha de género en el ámbito del talento digital. Destaca que, si bien...
Nacho Palou Raspberry Pi para Edge AI: Inteligencia Artificial en el borde para todos Raspberry Pi es un popular ordenador muy utilizado entre desarrolladores, estudiantes y aficionados a la informática, a la robótica y a ‘cacharrear’. Entre sus virtudes están su bajo coste...
Carlos Lorenzo Ya no eres solo una empresa de productos o servicios, eres una empresa de datos Todas las empresas que operan en la actualidad son en realidad empresas de datos. Y lo son porque día a día almacenan y utilizan una gran cantidad de información:...