¿Cuánto gastan los bomberos londinenses en salvar gatitos?: El Open Data responde

Paloma Recuero de los Santos    26 abril, 2017

En este segundo post, continuación de «Ciudades Inteligentes: Exprimiendo Open Data con Power BI» analizaremos el problema y conoceremos las medidas que tomaron los Bomberos de Londres a la vista de estos resultados, para intentar paliar la situación.

Hipótesis

Ha llegado el momento de plantearnos qué información queremos extraer de los datos, qué respuestas estamos buscando. Algunas preguntas pueden estar claras desde el principio del análisis. Otras, sin embargo, irán surgiendo según los datos nos vayan revelando información.

El problema: La señal de alarma que nos ha llevado a plantearnos el análisis es el incremento del número de intervenciones del cuerpo de bomberos para realizar estos servicios, y el coste asociado.

Imagen campaña
Figura 1: Imagen de la campaña lanzada en 2016.

Empezamos a plantear hipótesis que intentaremos contrastar con los datos. Con las conclusiones que obtengamos, buscaremos estrategias o definiremos iniciativas que nos permitan solucionar el problema o reducir/minimizar sus efectos.

  • Hipótesis 1: El número de servicios se va incrementando cada año. Si no se plantea ninguna medida correctiva el coste seguirá aumentando.
  • Hipótesis 2: El tipo de animal implicado en el incidente es fundamental a la hora de discriminar si realmente es necesaria la intervención del cuerpo de bomberos o no. La ubicación del incidente (rural o urbano) también puede estar relacionada con el tipo de animal
Lo primero que conviene hacer es echarle un vistazo a los datos. Cargarlos en forma de tabla, ver los nombres de los campos (algunos nos resultarán descriptivos, otros no), y probar algunos filtros. Esta breve exploración previa nos ayudará a elegir qué campos pueden aportar información más relevante para cada informe.

*En un análisis más complejo, estaríamos en la fase de seleccionar qué atributos nos proporcionan una mayor “ganancia de información” (information gain), permitiéndonos segmentar los datos de forma más eficaz. Por ejemplo, cuales son los atributos que nos permiten agrupar y predecir los valores del campo “IncidentNominalCost” (coste del servicio).

Para trabajar sobre la Hipótesis 1, elegimos la visualización “Line Chart”. Seleccionamos el campo sumatorio CallYear y lo arrastramos bajo la etiqueta “Axis” para que represente este valor en el eje vertical (ordenadas) y campo PumpCount lo arrastramos bajo la etiqueta “Values” para que aparezca en el eje horizontal (abscisas). Si seleccionamos directamente los campos en la lista los puede añadir en un orden que no es el que nos interesa por eso es mejor arrastrarlos directamente a su posición final.
  
Captura campos
Figura 2: El campo CalYear (año) debe aparecer bajo la etiqueta “Axis”, mientras que el campo “PumpCount” (número de casos) debe aparecer bajo la etiqueta “Values”  leyenda.

Obtenemos así el primer panel del informe, en el que se aprecia la evolución del número de servicios de rescate por año.

Evolución del numero de casos por año
Figura 3: Evolución del número de casos por año.

Para hacer un análisis más eficiente de esta gráfica conviene aplicar algunos filtros. Dado que del año 2017 sólo tenemos algunos datos del primer cuatrimestre, vamos a cortar por año completo. Aplicamos el filtro:

Ejemplo del filtro avanzado
Figura 4: Ejemplo del filtro avanzado. Sólo muestra los años anteriores a 2016.

Aplicado el filtro, la nueva gráfica sería la siguiente:

Evolución del número de casos por año
Figura 5: Evolución del número de casos por año (filtrada).

Podemos probar con otra visualización de los datos, “Funnel” donde es más fácil apreciar el valor total del número de servicios realizados por año. Cambiar de una a otra es tan fácil como seleccionar en el panel de visualización el nuevo formato con el que queremos que nos presente los datos. Power BI hará el resto del trabajo.

Ejemplo de visualización "Funnel"
Figura 6: Ejemplo de visualización “Funnel”.
Se puede apreciar claramente un incremento de las actuaciones entre 2009 y 2011, cómo a partir de ese punto empieza a disminuir (ya veremos por qué), para volver a repuntar el 2016. La muestra no es muy grande, pero si se aprecia una tendencia al incremento progresivo del número de casos.
  
La evolución del coste del servicio por año no es exactamente lineal ya que el coste del servicio viene determinado por el número de horas dedicadas y puede variar en cada caso. Claramente, en 2011 ha habido un cambio de tendencia en la evolución del coste, que se ha vuelto a revertir en 2015.


Evolución del coste de servicio por año
Figura 7: Evolución del coste de servicio por año.

Para trabajar sobre la Hipótesis 2, elegimos la visualización Pie Chart”. Seleccionamos el campo sumatorio CallYear y lo arrastramos bajo la etiqueta “Axis” para que represente este valor en el eje vertical (ordenadas) y campo PumpCount lo arrastramos bajo la etiqueta “Values” para que aparezca en el eje horizontal (abscisas).

Numero de servicios por tipo de animal
Figura 8: Número de servicios por tipo de animal.  

Claramente, la mayor parte de los incidentes tiene que ver con animales pequeños. Al pasar el puntero por cada sector del diagrama podemos ver el dato concreto y el porcentaje sobre el total (49,61% gatos, 17,91% pájaros, y 17,79% perros).




    
Si lo traducimos a costes, y volvemos a visualización “Clustered Column Chart”, podemos ver el gasto público dedicado a rescatar gatos en el periodo 2009-2016: ¡866.834 GBP!, de ellos 115.404 GBP sólo en 2016.

Coste del sevicio por tipo de animal en 2016
Figura 9: Coste del servicio por tipo de animal en 2016.
En este mismo periodo 2009-2016 se han dedicado 307418 GBP a “rescatar” pájaros, 11084 GBP a rescatar ardillas. Tan sólo entre 2009-2010 el cuerpo de bomberos ha tenido 34 salidas para rescatar ejemplares de estos pequeños roedores en apuros.

El analizar la distribución de avisos según el parámetro “Animal Group Parent” nos ha revelado información de gran interés. Vamos a finalizar este análisis completándolo con información sobre su distribución geográfica.

Para analizar la distribución geográfica, elegimos la visualización “Map”. Seleccionamos el campo Borough y lo arrastramos bajo la etiqueta “Location”, el campo AnimalGroupParent bajo la etiqueta “Legend” y el campo PumpCount lo arrastramos bajo la etiqueta “Size”.

Mientras que la distribución de avisos relativos a gatos y perros es bastante homogénea en las zonas más urbanas:

Distribución geográfica de avisos referentes al rescate de gatos
Figura 10: Distribución geográfica de avisos referentes al rescate de gatos (en amarillo) y perros (en naranja).
  
La relativa a otro tipo de animales de mayor tamaño como vacas, toros, ciervos etc. resulta más dispersa y asociada a zonas rurales, como era de esperar. En estos casos, al tratarse de animales de gran tamaño, lo más probable es que sí que se haga imprescindible la participación de los bomberos para resolver la situación. 
  
Distribución geográfica animales grandes
Figura 11: Distribución geográfica de avisos referentes al rescate de animales de gran tamaño como toros (en rojo), vacas (en gris) y ciervos (en azul).

Por ello, como hemos mencionado antes, el parámetro “AnimalGroupParent” se perfila como uno de los parámetros que aporta mayor información a la hora de discriminar o al menos priorizar los servicios.
  
Si aparecen algunos puntos “fuera de campo” puede deberse a duplicidades o errores en los nombres de códigos postales o nombres de ciudades que coinciden a uno y otro lado del Atlántico. En esos casos, podemos hacer click directamente sobre esos puntos y excluirlos de la gráfica.

Ejemplo de datos erróneos
Figura 12: Ejemplo de datos claramente erróneos por duplicidades de nombres, códigos numéricos etc.

PowerBI también nos permite visualizar segmentaciones. Podemos segmentar los datos del informe por un valor concreto, por ejemplo, por año o por ubicación geográfica. Como ejemplo, vamos a segmentar el número de servicios realizados en 2016 relativos a animales “pequeños” (perros, gatos, pájaros, erizos, hamsters, ardillas, patos etc).


Para realizar esta segmentación, elegimos la visualización “Slicer”. Seleccionamos el campo Borough (Distrito) y, automáticamente, todos los demás paneles del lienzo ofrecen la información correspondiente a ese segmento concreto que, en este caso, corresponde a un distrito.

Aspecto del lienzo con dos visualizaciones
Figura 13: Aspecto del lienzo con  dos visualizaciones diferentes (tabla y funnel) tras aplicar la segmentación
Borugh =“City of London”

Todavía podríamos profundizar más con PowerBI y realizar un análisis del texto incluido en el campo “FinalDescription”. Por ejemplo, para agrupar y analizar con mayor detalle aquellos en los que se menciona la intervención previa de la RSPCA (“…ASSIST RSPCA…”), u ocurrencias como “Trapped” o “Stuck”. Este tipo de “Text Analytics” puede llevarse a cabo también con PowerBI gracias a su integración nativa con R.

Conclusiones: Tomamos medidas

Todo el análisis anterior nos ha servido para confirmar la Hipótesis 1 que se podría reformular como:

 “Si no se toman medidas, el consumo inadecuado de recursos públicos en este tipo de servicios seguirá aumentando año a año
Si a esto le sumamos los siguientes datos:
  •  Los ciudadanos de Londres sienten un gran amor por los animales (puede parecer un tópico, pero los datos que hemos analizado lo corroboran)
  • El buen ciudadano que llama a los bomberos para socorrer a un animalito no paga de su bolsillo el coste del servicio…. ¿O si lo paga?
Parece evidente sacar la conclusión de que el ciudadano que da el aviso NO es consciente del coste incurrido en realizarlo. No se da cuenta del derroche en dinero público (y el mal uso de un recurso de emergencia) que supone llamar a los bomberos para que rescaten a un hámster, una paloma atrapada en un sedal o ayuden a un gato a bajar de un tejado.
  
Aquí se planteaba un problema al que había de que dar una solución que debía repercutir en un uso más eficiente de los recursos públicos y en dar mejor servicio a los ciudadanos. En este caso se planteó una campaña de concienciación ciudadana

2012: La Campaña


En Julio de 2012, el Cuerpo de Bomberos de Londres lanzó la campaña:

Campaña de los bomberos de Londres 2012
Figura 14: Campaña de los Bomberos de Londres 2012: I am an animal, get me out of here”.

El objetivo de la campaña era educar a los ciudadano sobre cómo poder seguir siendo “buenos samaritanos” en caso de encontrar animales en situaciones delicadas sin por ello hacer un mal uso de recursos públicos.

La campaña tenía dos ejes:
  • Por una lado, el de informar del coste que supone para la ciudadanía en general el dar este tipo de avisos directamente a los bomberos
  •  Y por otro, mostrar cuál sería la vía alternativa más adecuada a la que recurrir en este tipo de situaciones. En este caso, llamar a la RSPCA (Royal Society for the revention of Cruelty to Animals).  

Esta campaña tuvo un inmediato efecto positivo sobre la población que se refleja en el descenso del número de avisos registrado a partir de 2012.
  
Noticia sobre el descenso de servicios de rescate animal

Figura 15: Noticia sobre el descenso de servicios de rescate animal.
  
Sin embargo, en 2015 se registró un nuevo cambio de tendencia con un rápido incremento del número de casos. Los bomberos usaron las redes sociales para difundir la campaña.


Campaña de los bomberos de Londres 2012
Figura 16: Campaña de los Bomberos de Londres 2012. 
 
Campaña de la BBC
Figura 17: Campaña de la BBC.


Y, en Febrero de 2017, se publicó un mapa interactivo:



Mapa Interactivo
Figura 18: Mapa Interactivo

Se pone de manifiesto la necesidad de que este tipo de campañas se repitan periódicamente para no perder efectividad.

 

Conclusión final

 
La mayor disponibilidad de datos en abierto sobre los servicios públicos, y de distintas herramientas que permiten combinarlos, analizar patrones y visualizar modelos se pueden traducir rápidamente en ahorros costes, y en ciudadanos satisfechos e involucrados con su entorno.
 
Este ha sido un ejemplo muy sencillo, pero con resultados palpables. Si en 2016 descontamos las salidas del Cuerpo de Bomberos relativas a percances de animales domésticos o de pequeño tamaño, las que consideramos “evitables”, el ahorro hubiera sido de £215.160.
 
Si tenemos en cuenta el potencial que supone el poder aplicar Data Science a todo el arsenal de datos que hoy en día recogen y almacenan instituciones y empresas, nos damos cuenta de la gran oportunidad de mejorar nuestro entorno y nuestras vidas.
 
¡Aprovechémosla!


Para mantenerte al día con LUCA visita nuestra página web,  suscríbete a LUCA Data Speaks o síguenos en TwitterLinkedIn YouTube.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *