Deep Learning e imágenes por satélite para estimar el impacto de la COVID19

AI of Things    4 noviembre, 2020
imágenes de satélite comerciales cortesía de Maxar Technologies©.

Motivados por el hecho de que la pandemia de COVID-19 ha causado conmoción mundial en un corto periodo de tiempo desde diciembre de 2019, estimamos el impacto negativo del confinamiento a causa de la COVID-19 en la capital de España, Madrid, utilizando imágenes de satélite comerciales cortesía de Maxar Technologies©. Las autoridades en España están adoptando todas las medidas necesarias, incluyendo ciertas restricciones a la movilidad urbana, para contener la propagación del virus y mitigar su impacto en la economía nacional. Dichas restricciones dejan señales en las imágenes de satélite que se pueden detectar y clasificar automáticamente.

Detección de vehículos.

Nuestra idea es desarrollar una solución que permita el conteo de automóviles estimando la presencia de coches visibles en imágenes satelitales de alta resolución. Estudios recientes revelan un incremento de hasta un 90% cuando se compara el tráfico de coches entre otoño de 2018 y 2019 en varios hospitales de Wuhan, China. Esta observación parece indicar que una infección estaba creciendo en la comunidad y ciertas personas requerían atención médica. De igual manera, partimos de la hipótesis de que el número de coches disminuyó drásticamente durante el confinamiento debido a la COVID-19 en Madrid, para investigar más a fondo cómo detectar con precisión estos automóviles utilizando técnicas de visión por computador.

Imágenes satelitales cortesía de RSMetrics© sugieren que la COVID-19 podría haber estado circulando por China mucho antes de que se conociera el primer caso.
Figura 1: Imágenes satelitales cortesía de RSMetrics© sugieren que la COVID-19 podría haber estado circulando por China mucho antes de que se conociera el primer caso.

Deep Learning.

Por esta razón, investigamos cómo detectar con precisión dichos coches usando técnicas de visión por computador. Recientemente, impulsados por el éxito de los algoritmos basados en deep learning, la mayor parte de la literatura ha buscado enfoques inspirados en redes neuronales convolucionales (CNNs). La principal razón de su popularidad es que las CNNs aprenden a extraer características de la imagen de manera automática, de modo que no hay necesidad de seleccionarlas manualmente. Como resultado, las CNNs atraen un gran interés debido a que son más robustas frente a los múltiples cambios de apariencia que presentan las imágenes adquiridas en escenarios “sin restricciones”.

Las aproximaciones actuales que detectan objetos generalmente fallan o pierden precisión debido al tamaño relativamente pequeño de los objetos de interés y la gran cantidad de datos a procesar en imágenes “sin restricciones” con la presencia de factores adversos como son, diferentes ciudades/países, cambios en la perspectiva, oclusiones, iluminación, borrosidad, etc.

Figura 2: Variabilidad hostil en apariencia debido a diferentes factores que incluyen cambios de punto de vista (ángulo nadir), sombras, cambios de luz marcados por el clima y las estaciones, etc.
Figura 2: Variabilidad hostil en apariencia debido a diferentes factores que incluyen cambios de punto de vista (ángulo nadir), sombras, cambios de luz marcados por el clima y las estaciones, etc.

Datos etiquetados.

Hemos organizado los métodos existentes en dos categorías en función de si directamente estiman la cantidad de coches a partir de la imagen (conteo por regresión) o si primero aprenden a detectar coches individualmente y luego cuentan las ocurrencias para establecer la cantidad total de automóviles en la imagen (conteo por detección). Así, llegamos a la conclusión de que este último enfoque logra un rendimiento superior.

Ambos enfoques supervisados necesitan un conjunto de imágenes de entrenamiento etiquetadas. Conteo por regresión requiere del número total de coches anotados. Conteo por detección requiere la posición de cada vehículo definiendo las coordenadas del rectángulo que delimita su superficie
Figura 3: Ambos enfoques supervisados necesitan un conjunto de imágenes de entrenamiento etiquetadas. Conteo por regresión requiere del número total de coches anotados. Conteo por detección requiere la posición de cada vehículo definiendo las coordenadas del rectángulo que delimita su superficie

Además de por las dificultades anteriormente mencionadas, la detección de automóviles en imágenes satelitales también se ve afectada por el problema del sesgo en el conjunto de datos, lo que significa que los modelos aprendidos habitualmente solo funcionan bien en la misma escena en la que fueron entrenados. Para aliviar tales sesgos, entrenamos nuestro modelo utilizando diferentes imágenes anotadas con automóviles capturados a diferentes resoluciones espaciales de las bases de datos COWC y DOTA, reflejando las necesidades de las aplicaciones del mundo real. Hasta donde sabemos, esta es la primera vez que un algoritmo combina con éxito imágenes a diferentes resoluciones para hacer frente a la falta de datos satelitales debidamente anotados.

Conjunto de datos de Madrid.

Como era de esperar, necesitamos la resolución más alta comercialmente disponible para poder detectar vehículos pequeños. Por esta razón, descargamos 153 imágenes de satélite de 22 regiones de interés alrededor de la comunidad autónoma de Madrid con una resolución espacial de 30 cm (datos del satélite WorldView-4 accesibles mediante la plataforma SecureWatch©). Seleccionamos áreas concretas de Madrid donde el conteo de coches sea un proxy de actividad como son, centros comerciales, nudos en las carreteras, hospitales, zonas industriales y universidades, entre otros.

En el siguiente vídeo podemos observar visualmente la reducción en el número total de coches antes y durante las restricciones de movilidad a causa de la COVID-19. Por tanto, parece razonable estudiar el impacto global del confinamiento en el volumen de tráfico.

Recorrido por algunas imágenes procesadas para percibir visualmente la dramática reducción en la presencia de vehículos sobre Madrid (audio en español con subtítulos en inglés).

Resultados

En los experimentos medimos el rendimiento de nuestra propuesta y calculamos estadísticas de recuento de automóviles para cuantificar la dramática caída en la cantidad de vehículos durante el confinamiento. Como resultado, corroboramos estas estadísticas utilizando indicadores adicionales como puedan ser los datos de telecomunicaciones y los sensores de tráfico respectivamente. Llegamos a la conclusión de que todos estos indicadores también se correlacionan con las estadísticas oficiales de actividad económica, por lo que el recuento de automóviles puede complementar las medidas tradicionales de actividad económica ayudando a los responsables políticos a adaptar sus propuestas para aplanar la curva de recesión.

Curvas que indican cómo está evolucionando el brote COVID-19 en Madrid desde 2020.
Figura 4: Curvas que indican cómo está evolucionando el brote COVID-19 en Madrid desde 2020.

Los colores rojo, amarillo y azul comparan las curvas obtenidas con datos de telecomunicaciones anonimizados y agregados de las antenas de Telefónica Movistar, estadísticas de tráfico adquiridas de los sensores del Ayuntamiento de Madrid, y estimando la presencia de coches visibles con nuestra tecnología satelital respectivamente.

Información adicional sobre la tecnología de detección de vehículos, las imágenes satelitales de alta resolución descargadas, un análisis de mercado, y resultados comparativos para cada región de interés también son presentados en el material complementario.

Escrito por Roberto Valle Fernández.

No te pierdas el próximo webinar Deep Learning e IA para mejorar el tráfico en tiempos de Covid19″ que tendrá lugar el próximo 25 de noviembre. Para agendarte este evento pincha aquí. (Recuerda seguir los pasos de registro para poder verlo en directo)


Otros post sobre aplicaciones del Deep Learning relacionadas con el COVID19:

Para mantenerte al día con LUCA visita nuestra página web o síguenos en TwitterLinkedIn YouTube.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *