[Lectura de 5 minutos]
Desde ZZ Data Labs queríamos ayudar a la comprensión de la dimensión de la epidemia de COVID-19. Durante 15 semanas, presentamos diversos estudios que ayudaban a entender la enfermedad.
Aquí encontrarás los datos históricos de contagio desde que tenemos registro, y predicciones realizadas basadas en algoritmos de inteligencia artificial que reajustamos diariamente hasta el mes de mayo.
Los datos utilizados para el entrenamiento de nuestros modelos fueron obtenidos de organismos oficiales: el Ministerio de Sanidad, el Instituto Nacional de Estadística y el Instituto Geográfico Nacional.
Estimación del número de casos en España en las próximas semanas
Durante toda una semana, desde el día 12 de marzo hasta el 19, trabajamos en un algoritmo de inteligencia artificial capaz de estimar el número de casos positivos simultáneos en España para las siguientes semanas siguiendo varias hipótesis:
- Porcentaje de ciudadanos que interactúa con otros fuera de lugar de residencia
- Movimientos entre municipios en España
- Número medio de personas a las que contagia un portador del virus
- Número de casos positivos no detectados
- Porcentaje medio diario de recuperados o fallecidos
A continuación mostramos el diagrama de alto nivel de nuestra solución, que era capaz de predecir el número de contagios a nivel municipal, así como los ingresos hospitalarios por provincia.

El resultado de nuestro análisis se plasma en la siguiente gráfica, en la que se contemplaban tres escenarios: confinamiento bajo, medio y estricto. La rigidez en el cumplimiento del confinamiento fue clave para disminuir el número de contagios simultáneos.

Densidad de casos por cada 10.000 habitantes en cada Comunidad Autónoma
Dada la gran cantidad de información que recibimos a diario, a menudo cuesta en ocasiones encontrar los datos clave. Uno de los más relevantes es el número relativo de contagios por habitante, que se relaciona de forma directa con la probabilidad de contagio. En el siguiente mapa podemos apreciar como Madrid fue la comunidad más afectada.

Letalidad de la enfermedad por sexo y edad
En las primeras semanas desde el brote de marzo, ZZ Data Labs fue de las primeras en agregar información por sexo y edad y dar información sobre la letalidad del virus. En este caso podemos apreciar como la letalidad en segmentos de edad superiores a 80 años estaba por encima del 10% en mujeres y del 15% en hombres.

Siguientes pasos y modelos más avanzados
La rápida respuesta de ZZ Data Labs llegó a los oidos de la prensa y las insituciones y el modelo inicial siguió evolucionando con los datos de movilidad facilitados por la Secretaría de Estado de Digitalización e Inteligencia Artificial y la colaboración con el Instituto Tecnológico de Aragón.
La evolución del modelo desembocó en resultados de gran utilidad para las instituciones y de un nivel técnico superior, lo que dio lugar a la elaboración de un artículo científico que será publicado en la revista PLOS ONE. Una versión preliminar de este artículo está disponible bajo demanda.
El modelo desarrollado para uso institucional consiste en una Cadena de Markov de 10 estados y más de 30 transiciones para más de 3000 distintas regiones de España con una población de hasta 5000 habitantes por región.
El diagrama de bloques de la solución, mucho más compleja que la solucion inicial, es el siguiente:
