Paloma Recuero de los Santos ENIA, la nueva Estrategia Nacional sobre IA Desde el pasado 2 de diciembre, España cuenta con una nueva Estrategia Nacional de Inteligencia Artificial, ENIA, dotada con un presupuesto de 600 millones de euros para medidas relacionadas...
LUCA LUCA Talk: Blockchain para garantizar la trazabilidad de vacunas FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 20 de enero, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite Trazabilidad es una de las características que vienen a nuestra...
Elena Selgas Carvajal Una radio cada día más inteligente gracias a la IA Actualmente contamos con la presencia de radios online y podcast que han revolucionado el sector de la radio adaptándose a los nuevos hábitos de consumo. En este post vamos...
Fran Ramírez Cómo entrenar a tu Inteligencia Artificial jugando videojuegos, Parte 5. Aprende Q-Learning con el juego “Taxi”, parte 2 de 2 Escrito por Fran Ramírez, Investigador en Eleven Paths y escritor del libro “Microhistorias: anecdotas y curiosidades de la historia de la informática”. En el artículo anterior de esta serie implementamos una solución para resolver un...
LUCA Una solución para adaptar la flota de vehículos frente a la COVID-19 y la tormenta Filomena La movilidad es un aspecto clave tanto en el día a día de las ciudades como en las situaciones excepcionales que hemos experimentado en el último año por la...
LUCA Caso de éxito: Departamento de Transporte de UK El Departamento de Transporte es el organismo gubernamental responsable de la mayor parte de la red de transporte del Reino Unido. Nuestro cliente necesitaba entender rápidamente los patrones de...
LUCA Case study: Como está usando Jacobs LUCA Transit para mejorar el sistema de transportes en UK Escrito por Dave Sweeney, Head of Smart Steps (Public & Transport) en O2. El transporte público se compone de viajes diarios alrededor de todo el mundo. No importa si se...
LUCA Caso de éxito: Departamento de Transporte de UK El Departamento de Transporte es el organismo gubernamental responsable de la mayor parte de la red de transporte del Reino Unido. Nuestro cliente necesitaba entender rápidamente los patrones de...
LUCA LUCA Talk: Flotas y Big Data, optimiza y haz más eficiente tu negocio La gestión de flotas de vehículos es un aspecto crítico para muchas empresas que ya han dado el paso de la conexión y están haciendo con éxito la gestión...
LUCA LUCA Talk: Roles profesionales en el mundo del Big Data En el mundo del Big Data y la Inteligencia Artificial, hay muchísimos roles de donde elegir, que requieren distintas habilidades, y es habitual tener muchas dudas si no se...
LUCA LUCA Talk: Blockchain para garantizar la trazabilidad de vacunas FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 20 de enero, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite Trazabilidad es una de las características que vienen a nuestra...
Paloma Recuero de los Santos Video Post #18: Atrévete con Deep Learning. Principios básicos al alcance de todos ¿Sabes qué es el Deep Learning, en qué se basa y qué aplicaciones tiene? En este vídeo te daremos unas sencillas nociones que te ayudarán a comprender esta potente...
Las Matemáticas del Machine Learning: Ejemplos de Regresión Lineal (II) y MultilinealLUCA 25 abril, 2019 En el anterior artículo vimos el concepto de recta de Regresión Lineal, y cómo obtener sus parámetros o coeficientes estadísticos. Vamos a ver ahora un ejemplo práctico donde podemos aplicarla. 1. Regresión lineal: La siguiente tabla muestra el índice de mortalidad (Y) y el consumo medio diario de cigarrillos (X) para poblaciones distintas: Figura 1: tabla de datos mortalidad por consumo tabaco. ¿Qué índice de mortalidad se podría predecir para una población que consume una media de 32 cigarrillos diarios? Buscamos nuestra expresión, Y=b0 + b1X, para ello necesitaremos calcular b0 y b1, para calcular nuestros coeficientes estadísticos obtendremos las medias, varianzas y covarianzas muestrales: Figura 2: Medias, varianzas y covarianzas muestrales. Por lo tanto, nuestra recta de regresión queda determinada por la siguiente ecuación: Figura 3: Ecuación de la recta de regresión. Veamos el coeficiente de correlación, para determinar la “proximidad” de nuestra recta: Figura 4: Coeficiente de correlación. Es un valor muy próximo a 1, por lo que la dependencia de las variables es muy directa: A mayor consumo medio diario de cigarrillos diarios, mayor índice de mortalidad. Por último calculemos el índice mortal de nuestra población: Figura 5: Índice de mortalidad. 2. Regresión Multilineal: Hasta ahora hemos considerado el método lineal, es decir, una variable dependiente y otra independiente, pero ¿qué pasaría si encontramos que una variable depende de más de una variable? Pues bien, cuando tenemos una extensión del modelo lineal, es decir, cuando tenemos más de una variable independiente o explicativa, estaremos hablando del modelo de Regresión Lineal Múltiple, o Multilineal. Nuestro modelo sigue de la siguiente relación entre las variables explicativas o independientes (x1,x2,x3,…xn) y la variable respuesta o dependiente (y): Figura 6: Fórmula de regresión multivariable. Donde ϵi, sigue una distribución Normal N(0 , σ^2 ), es el error de observación, β0 es el término independiente. Es el valor esperado de y cuando x1,…,xp son cero, βi mide el cambio en y por cada cambio unitario en xi, manteniendo el resto de variables constantes. ¿Qué información muestral tenemos? Figura 7: Información muestral. Por lo que el valor que el modelo estimado predice para la observación i-ésima es: Figura 8: Valor estimado para la observación i-ésima. Y el error cometido en nuestra predicción será: Figura 9: Error en la predicción. Donde: Figura 10: Valores estimados. nos muestra los valores estimados del modelo. El criterio de mínimos cuadrados asignado valores a nuestros valores estimados, tales que minimiza el valor de la suma de los errores al cuadrado de las observaciones. Podemos plantear el modelo en forma matricial de la siguiente forma: Figura 11: Ecuación matricial. o bien: Figura 12: Ecuación matricial extendida. Para estimar el vector de parámetros β, aplicaremos el método de mínimos cuadrados de manera análoga al modelo lineal simple. El criterio de mínimos cuadrados asigna a los parámetros del modelo el valor que minimiza la suma de errores al cuadrado de todas las observaciones. Así pues sea S la suma de los errores al cuadrado: Figua 13: Ecuación cálculo suma errores cuadrados. Para calcular el mínimo de S, lo que hacemos es primero derivar S con respecto a los parámetros, luego igualar a cero cada derivada (quedándonos un sistema de ecuaciones en el que cada incógnita viene dada por los parámetros que queremos estimar), y por último resolver el sistema de ecuaciones. En términos matriciales: Figura 14: Cálculo de la derivada de S respecto a los parámetros. Siendo X^T la matriz traspuesta e igualando a 0 obtenemos: Figura 14: Valores de los parámetros que minimizan S. Ejemplo: Veamos a continuación un ejemplo de un estudio sobre la abundancia (Recuento) de un parásito en 15 localizaciones diferentes en función de su temperatura y la humedad. Los datos obtenidos son los siguientes: Figura 15: Tabla de datos sobre presencia de un parásito según CC temperatura/humedad. Figura 16: Representación gráfica de la tabla anterior. Al parecer tanto la temperatura como la humedad influyen en el recuento: Figura 17: Aplicación de la fórmula de regresión multilineal. Sean: Figura 18: Expresión matricial. Si aplicamos los cálculos anteriores obtenemos: Figura 19: Valores obtenidos. En el siguiente artículo, veremos qué conclusiones obtenemos a partir de la muestra, así como la coolinealidad de las variables independientes y cómo estas pueden afectar a nuestro modelo. Por último hablaremos de los contrastes de hipótesis y de los intervalos de confianza. Esto es todo por hoy ;), hasta el próximo capítulo de nuestra serie de las Matemáticas del Machine Learning. Cualquier duda podéis publicarla como comentario en este mismo artículo. No te pierdas los artículos anteriores: Las Matemáticas del Machine Learning ¿Qué debo saber? Las Matemáticas del Machine Learning: explicando la Regresión Lineal (I) Escrito por Fran Fenoll (@ffenoll16), Fran Ramírez (@cyberhadesblog y @cybercaronte) y Enrique Blanco (@eblanco_h) ambos del equipo de Ideas Locas CDO de Telefónica. Innovación constante: la fórmula para competir en la economía analíticaAbril en el blog de LUCA: Resúmenes semanales
LUCA Una solución para adaptar la flota de vehículos frente a la COVID-19 y la tormenta Filomena La movilidad es un aspecto clave tanto en el día a día de las ciudades como en las situaciones excepcionales que hemos experimentado en el último año por la...
Francisco Javier Viñas Plaza El gobierno del almacenamiento como palanca de la innovación La Oficina de Dato es un agente de cambio e innovación en una organización. Convierte el gobierno del almacenamiento en una auténtica palanca de la innovación. Veamos el por...
Paloma Recuero de los Santos ENIA, la nueva Estrategia Nacional sobre IA Desde el pasado 2 de diciembre, España cuenta con una nueva Estrategia Nacional de Inteligencia Artificial, ENIA, dotada con un presupuesto de 600 millones de euros para medidas relacionadas...
LUCA LUCA Talk: Blockchain para garantizar la trazabilidad de vacunas FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 20 de enero, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite Trazabilidad es una de las características que vienen a nuestra...
Enrique Blanco Clustering de series temporales con Python La proliferación y la ubicuidad de los datos con dependencia temporal en un amplio abanico de disciplinas genera un interés sustancial en el análisis y la extracción de series...
LUCA Fleet Optimise en la era Post-COVID La llegada de la COVID-19 ha alterado el mundo tal y como lo conocíamos y está obligando a muchas empresas a evolucionar digitalmente para adaptarse a las nuevas necesidades...