LUCA LUCA Talk: Blockchain para garantizar la trazabilidad de vacunas FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 2 de enero, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite Trazabilidad es una de las características que vienen a nuestra...
Paloma Recuero de los Santos Drones que usan IA para salvar vidas Cada día encontramos nuevos usos para los drones. Si a sus ventajas que de por sí nos ofrecen, le sumamos la aplicación de técnicas de machine learning, las posibilidades...
Sergio Sancho Azcoitia IA en el mundo de la mecánica: Delta No es la primera vez que os hablamos de sistemas expertos en este blog. Hoy os presentamos DELTA, un interesante sistema experto que se utilizó durante varios años para...
Paloma Recuero de los Santos Video Post #10: IoT y Big Data ¿Qué tienen que ver? ¿Cómo afecta la revolución digital a la vida de las personas?. Porque, en un principio, los avances tecnológicos estaban relacionados con el mundo de la investigación científica, la innovación...
LUCA Caso de éxito: Departamento de Transporte de UK El Departamento de Transporte es el organismo gubernamental responsable de la mayor parte de la red de transporte del Reino Unido. Nuestro cliente necesitaba entender rápidamente los patrones de...
LUCA Caso de éxito ONS: datos para la gestión de movilidad en el Reino Unido En la “historia con datos” de hoy mostramos, una vez más, cómo soluciones basadas en tecnologías Big Data, IoT e Inteligencia Artificial ofrecen un mundo infinito de posibilidades y...
María Cascajo Sastre Caso de éxito: Mejora de los servicios de transporte en Bristol Connected Places Catapult es una empresa que opera entre los sectores público y privado, el gobierno local y las autoridades de transporte, y promueve un transporte más inteligente en...
Ane Urain Estimulando el sector turístico de Perú gracias al Big Data Normalmente, al pensar en Perú, lo primero que nos viene a la mente suelen ser imágenes increíbles del Tren Inca y Machu Picchu. El “imperio incaico” es uno de...
LUCA LUCA Talk: Prediciendo las emergencias del 112 con Inteligencia Artificial Creemos en las infinitas posibilidades que ofrece la tecnología para el bien social, y es por eso que dedicamos nuestro primer webinar del año 2019 a la predicción de...
Ana Zamora LUCA Talk 3: Big Data y Ciclismo, una carrera de fondo El pasado miércoles tuvo lugar nuestro tercer LUCA Talk acerca de cómo el Big Data puede ser aplicado al ciclismo. Mikel Zabala, entrenador del equipo Movistar Team, empezó la...
LUCA LUCA Talk: Blockchain para garantizar la trazabilidad de vacunas FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 2 de enero, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite Trazabilidad es una de las características que vienen a nuestra...
Paloma Recuero de los Santos Video Post #18: Atrévete con Deep Learning. Principios básicos al alcance de todos ¿Sabes qué es el Deep Learning, en qué se basa y qué aplicaciones tiene? En este vídeo te daremos unas sencillas nociones que te ayudarán a comprender esta potente...
Cómo transformar una compañía(IX):Conocer el significado de nuestros datosLUCA 8 octubre, 2020 Cuando una publicación especializada habla sobre los datos de las empresas, es muy habitual que la imagen que acompañe al artículo sea una ilustración en 3D en la que los unos y los ceros discurren frente a un observador de forma similar a como lo hacían en Matrix. Esta representación de los datos, tan cercana a cómo necesita la máquina procesar la información, no se corresponde en absoluto con las necesidades que como humanos tenemos para entender esos datos. Para nosotros es indiferente la forma en la que los datos son almacenados por el ordenador; a nosotros lo que nos importa es lo que los datos significan. Descripciones Cuentan de un CEO que pedía a sus directores el número de clientes que tenía la empresa. Entonces el Director de Marketing, sin dudarlo, sacaba una preciosa infografía, con una tipografía minimalista y colores pastel en la que aparecía la cifra solicitada. Un momento, dijo el Director de Facturación, creo que esa no es la cifra correcta. Y buscando entre sus papeles sacó un gráfico, mucho más modesto, nuevamente con la cifra, según él, solicitada. También las Directoras de Contabilidad y de Sistemas aportaron sus cifras de total de clientes de la empresa, pero ninguna coincidía. Y es que mientras Marketing conocía la cifra de clientes “prospect”, Facturación había escrito la cifra de clientes del último ciclo de facturación, Contabilidad tenía la cifra de todos aquellos que hubieran tenido algo contratado en los últimos 5 años y Sistemas el total de clientes existentes en los archivos históricos. ¿Cómo es posible, bramaba el CEO, que no me podáis responder a una pregunta tan básica para la empresa? Y la cuestión es que todos habían respondido una cifra correcta… a su manera. Al no disponer de una definición clara de lo que es un “Cliente”, cada director había buscado la respuesta de lo que se entiende por cliente dentro de su ámbito, no a nivel global. No habían utilizado una definición común para todos porque no la había. La definición de un lenguaje común para toda la corporación es un objetivo de la máxima importancia para evitar errores en la comprensión de los datos Otro aspecto en el que se debe hacer hincapié en la calidad de las descripciones. En muchas instalaciones es fácil que nos encontremos con descripciones que no aportan ninguna información, por ejemplo, “Cliente: es la tabla que tiene los datos del cliente”. Es lo que los anglosajones llaman descripciones cheeseburger (what is a cheeseburger? A burger with cheese). Si analizamos el ejemplo… … que Cliente es una tabla lo sabíamos porque estamos consultando la descripción de una tabla… que contiene datos lo sabíamos, porque todas las tablas contienen datos… y que son del cliente lo sabíamos, porque estamos en la tabla llamada “Cliente” Para evitar esto las descripciones deben definir el concepto de negocio que se almacena y no el objeto en donde está almacenado (tabla, columna, entidad, atributo, campo, fichero,…). Es una buena práctica nombrarlos siempre en singular, ya que hace más fácil centrarse en el concepto. Así, una buena descripción para el cliente podría ser “Cliente: Persona física o jurídica que tiene contratados los productos o servicios de la compañía”. Con esta descripción los directores no habrían tenido datos discrepantes; solo el de Facturación habría aportado su cifra. Nombres Recientemente, había un nombre de columna que se repetía más de 20 veces en distintas tablas de un único sistema, pero en todos los casos carecía de descripción. Al solicitar que propusieran una definición para esas columnas dijeron, ¡uy, depende! Ese nombre se utiliza unas veces para una cosa y otras veces para otra. Y es que el término “ACEITE”, vinculado a unas máquinas, a veces se refería a la cantidad en litros que se necesitaba, en otras ocasiones era la densidad, en otras un simple indicador de si llevaba o no y, finalmente, podía contener la marca comercial recomendada. Dado que todos los datos tenían el mismo nombre de columna no sería de extrañar que, para analizar el consumo de aceite de esa planta, alguien hubiera sumado los litros del depósito de una máquina con la densidad otra. Pero ¿habría pasado lo mismo si las columnas se hubieran llamado CAN_LITROS_ACEITE, DES_VISCO_ACEITE o NOM_ACEITE? Unos nombres de columna adecuados ayudan a evitar errores, ya que la utilización de nombres más descriptivos nos permite identificar correctamente el contenido de cada campo. Además, los nombres de columna deben ser coherentes en todo el sistema: un nombre de campo debe significar lo mismo en todos los sitios donde aparezca, y el mismo concepto debe aparecer siempre reflejado con idéntico nombre de campo. La utilización de estándares de nomenclatura con prefijos significativos y la utilización de nombres de campo coherentes y significativos, son buenas prácticas cuya aplicación debe ser verificada por la compañía. Disciplinas de Gobierno del Dato Vista la importancia de poder identificar con precisión el significado de nuestros datos, ¿cómo podemos mejorarlo? Hay dos disciplinas fundamentales de Gobierno del Dato en las que nos podemos apoyar para conseguirlo: el modelado de datos y la gestión de metadatos. Modelado de datos Una instalación de base de datos de una gran corporación puede tener millones de elementos de datos. El modelado de datos nos permite tener visiones con distintos niveles de abstracción, de forma que nos permita descomponer la complejidad total del sistema y buscar las mejores soluciones en cada caso. Es un proceso en el que se toman los requisitos de negocio y se diseñan las mejores estructuras de datos para soportarlos. Además: Contiene descripciones precisas, tipos de dato y valores posibles para cada campoEs una conceptualización de nuestros datos que nos permite identificar de manera rápida qué datos tenemos y cómo se relacionan.Es un mapa en el que se representan las reglas de negocio y nos permite navegar por los datos.Lo forman los conceptos de negocio, campos y relaciones.Permite centralizar la gestión y creación de estructuras de datos Con un modelo de datos obtenemosinformación sobre nuestras estructuras de datos, difusión de un lenguaje común y un mapa de relaciones. Ayuda a evitar elnacimiento de silos de información, las duplicidades de datos y los errores de integración de aplicaciones. Además, mejoramos la reusabilidad de los datos maestros, la rapidez de los desarrollos y el control sobre los datos sensibles (GDPR) El modelado de datos es una técnica sobradamente probada para gestores tradicionales de bases de datos (relacionales), pero el mayor reto al que se enfrenta en la actualidad es la aparición de multitud de nuevas tecnologías en las que es complicado aplicar una única fórmula estándar. Los metadatos Por su parte, la herramienta corporativa de metadatos es de gran ayuda para el acercamiento entre el lenguaje utilizado por los usuarios técnicos y los usuarios de negocio. Para ello, permite disponer de: Un glosario de términos de negocio que facilita el lenguaje común en la compañíaUn inventario de los objetos de datos de nuestro sistema, diccionario de datosLa vinculación entre los términos del glosario y los elementos del sistema con los que se ha implementadoLa identificación de los responsables de los datos Conclusión La utilización de un lenguaje común en toda la empresa y el conocimiento preciso del contenido de nuestros datos son dos premisas necesarias para evitar errores de cálculo, retrabajos y duplicidades (de datos y de procesos). Esto permite mejorar la integración de nuestras aplicaciones, los tiempos de desarrollo y la evolución hacia el concepto de “Data Driven”. En definitiva, hacer del dato un activo corporativo. Estas premisas son facilitadoras para multitud de procesos clave en la transformación digital de la empresa, y se usan para análisis de viabilidad técnica de casos de uso, para conectar la tecnología con el negocio, el desarrollo de los procesos de ingesta (o ETL) de los datos. En LUCA contamos con los mejores profesionales que atesoran largos años de experiencia tanto en la definición, gestión, normado y control de modelo de datos, como de herramientas de gestión de metadatos. Escrito por Juan Ignacio Ayala Todos los post de esta serie: Cómo transformar una compañía(I): Priorizar casos de usoCómo transformar una compañía(II): conectar la tecnología con el negocioCómo transformar una compañía(III): Profundizando en la arquitectura de referenciaCómo transformar una compañía (IV): Desarrollar una metodología de ingesta de datosCómo transformar una compañía (V): Complementar las fuentes internas con datos externosCómo transformar una compañía(VI):Las POC o como un proyecto pequeño puede salvar uno grandeCómo transformar una compañía(VII): Poner una PoC en producción Para mantenerte al día con LUCA visita nuestra página web, suscríbete a LUCA Data Speaks o síguenos en Twitter, LinkedIn y YouTube. FitCo Moves: así creó la startup su propia Living App en Movistar+LUCA Talk: Construyendo el futuro de la agricultura inteligente
LUCA LUCA Talk: Blockchain para garantizar la trazabilidad de vacunas FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 2 de enero, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite Trazabilidad es una de las características que vienen a nuestra...
Enrique Blanco Clustering de series temporales con Python La proliferación y la ubicuidad de los datos con dependencia temporal en un amplio abanico de disciplinas genera un interés sustancial en el análisis y la extracción de series...
Francisco Javier Viñas Plaza El gobierno del almacenamiento como palanca de la innovación La Oficina de Dato es un agente de cambio e innovación en una organización. Convierte el gobierno del almacenamiento en una auténtica palanca de la innovación. Veamos el por...
LUCA Toma el control de tus vehículos con Fleet Optimise La movilidad se ha vuelto más inteligente gracias a la presencia de IoT. Del mismo modo que los usuarios utilizan las soluciones conectadas para hacer trayectos más eficientes o...
LUCA Cómo transformar una compañía(XII): la transformación del talento interno El cambio de paradigma que conlleva el uso de grandes volúmenes de datos (internos, de sensores, públicos…) y la aplicación de la Inteligencia Artificial en los negocios es imparable....
Paloma Recuero de los Santos Los mejores post de 2020 en Telefónica IoT & Big Data Este año, como ningún otro, tenemos muchas ganas de arrancar la última hoja del calendario y empezar el del 2021 que, visto lo visto, lo tiene fácil para ser...