El gobierno del almacenamiento como palanca de la innovaciónFrancisco Javier Viñas Plaza 19 enero, 2021 La Oficina de Dato es un agente de cambio e innovación en una organización. Convierte el gobierno del almacenamiento en una auténtica palanca de la innovación. Veamos el por qué. Algo de historia … Mi primer proyecto Hadoop vino por un datawarehouse que estaba al máximo de capacidad: el disco casi lleno, la ventana batch de proceso agotada, los usuarios quejándose que las consultas cada vez tardaban más. No habría habido mayor problema si la ampliación hubiera sido posible. Pero sabíamos que el presupuesto para ello tardaría en llegar mucho más que lo que el sistema podría aguantar. Y algo había que hacer. Nos pusimos a analizar por dónde era posible recortar. Buscamos redundancias de procesos o almacenamiento que, eliminándolas, nos diera unos meses de tregua. Analizamos las cadenas de carga, los tiempos de proceso. Vimos que la demanda de recursos máxima recaía en el procesado de un mega tablón. Esta tabla la usaba el proceso para generar un agregado del reporting mensual. De hecho, si no fuera por ese proceso en concreto, la máquina incluso podría considerarse holgada… Y entonces se nos ocurrió. En vez de cargar el tablón en el datawarehouse, los desviaríamos a un sistema de alternativo: A un datalake. Allí generaría diariamente el agregado que luego moveríamos al datawarehouse para que los usuarios pudieran consultarlo y hacer los informes. El mega tablón se quedó en el datalake, por si se requiriese un reproceso. La solución fue un éxito además de técnico, económico: se pudo realizar un “downsizing” del sistema, con el consiguiente ahorro de costes de hardware y licencias . Y la ampliación de la base de datos… pues ya no hizo falta. Llegaban tiempos nuevos. Mejora continua Pasan los años, y las mismas cuestiones de negocio siguen esperando la respuesta “más adecuada”. Que cambiará, ajustándose a la capacidad tecnología del momento. Y en esta búsqueda , se innova. Pequeños pasos que, poco a poco, provocan la disrupción, un cambio sustancial y radical. El replanteamiento de la solución y, a veces incluso, la reformulación de la pregunta original que inició todo. Y no solo es plantearse lo nuevo. Innovar supone también replantarse cómo se hacen las cosas «de siempre» para hacerlas aún mejor. Para mejorar, conócete a ti mismo Para proponer mejoras y dar una valoración objetiva de su valor respecto a la situación de partida son necesarias referencias métricas. Estos datos deben ser historificados y , si puede ser, ligados a eventos. Esto nos ayudará a predecir y anticipar situaciones en eventos clave futuros que sigan un patrón conocido. Métricas e indicadores que definen el gobierno del almacenamiento de datos El almacenamiento de datos tiene sus propias métricas a las que referir la eficiencia de su gestión y gobierno. Así, podemos hablar de métricas de: Capacidad (estadísticas básicas de transacciones, almacenamiento, número de objetos y de usuarios …) Servicio (tiempos de respuesta a peticiones de servicio o incidencias, número de incidencias, encuestas de satisfacción …) Rendimiento (estadísticas de consultas, de cargas, de volumen de backup, de recuperación de datos …) Figura 1: Métricas de datos (Ampliar imagen) Todas ellas, deben ser moduladas y evaluadas considerando el factor coste. Y no es un cálculo simple. Deberán tenerse en cuenta todos los costes debidos al uso de la tecnología: el coste de la licencia del software, el coste de mantenimiento de la plataforma, los salarios del personal de IT que operan el sistema, así como el coste de formación a técnicos y usuarios. Por otro lado, deberán incluirse también costes tales como el del espacio físico que se ocupa (en caso de on premise). Figura 2: Seguimiento de activos (Ampliar imagen) Implicaciones y riesgos a considerar Además de los antes mencionados, habrá que incluir en la evaluación de costes las implicaciones técnicas, económicas y legales debidas al cumplimiento de la legislación relativa al almacenamiento y gestión de los datos de nuestros clientes (GDPR, LOPD, reglamentos sectoriales propios de la industria) Y por último, tendremos que considerar el factor riesgo y coste de oportunidad de las diferentes opciones posibles. Por ejemplo, aunque el movimiento natural es llevar sistemas a la nube, en algunos casos se está produciendo el movimiento inverso: traerlo a on premise. Se trata de negocios en los que prima el control de los datos sobre cualquier otra consideración. Decisiones basadas en datos Con todas estas cuestiones, el gestor que gobierna el almacenamiento podrá tomar decisiones ajustadas a sus necesidades y estrategia, que además estarán basadas en datos. Su gestión podrá ser por tanto medible, sujeta a seguimiento y evaluable. Los datos nos dirán el valor (coste económico, oportunidad y riesgo) de migrarlo todo o solo parte del sistema a la nube. Nube que para unos datos puede ser pública, pero para otros será privada o directamente en on premise. De hecho las nubes híbridas suelen ser la solución más habitual. La Oficina de Gobierno del Dato y el seguimiento de activos Una de las ventajas de tener insertada en la organización una Oficina de Gobierno de Dato es que contamos con un equipo encargado de realizar el seguimiento de los activos. La Oficina recopila y analiza los datos para optimizar el coste total de propiedad (TCO) de la tecnología encomendada. Figura 3: Ingredientes para el cálculo del Coste Total de Propiedad Algunas de las tareas que frameworks como el de DAMA asigan a la oficina de Gobierno del dato son: Garantizar que la compañía cumple con todos los acuerdos de licencia, requisitos reglamentarios y normativos de las tecnologías en uso por parte de la organización.Realizar auditorías anuales de licencias de software, costes de soporte, de arrendamiento de servidores, alquiler de locales y otros costes fijos.Evaluar regularmente la conveniencia de tecnologías y productos que se están volviendo obsoletos, sin soporte, menos útiles o demasiado caros y plantear alternativas ajustadas a los requisitos de la organización. Figura 4: Control del almacenamiento (Ampliar imagen) Conclusión La Oficina de Dato es un agente de cambio e innovación en una organización: vela porque la tecnología en uso esté actualizada y sea estratégicamente la más adecuada, cuantificando y proponiendo opciones de mejora periódicas alineadas con las particularidades del negocio y de la organización donde desarrolla su servicio. Referencia: DAMA_Data Management Post recomendados: Los datos como nuevo factor de producciónProducto Telefónica Data Governance Para mantenerte al día con LUCA visita nuestra página web, suscríbete a LUCA Data Speaks o síguenos en Twitter, LinkedIn y YouTube ENIA, la nueva Estrategia Nacional sobre IAUna solución para adaptar la flota de vehículos frente a la COVID-19 y la tormenta Filomena
AI of Things Iníciate en Inteligencia Artificial generativa (y responsable) con estos cursos gratuitos de Google Aprende sobre los conceptos y principios de la IA generativa o cómo crear y desplegar soluciones de IA: modelos de lenguaje, generación de imágenes... y también sobre IA responsable.
Nacho Palou Qué es el invierno-IA y cómo evitarlo ¿Estamos a las puertas de un nuevo invierno-IA? ¿Qué factores podrían propiciarlo? El miedo, una legislación restrictiva o la falta de avances pueden impactar el futuro de la IA.
Nacho Palou El poder de la digitalización sostenible en la lucha contra el cambio climático El cambio climático es considerado el mayor desafío de nuestro tiempo. Sus efectos abarcan desde la desertización y sequías hasta inundaciones y aumento del nivel del mar. Algunas de...
Roberto García Esteban ChatGPT y Cloud Computing: un matrimonio bien avenido ChatGPT (quizá no sepas que son las siglas de Chat Generative Pre-Trained Transformer) está en boca de todos por su impresionante habilidad para generar textos que parecen escritos por...
Olivia Brookhouse ¿Puede la Inteligencia Artificial entender las emociones? Cuando John McCarthy y Marvin Minsky iniciaron la Inteligencia Artificial en 1956, se sorprendieron de cómo una máquina podía resolver rompecabezas increíblemente difíciles en menos tiempo que los humanos. Sin...
Javier Martínez Borreguero Automatización, Conectividad e Inteligencia Aumentada al servicio de una reindustrialización competitiva, disruptiva y sostenible Por segundo año consecutivo vuelvo a participar en el Advanced Factories (AF 2023), la mayor exposición y congreso profesional dedicado a la Industria 4.0 del sur de Europa. Un...