MLOps: los científicos de datos se suman al DevOps

Alejandro de Fuenmayor    2 marzo, 2021
mlops

En los últimos años en este blog he ido descifrando toda una serie de acrónimos desconocidos para el publico general. Muchos de ellos han pasado desapercibidos al principio y luego se han puesto de moda. Hoy es el turno de MLOps.

Todo empezó allá por 2004 cuando una pregunta rondaba la cabeza de más de un CIO: ¿Qué es DevOps? Años más tarde con la evolución de este movimiento, dábamos la bienvenida al DevSecOps: la seguridad como un requisito más en el flujo de diseño, desarrollo y entrega de aplicaciones. Y recientemente escribía de FinOps, un enfoque multidisciplinar y ágil de gestión de proyectos en la nube.

Los “acronimOps” no paran de crecer

La realidad de las X-Ops viene impuesta por la necesidad de las compañías de incorporar modelos ágiles de desarrollo, ya sea en lo relativo a la innovación, procesos o código o cualquier otra disciplina afectada en estos días por el entorno VUCA en el que vivimos.

Así, la familia de los “acronimOps” no para de crecer. Cada vez son más las áreas que se incorporan a estos procesos de trabajo conjunto entre departamentos para la gestión de los ciclos de desarrollo de código y los propios productos y servicios de cualquier compañía.

¿Qué es MLOps?

En el caso de MLOps, como podréis intuir, es el acrónimo de machine learning o aprendizaje automático integrado dentro del proceso de operaciones de la empresa.

MLOps no es más que la práctica de integrar en un flujo de trabajo conjunto basado en DevOps las labores de los científicos de datos en el desarrollo de código con el resto de equipos. Se trata de crear y ejecutar modelos de aprendizaje automático con procedimientos de desarrollo e implementación que no dejen de lado a otros equipos de desarrollares, de seguridad o a los responsables de explotación y gestión de la infraestructura.

La importancia de MLOps en estos momentos

La importancia de los modelos MLOps radica en la madurez alcanzada por los proyectos de inteligencia artificial y machine learning en las organizaciones.

A lo largo de la última década han dejado de ser algo en lo que los equipos de I+D trabajaban de forma aislada. Antes la utilización de modelos predictivos o de aprendizaje automático básicamente se restringía a proyectos con una duración determinada con unos entregables finitos en el tiempo, sin continuidad alguna en el ciclo de vida del proyecto resultante.

Ahora la casuística y procesos alrededor de este tipo de iniciativas requieren de ajustes en las operaciones tradicionales de cualquier departamento de explotación. Los requerimientos de recursos de cómputo frente a las necesidades de almacenamiento -que podríamos definir como almacenamiento efímero o no persistente-, altera en muchas ocasiones los patrones de uso tradicional de las empresas.

Cuestión de tecnología y de coordinación de personas y procesos

Pero para la ejecución y éxito de este tipo de proyectos, más allá de la propia tecnología, es de vital importancia, el trabajo coordinado de personas y procesos .

Y esto se ha acelerado con el COVID-19 en todos los sectores y negocios. Las iniciativas desarrolladas en los últimos meses para un mejor entendimiento de los patrones de contagio y una acertada toma de decisiones con ayuda de modelos predictivos se han hecho realidad gracias al trabajo coordinado de los científicos de datos, desarrolladores y los equipos de operaciones de plataformas y servicios TIC.

Claves para el éxito de un proyecto MLOps

Las metodologías y marcos de trabajo suelen ser útiles en cualquier actividad y en el caso del MLOps no debería ser diferente. A continuación, resumo cuatro aspectos clave para asegurar el éxito en este tipo de proyectos:

  • El modelo MLOps requiere una sintonía especifica con el ciclo de vida de los desarrollos de inteligencia artificial de una organización. Es necesario entender y hacer participes a los diferentes interlocutores dentro de la empresa. Hay que tener en cuenta que los datos de negocio no son estáticos, Y el lenguaje deberá ser comprensible para cualquiera persona que participe en el proyecto.
  • Todos o casi todos los proyectos de machine learning vienen motivados por una necesidad del negocio: reducir el fraude, conocer los patrones de consumo o abandono de los clientes, mejorar la eficiencia,… Sea cual fuere, uno de los puntos críticos es la elección de los datos para alimentar el modelo. Hay que tener siempre en mente la importancia de su relevancia y calidad, si la cantidad de los mismos es suficiente o no para entrenar el modelo y la actualización. Uno de los aspectos en los que MLOps aporta más valor a la organización es en la enseñanza y comunicación sobre cómo han sido construidos los modelos, con documentación y seguimiento de la implementación de mejoras en las diferentes versiones así como dotación de un conjunto de puntos de referencia sobre los que medir mejoras e ineficiencias.

El objetivo común y los principales retos

El seguimiento y gobierno de este tipo de proyectos es fundamental. En ocasiones cada área del proceso tiene intereses contrapuestos. Así, TI o DevOps se centran en la estabilidad y rendimiento de la plataforma, mientras que el científico de datos vela porque el modelo no se degrade o pierda valor con el paso del tiempo.

Por último, hacer que esta maquinaria funcione requiere de pautas y herramientas para que todos los involucrados en el proyecto trabajen por un objetivo común. Los principales retos de este tipo de proyectos estriban en el gobierno de los datos y el gobierno del propio proceso: desde la definición de la audiencia del modelo, su ciclo de vida y entregables, así como el retorno e impacto del mismo.

Imagen: Mike MacKenzie

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *