Machine Learning Operations (MLOps) es un conjunto de prácticas cuyo objetivo es desplegar y mantener modelos de Machine Learning (ML) en producción de forma fiable y eficiente. Inspirándose en los principios de DevOps, MLOps tiende un puente entre el desarrollo de modelos (científicos de datos, ingenieros de ML) y las operaciones de TI (ingenieros de operaciones), agilizando todo el ciclo de vida del ML, desde la recopilación de datos hasta el despliegue y la supervisión de los modelos. El objetivo es automatizar y estandarizar los procesos, permitiendo una experimentación más rápida, despliegues más fiables y la mejora continua de los sistemas de ML en entornos de producción.
Principios básicos de los MLOP
MLOps se basa en varios principios clave diseñados para gestionar las complejidades únicas de los sistemas de ML:
- Automatización: Automatización de tareas repetitivas como la preparación de datos, el entrenamiento de modelos, la validación y el despliegue mediante canalizaciones de Integración Continua/Despliegue Continuo (CI/CD ) adaptadas al ML.
- Colaboración: Fomentar la comunicación y la colaboración entre los equipos de ciencia de datos, ingeniería de software y operaciones a lo largo del ciclo de vida del ML.
- Control de versiones: Implementar el control de versiones de los datos, el código y los modelos para garantizar la reproducibilidad y la trazabilidad. A menudo se utilizan herramientas como DVC junto con Git.
- Supervisión del modelo: Seguimiento continuo del rendimiento del modelo, la calidad de los datos y la salud operativa en producción para detectar problemas como la desviación de los datos o la degradación del rendimiento.
- Gobernanza y cumplimiento: Garantizar que los modelos cumplen los requisitos normativos, las directrices éticas(Ética de la IA) y las políticas organizativas relativas a la privacidad y seguridad de los datos.
MLOps vs. Conceptos relacionados
- MLOps vs. AutoML: Mientras que MLOps abarca toda la gestión del ciclo de vida de principio a fin, el Aprendizaje Automático de Máquinas (AutoML) se centra específicamente en la automatización de los pasos de creación de modelos (preparación de datos, ingeniería de características, selección de modelos, ajuste de hiperparámetros). Las herramientas AutoML pueden ser un componente dentro de un flujo de trabajo MLOps.
- MLOps vs. Observabilidad: La observabilidad es una capacidad crítica dentro de una estrategia MLOps. Proporciona las herramientas y prácticas (registro, métricas, rastreo) necesarias para comprender el estado interno y el comportamiento de los sistemas ML desplegados, permitiendo una supervisión y resolución de problemas eficaces.
Aplicaciones en el mundo real
Las prácticas MLOps son esenciales para gestionar sistemas complejos de ML en producción:
- Sistemas de recomendación: Empresas como Netflix o Spotify utilizan MLOps para reentrenar continuamente los modelos de recomendación basándose en nuevos datos de interacción del usuario, probar A/B diferentes versiones del modelo, controlar las métricas de participación y revertir rápidamente los modelos de bajo rendimiento. Esto garantiza que las recomendaciones sigan siendo relevantes y personalizadas.
- Detección del fraude: Las instituciones financieras despliegan canalizaciones MLOps para gestionar los modelos de detección del fraude. Esto implica supervisar los datos de las transacciones para detectar desviaciones, reentrenar automáticamente los modelos con nuevos patrones de fraude, garantizar una baja latencia de inferencia para la detección en tiempo real y mantener registros de auditoría para el cumplimiento de la normativa. Ultralytics YOLO cuando se utilizan en sistemas de inspección visual que podrían alimentar la detección del fraude, también se benefician de MLOps para su despliegue y supervisión.