Glosario

Operaciones de Aprendizaje Automático (MLOps)

Descubre el poder de MLOps: agiliza el despliegue de modelos ML, automatiza los flujos de trabajo, garantiza la fiabilidad y escala el éxito de la IA de forma eficiente.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Machine Learning Operations (MLOps) es un conjunto de prácticas cuyo objetivo es desplegar y mantener modelos de Machine Learning (ML) en producción de forma fiable y eficiente. Inspirándose en los principios de DevOps, MLOps tiende un puente entre el desarrollo de modelos (científicos de datos, ingenieros de ML) y las operaciones de TI (ingenieros de operaciones), agilizando todo el ciclo de vida del ML, desde la recopilación de datos hasta el despliegue y la supervisión de los modelos. El objetivo es automatizar y estandarizar los procesos, permitiendo una experimentación más rápida, despliegues más fiables y la mejora continua de los sistemas de ML en entornos de producción.

Principios básicos de los MLOP

MLOps se basa en varios principios clave diseñados para gestionar las complejidades únicas de los sistemas de ML:

  • Automatización: Automatización de tareas repetitivas como la preparación de datos, el entrenamiento de modelos, la validación y el despliegue mediante canalizaciones de Integración Continua/Despliegue Continuo (CI/CD ) adaptadas al ML.
  • Colaboración: Fomentar la comunicación y la colaboración entre los equipos de ciencia de datos, ingeniería de software y operaciones a lo largo del ciclo de vida del ML.
  • Control de versiones: Implementar el control de versiones de los datos, el código y los modelos para garantizar la reproducibilidad y la trazabilidad. A menudo se utilizan herramientas como DVC junto con Git.
  • Supervisión del modelo: Seguimiento continuo del rendimiento del modelo, la calidad de los datos y la salud operativa en producción para detectar problemas como la desviación de los datos o la degradación del rendimiento.
  • Gobernanza y cumplimiento: Garantizar que los modelos cumplen los requisitos normativos, las directrices éticas(Ética de la IA) y las políticas organizativas relativas a la privacidad y seguridad de los datos.

El ciclo de vida de MLOps

El ciclo de vida MLOps abarca todo el recorrido de un modelo ML:

  1. Gestión de datos: Ingesta, validación, limpieza(Limpieza de datos) y versionado de conjuntos de datos( las guías deEtiquetado y preparación dedatos se encuentran en Ultralytics Docs).
  2. Desarrollo de modelos: Experimentar con diferentes algoritmos, ingeniería de características y arquitecturas, a menudo utilizando marcos como PyTorch o TensorFlow.
  3. Entrenamiento de modelos: Entrenamiento de modelos a escala, utilizando potencialmente entrenamiento distribuido y gestionando experimentos con herramientas como Weights & Biases o MLflow. El ajuste de hiperparámetros suele automatizarse.
  4. Validación del modelo: Evaluar el rendimiento del modelo utilizando métricas como la precisión o el mAP en los datos de validación.
  5. Despliegue de modelos: Empaquetado(contenedorización con Docker) y despliegue de modelos en entornos de producción, utilizando potencialmente plataformas de orquestación como Kubernetes.
  6. Supervisión y reentrenamiento del modelo: Seguimiento del rendimiento en vivo, detección de la deriva o la decadencia, y activación de tuberías de reentrenamiento cuando sea necesario. La observabilidad desempeña aquí un papel clave.

MLOps vs. Conceptos relacionados

  • MLOps vs. AutoML: Mientras que MLOps abarca toda la gestión del ciclo de vida de principio a fin, el Aprendizaje Automático de Máquinas (AutoML) se centra específicamente en la automatización de los pasos de creación de modelos (preparación de datos, ingeniería de características, selección de modelos, ajuste de hiperparámetros). Las herramientas AutoML pueden ser un componente dentro de un flujo de trabajo MLOps.
  • MLOps vs. Observabilidad: La observabilidad es una capacidad crítica dentro de una estrategia MLOps. Proporciona las herramientas y prácticas (registro, métricas, rastreo) necesarias para comprender el estado interno y el comportamiento de los sistemas ML desplegados, permitiendo una supervisión y resolución de problemas eficaces.

Aplicaciones en el mundo real

Las prácticas MLOps son esenciales para gestionar sistemas complejos de ML en producción:

  1. Sistemas de recomendación: Empresas como Netflix o Spotify utilizan MLOps para reentrenar continuamente los modelos de recomendación basándose en nuevos datos de interacción del usuario, probar A/B diferentes versiones del modelo, controlar las métricas de participación y revertir rápidamente los modelos de bajo rendimiento. Esto garantiza que las recomendaciones sigan siendo relevantes y personalizadas.
  2. Detección del fraude: Las instituciones financieras despliegan canalizaciones MLOps para gestionar los modelos de detección del fraude. Esto implica supervisar los datos de las transacciones para detectar desviaciones, reentrenar automáticamente los modelos con nuevos patrones de fraude, garantizar una baja latencia de inferencia para la detección en tiempo real y mantener registros de auditoría para el cumplimiento de la normativa. Ultralytics YOLO cuando se utilizan en sistemas de inspección visual que podrían alimentar la detección del fraude, también se benefician de MLOps para su despliegue y supervisión.

Herramientas y plataformas

Diversas herramientas apoyan las distintas fases del ciclo de vida de los MLOps:

Poner en práctica los principios de MLOps ayuda a las organizaciones a construir, desplegar y gestionar sistemas de IA de forma más eficaz, salvando la distancia entre la investigación experimental y las aplicaciones de producción fiables.

Leer todo