Glosario

Despliegue del modelo

Descubre lo esencial del despliegue de modelos, transformando los modelos ML en herramientas del mundo real para predicciones, automatización y conocimientos impulsados por la IA.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El despliegue de modelos es el proceso de integrar un modelo de aprendizaje automático entrenado en un entorno de producción existente para hacer predicciones prácticas y reales. Es un paso crucial en el ciclo de vida del aprendizaje automático, ya que hace que el modelo sea accesible para su uso en aplicaciones, sistemas o procesos empresariales. Sin despliegue, un modelo permanece en un entorno de desarrollo y no puede aportar valor en escenarios del mundo real.

Relevancia del despliegue del modelo

El despliegue de modelos salva la distancia entre el desarrollo de modelos y su aplicación práctica. Es la etapa en la que los modelos de aprendizaje automático pasan de ser construcciones teóricas a herramientas tangibles que pueden automatizar tareas, proporcionar conocimientos e impulsar la toma de decisiones. El éxito del despliegue de modelos garantiza que el esfuerzo y los recursos invertidos en el desarrollo de un modelo se traduzcan en beneficios en el mundo real, ya sea mejorando las operaciones empresariales, mejorando las experiencias de los usuarios o resolviendo problemas complejos. El despliegue es esencial para rentabilizar la inversión en proyectos de IA y aprendizaje automático, permitiendo que los modelos generen predicciones sobre datos nuevos y no vistos, y aprendan y mejoren continuamente con el tiempo mediante la supervisión de los modelos.

Aplicaciones del despliegue de modelos

El despliegue de modelos forma parte integral de una amplia gama de aplicaciones en diversos sectores. He aquí un par de ejemplos concretos:

  • Comercio minorista inteligente: En el comercio minorista, los modelos de detección de objetos, como Ultralytics YOLOv8 , pueden desplegarse en las tiendas para controlar los niveles de inventario en tiempo real. Los modelos desplegados analizan las imágenes de las cámaras para contar automáticamente los productos en las estanterías, identificar los artículos mal colocados y enviar alertas cuando quedan pocas existencias. Esto garantiza una gestión eficaz del inventario, reduce las roturas de stock y mejora la experiencia general de compra al garantizar la disponibilidad de los productos.
  • Vehículos autónomos: Los coches autónomos dependen en gran medida de modelos desplegados de detección de objetos y segmentación de instancias. Estos modelos, a menudo basados en arquitecturas como YOLOv5se despliegan en el ordenador de a bordo del vehículo para procesar los datos de los sensores de las cámaras y LiDAR en tiempo real. Los modelos desplegados detectan peatones, vehículos, señales de tráfico y otros obstáculos, lo que permite al coche navegar con seguridad y tomar decisiones de conducción informadas, contribuyendo a los avances de la IA en los coches autoconducidos.

Consideraciones importantes en la implantación de modelos

Durante la implantación del modelo se tienen en cuenta varios aspectos importantes para garantizar la eficacia, la fiabilidad y la escalabilidad:

  • Inferencia: La inferencia en tiempo real es una consideración clave, especialmente para aplicaciones que requieren predicciones inmediatas, como la conducción autónoma o el análisis de vídeo en tiempo real. Optimizar los modelos para una baja latencia de inferencia es crucial, y a menudo implica técnicas como la cuantización y la poda de modelos para reducir el tamaño del modelo y la sobrecarga computacional. TensorRTEl optimizador de inferencia de alto rendimiento de NVIDIA se utiliza con frecuencia para acelerar la inferencia de los modelos de Ultralytics YOLO en las GPU de NVIDIA .
  • Entornos de despliegue: Los modelos pueden desplegarse en diversos entornos, cada uno con su propio conjunto de requisitos y limitaciones.
  • Servir modelos: El servicio de modelos es el proceso de hacer accesibles los modelos desplegados a aplicaciones o usuarios, a menudo a través de API. Las soluciones robustas de servicio de modelos garantizan una alta disponibilidad, escalabilidad y gestión eficiente de los modelos desplegados. Herramientas como NVIDIA Triton Inference Server pueden integrarse con Ultralytics YOLO para despliegues de inferencia de aprendizaje profundo escalables y eficientes.

El éxito del despliegue de modelos es un proceso polifacético que requiere una cuidadosa planificación, optimización y supervisión para garantizar que los modelos de aprendizaje automático aporten valor en las aplicaciones del mundo real. Plataformas como Ultralytics HUB están diseñadas para simplificar y agilizar el proceso de despliegue, haciendo que sea más accesible para los desarrolladores y las empresas aprovechar el poder de la IA de visión.

Leer todo