Aprende todo sobre el nuevo modelo Ultralytics YOLO11 , sus características y aplicaciones en tiempo real en diversas industrias. Te guiaremos a través de todo lo que necesitas saber.
El lunes 30 de septiembre, Ultralytics lanzó oficialmente Ultralytics YOLO11el último avance en visión por ordenador, tras su debut en YOLO Vision 2024 (YV24), el evento híbrido anual de Ultralytics. La comunidad de la IA ha bullido de entusiasmo al apresurarse a explorar las capacidades del modelo. Con un procesamiento más rápido, una mayor precisión y modelos optimizados tanto para dispositivos periféricos como para su despliegue en la nube, YOLO11 redefine lo que es posible en las aplicaciones de visión por ordenador en tiempo real.
En una entrevista, el fundador y director general de Ultralytics , Glenn Jocher, declaró: "El mundo avanza hacia la energía limpia, pero no lo bastante rápido. Queremos que nuestros modelos se puedan entrenar en menos épocas, con menos aumentos y menos datos, así que estamos trabajando duro en ello". El modelo de detección de objetos más pequeño, YOLO11n, tiene sólo 2,6 millones de parámetros, aproximadamente el tamaño de un JPEG, lo que es una auténtica locura. El modelo de detección de objetos más grande, YOLO11x, tiene unos 56 millones de parámetros, e incluso eso es increíblemente pequeño comparado con otros modelos. Puedes entrenarlos en un GPU barato, como un Nvidia GPU de cinco años, con sólo un poco de emoción y un poco de café".
En este artículo, vamos a echar un vistazo más de cerca a YOLO11, explorando sus características, mejoras, pruebas de rendimiento y aplicaciones del mundo real para ayudarte a entender lo que puede hacer este modelo. ¡Empecemos ya!
YOLO11 es el último avance de la serie YOLO (You Only Look Once) de modelos de visión por ordenador, y ofrece mejoras significativas respecto a versiones anteriores como YOLOv5 y YOLOv8. El equipo de Ultralytics ha incorporado los comentarios de la comunidad y la investigación de vanguardia para hacer que YOLO11 sea más rápido, preciso y eficaz. YOLO11 también admite las mismas tareas de visión por ordenador que YOLOv8, incluidas la detección de objetos, la segmentación de instancias y la clasificación de imágenes. De hecho, los usuarios pueden cambiar fácilmente a YOLO11 sin necesidad de modificar los flujos de trabajo existentes.
Uno de los aspectos más destacados de YOLO11 es su rendimiento superior tanto en precisión como en velocidad en comparación con sus predecesores. Con un 22% menos de parámetros que YOLOv8m, YOLO11m consigue una mayor precisión media (mAP ) en el conjunto de datos COCO, lo que significa que puede detectar objetos con mayor precisión y eficacia. En términos de velocidad de procesamiento, YOLO11 supera a los modelos anteriores, lo que lo hace ideal para aplicaciones en tiempo real, donde la detección y la respuesta rápidas son fundamentales, y cada milisegundo cuenta.
El siguiente gráfico de evaluación comparativa ilustra cómo YOLO11 se distingue de los modelos anteriores. En el eje horizontal, muestra la Precisión Media (AP) de la Caja COCO, que mide la precisión de la detección de objetos. El eje vertical muestra la latencia utilizando TensorRT10 FP16 en un NVIDIA T4 GPU, lo que indica la rapidez con la que el modelo procesa los datos.
Con el lanzamiento de Ultralytics YOLO11 , Ultralytics amplía la serie YOLO ofreciendo tanto modelos de código abierto como empresariales para satisfacer la creciente demanda en todos los sectores.
YOLO11 presenta cinco tamaños de modelo distintos: Nano, Pequeño, Mediano, Grande y X. Los usuarios pueden elegir el mejor modelo en función de las necesidades específicas de su aplicación de visión por ordenador. Los cinco tamaños ofrecen flexibilidad en tareas como la clasificación de imágenes, la detección de objetos, la segmentación de instancias, el seguimiento, la estimación de la pose y la detección de objetos con cajas delimitadoras orientadas (OBB). Para cada tamaño, hay un modelo disponible para cada tarea, lo que da como resultado un total de 25 modelos de código abierto que forman el núcleo de la oferta de Ultralytics'. Estos modelos son ideales para una amplia gama de aplicaciones, desde tareas ligeras en dispositivos de borde, donde el modelo YOLO11n ofrece una eficiencia impresionante, hasta aplicaciones a mayor escala que requieren los modelos YOLO11l y YOLO11x.
Por primera vez, Ultralytics presenta modelos empresariales, lo que marca un hito importante en nuestra oferta de productos, y estamos encantados de compartir estas nuevas innovaciones con nuestros usuarios. YOLO11 presenta cinco modelos propios diseñados específicamente para casos de uso comercial. Estos modelos empresariales, que estarán disponibles el mes que viene, se han entrenado en el nuevo conjunto de datos patentado de Ultralytics', que consta de más de 1 millón de imágenes y ofrece modelos preentrenados más robustos. Están diseñados para aplicaciones exigentes del mundo real, como el análisis de imágenes médicas y el procesamiento de imágenes de satélite, donde la detección precisa de objetos es crucial.
Ahora que hemos hablado de lo que ofrece YOLO11 , echemos un vistazo a lo que hace que YOLO11 sea tan especial.
Uno de los principales retos en el desarrollo de YOLO11 fue encontrar el equilibrio adecuado entre prioridades contrapuestas: hacer los modelos más pequeños, más rápidos y más precisos. Como explicó Glenn Jocher, fundador y director general de Ultralytics, "Trabajar en la investigación y el desarrollo de YOLO es un verdadero reto porque quieres ir en tres direcciones distintas: quieres que los modelos sean más pequeños, quieres que sean más precisos, pero también quieres que sean más rápidos en plataformas distintas como CPU y GPU. Todos ellos son intereses contrapuestos, así que tienes que llegar a compromisos y elegir dónde hacer los cambios". A pesar de estos retos, YOLO11 logra un equilibrio impresionante, ofreciendo mejoras tanto en velocidad como en precisión respecto a versiones anteriores como YOLOv8.
YOLO11 aporta mejoras sustanciales, como la extracción de rasgos mejorada con una arquitectura de columna vertebral y cuello rediseñada, que permite una detección de objetos más precisa. El modelo también se ha optimizado para aumentar la velocidad y la eficacia, ofreciendo tiempos de procesamiento más rápidos y manteniendo al mismo tiempo una gran precisión. Además de estas ventajas, YOLO11 es muy adaptable a distintos entornos, ya que funciona sin problemas en dispositivos periféricos, plataformas en la nube y sistemas que utilizan GPUs NVIDIA . Esta adaptabilidad lo convierte en una opción ideal para los usuarios que necesitan opciones de despliegue flexibles en distintas configuraciones de hardware, desde dispositivos móviles hasta servidores a gran escala.
YOLO11lo convierte en una herramienta fiable en muchos sectores, especialmente cuando se trata de casos de uso complejos. Por ejemplo, funciona sin problemas en dispositivos periféricos y puede utilizarse para aplicaciones que requieren análisis en tiempo real en entornos con potencia informática limitada. Un excelente ejemplo de ello es la conducción autónoma, en la que los vehículos deben tomar decisiones en fracciones de segundo para mantener la seguridad de todos. YOLO11 ayuda detectando y analizando objetos en la carretera, como peatones u otros coches, incluso en condiciones difíciles como poca luz o cuando los objetos están parcialmente ocultos. Una detección rápida y precisa ayuda a evitar accidentes y garantiza que los vehículos autoconducidos puedan circular con seguridad.
Otro ejemplo interesante del alcance de YOLO11es su capacidad para manejar cajas delimitadoras orientadas (OBB). Es esencial para detectar objetos que no están perfectamente alineados. La detección de objetos OBB es una función especialmente útil en sectores como la agricultura, la cartografía y la vigilancia, donde las imágenes suelen contener objetos girados, como cultivos o edificios en imágenes aéreas o por satélite. A diferencia de los modelos tradicionales, YOLO11 puede identificar objetos en cualquier ángulo y proporcionar resultados mucho más exactos para tareas que requieren precisión.
Empezar a trabajar con YOLO11 es sencillo y accesible, tanto si prefieres codificar como si prefieres una opción sin código. Para trabajar con YOLO11 mediante código, puedes utilizar el paqueteUltralytics Python para entrenar e implantar modelos fácilmente. Si prefieres un enfoque sin código, Ultralytics HUB te permite probar YOLO11 con sólo unos clics.
Para utilizar YOLO11 con Python, primero tendrás que instalar el paquete Ultralytics . Dependiendo de tus preferencias, puedes hacerlo utilizando pip, conda o Docker. Para obtener instrucciones detalladas y las mejores prácticas relacionadas con el proceso de instalación, asegúrate de consultar nuestra Guía de instalación deUltralytics . Mientras instalas los paquetes necesarios para YOLO11, si encuentras alguna dificultad, consulta nuestra Guía de problemas comunes para encontrar soluciones y consejos.
Una vez que tengas instalado el paquete Ultralytics , utilizar YOLO11 es muy sencillo. El siguiente fragmento de código te guía por el proceso de cargar un modelo, entrenarlo, probar su rendimiento y exportarlo al formatoONNX . Para obtener ejemplos más detallados y un uso más avanzado, consulta la documentación oficial de Ultralytics , donde encontrarás guías detalladas y las mejores prácticas para sacar el máximo partido a YOLO11.
Para los usuarios que prefieren un enfoque sin código, Ultralytics HUB proporciona una forma sencilla de entrenar y desplegar los modelos YOLO11 con sólo unos clics. Para empezar a utilizar HUB, sólo tienes que crear una cuenta en la plataforma Ultralytics HUB, y podrás empezar a entrenar y gestionar tus modelos a través de una interfaz intuitiva.
La comunidad de la IA avanza constantemente en el campo de la visión por ordenador esforzándose por desarrollar modelos más rápidos y precisos para las aplicaciones del mundo real. Ultralytics YOLO11 es un hito importante en este esfuerzo, ya que aporta mayor velocidad, precisión y flexibilidad. Está diseñado para aplicaciones en tiempo real y de borde, lo que lo hace ideal para sectores como la sanidad y la conducción autónoma. Tanto si utilizas el paquete Ultralytics Python como el Hub sin código Ultralytics , YOLO11 simplifica las complejas tareas de IA de Visión. Ofrece potentes capacidades de visión por ordenador, por lo que es una gran elección para desarrolladores y empresas.
Echa un vistazo a nuestro repositorio de GitHub y únete a nuestra activa comunidad para aprender más sobre IA. Explora cómo Vision AI está impulsando la innovación en sectores como la sanidad y la agricultura.
Comienza tu viaje con el futuro del aprendizaje automático