Aprende a entrenar a Ultralytics YOLO11 para la estimación de la postura de los perros y aprovecha el modelo entrenado para aplicaciones prácticas como el cuidado de mascotas.
¿Y si la postura de tu perro te permitiera saber cómo se siente? Vigilarlos manualmente las 24 horas del día no es fácil. Sin embargo, gracias a los avances en inteligencia artificial (IA) y visión por ordenador, podemos analizar secuencias de vídeo en tiempo real para comprender mejor su comportamiento.
En concreto, modelos de visión por ordenador como Ultralytics YOLO11 pueden ayudar a estimar la postura de un perro y seguir sus movimientos, proporcionando información valiosa sobre su bienestar. ¿Cómo funciona? La capacidad de estimación de la postura de YOLO11puede identificar puntos clave en el cuerpo de un sujeto para comprender su postura y su movimiento.
Además, YOLO11 puede entrenarse de forma personalizada en un conjunto de datos diseñado para la estimación de la postura de los perros, lo que permite analizar con precisión el lenguaje corporal de tu mascota. El paquetePython Ultralytics es compatible con un conjunto de datos de postura can ina que facilita el entrenamiento y despliegue de modelos de IA de visión para perros. Esta tecnología forma parte del floreciente mercado de la tecnología para mascotas, valorado en 9.400 millones de dólares en 2024 y que se prevé que alcance los 64.000 millones de dólares en 2037.
La inspiración de este artículo es Blues, nuestro Dog Executive Officer (DEO). Si echas un vistazo a nuestra página Quiénes somos, verás que Blues es un valioso miembro del equipo y desempeña un papel importante para que todo siga siendo divertido en Ultralytics.
En este artículo, explicaremos cómo entrenar a YOLO11 de forma personalizada utilizando el Conjunto de datos Dog-Pose para la estimación de la pose de los perros. También exploraremos sus aplicaciones prácticas en el cuidado de mascotas y el análisis del comportamiento.
Un conjunto de datos es una colección de datos utilizados para entrenar modelos de aprendizaje automático. Para la estimación de la pose, un conjunto de datos ideal incluye imágenes con puntos clave etiquetados para mapear las posiciones del cuerpo. También debe tener una variedad de poses, ángulos, condiciones de iluminación y fondos para ayudar al modelo a aprender a reconocer y predecir las poses con precisión. Esta diversidad hace que el modelo sea más fiable para su uso en el mundo real.
El conjunto de datos de poses caninas, respaldado por Ultralytics, está diseñado específicamente para ayudar a los modelos a aprender y reconocer las poses caninas con eficacia. Incluye más de 8.400 imágenes anotadas de varias razas de perros, con etiquetas detalladas para 24 puntos clave, como la cola, las orejas y las patas.
El entrenamiento personalizado de YOLO11 con el conjunto de datos Dog-Pose es un proceso sencillo. Para empezar, tendrás que configurar tu entorno instalando el paquetePython Ultralytics , que incluye todas las herramientas necesarias para el entrenamiento y la evaluación.
Ultralytics es compatible con el conjunto de datos Dog-Pose, lo que elimina la necesidad de etiquetado manual y te permite pasar directamente al entrenamiento. Una vez configurado todo, puedes entrenar a YOLO11 con el conjunto de datos Dog-Pose utilizando sólo unas pocas líneas de código, como se muestra en la imagen siguiente.
Durante el entrenamiento, el modelo aprende a detectar y seguir las poses de los perros en diferentes razas, condiciones de iluminación y entornos. Tras el entrenamiento, puedes visualizar los resultados y ajustar el modelo para mejorar la precisión y el rendimiento.
Si te encuentras con algún problema mientras entrenas a tu modelo, aquí tienes algunos consejos para resolverlo rápidamente:
Puedes consultar la Guía de problemas comunesUltralytics para obtener más consejos sobre la resolución de problemas.
Quizá te preguntes qué ocurre entre bastidores cuando entrenas a YOLO11 de forma personalizada con el Conjunto de datos de la postura del perro. Echemos un vistazo más de cerca al proceso.
En lugar de empezar desde cero, utilizamos un modelo YOLO11 preentrenado, que ya ha sido entrenado en el conjunto de datos COCO-Pose. Este modelo preentrenado puede detectar puntos clave humanos, ya que COCO-Pose está diseñado para la estimación de la pose humana. De hecho, sin ningún entrenamiento adicional, puedes utilizar YOLO11 para realizar la estimación de la pose humana nada más sacarlo de la caja.
Mediante el aprendizaje por transferencia, adaptamos este modelo específicamente para la estimación de la pose del perro, ayudándole a reconocer puntos clave como las patas, la cola y la cabeza. Al exponer el modelo a ejemplos específicos de perros, aprende a centrarse en estas características esenciales.
Durante el entrenamiento, algunas partes del modelo permanecen inalteradas, conservando el conocimiento general obtenido del conjunto de datos COCO. Otras partes se vuelven a entrenar para mejorar la precisión en la estimación de las poses del perro. El modelo aprende comparando sus predicciones con los puntos clave reales del conjunto de datos y ajustándose para reducir los errores. Con el tiempo, este proceso hace que mejore el seguimiento preciso de los movimientos del perro.
El aprendizaje por transferencia también hace posible que el modelo se adapte a diferentes razas, tamaños y patrones de movimiento, garantizando un rendimiento fiable en escenarios del mundo real.
Existen varios modelos de visión por ordenador, así que ¿qué hace que YOLO11 sea la elección correcta para la estimación de la pose del perro?
YOLO11 destaca por su velocidad y precisión en tiempo real, lo que lo convierte en una gran opción para la estimación de la pose del perro. Rinde mejor que las versiones anteriores tanto en precisión como en velocidad. Con un 22% menos de parámetros que YOLOv8, alcanza una precisión media superior (mAP) en el conjunto de datos COCO, lo que significa que detecta los objetos con mayor precisión y eficacia. Su rápida velocidad de procesamiento lo hace perfecto para aplicaciones en tiempo real, donde es esencial una detección rápida y fiable.
Más allá de la estimación de la pose, YOLO11 también admite tareas de visión por ordenador como la segmentación de instancias y el seguimiento de objetos, que pueden ayudar a crear una solución de IA de Visión más completa para vigilar a tu perro. Estas funciones pueden mejorar el seguimiento del movimiento, el análisis del comportamiento y el cuidado general de la mascota.
A continuación, vamos a hablar de las aplicaciones en el mundo real de la estimación de la pose del perro y de su repercusión en el cuidado de las mascotas.
La estimación de la postura del perro puede hacer que su adiestramiento sea más inteligente y eficaz. Digamos que se utiliza una cámara para captar los movimientos del perro, aquí es donde YOLO11 puede intervenir. Puede detectar puntos clave como las patas, la cola y la cabeza, analizándolos para reconocer acciones como sentarse, quedarse quieto o tumbarse.
Si el perro no realiza la acción correctamente, el sistema puede proporcionar información instantánea a través de una aplicación, ayudando al adiestrador en tiempo real. Esto hace que el adiestramiento sea más eficaz, preciso y sensible al progreso del perro.
Por ejemplo, considera la posibilidad de enseñar a tu perro a sentarse a la orden. El sistema puede controlar la postura de tu perro y detectar si está completamente sentado. Si el perro baja el cuerpo pero no se sienta del todo, el sistema puede detectar la acción incompleta y enviar una respuesta instantánea a través de una aplicación. El adiestrador puede modificarse para hacer pequeños ajustes en el adiestramiento, como reforzar la orden o guiar al perro hacia la posición correcta.
La visión por ordenador puede transformar la forma en que los veterinarios abordan el cuidado de los animales. La capacidad de la estimación de la postura del perro para analizar los detalles con precisión facilita la detección de patrones de movimiento inusuales y la identificación de posibles problemas de salud.
Por ejemplo, un veterinario que controle a un perro que se recupera de una lesión de ligamentos puede confiar en YOLO11, entrenado en el Conjunto de datos de posturas de perros, para realizar un análisis automatizado. La cojera o los cambios en la posición de las patas pueden detectarse fácilmente. La monitorización continua, 24 horas al día y 7 días a la semana, proporciona una visión clara de la recuperación del perro, ayudándole a determinar si el tratamiento está funcionando o se necesitan ajustes.
A medida que la tecnología siga evolucionando, es probable que soluciones como la estimación de la postura del perro con YOLO11 desempeñen un papel más importante en la vigilancia y el bienestar de los animales. De hecho, YOLO11 puede integrarse con tecnología ponible, como collares inteligentes y rastreadores de salud, para controlar indicadores clave de salud como la frecuencia cardiaca, los niveles de actividad y los patrones de movilidad.
Por ejemplo, un collar inteligente equipado con sensores de movimiento puede seguir la forma de andar o correr de un perro, mientras que la estimación de postura de YOLO11analiza la postura en tiempo real. Si el sistema detecta un movimiento irregular, como cojera o rigidez, puede correlacionar estos datos con la frecuencia cardiaca y los niveles de actividad para evaluar posibles molestias o lesiones. Los dueños de mascotas y los veterinarios pueden utilizar estos datos para identificar problemas a tiempo y tomar medidas proactivas.
Con estos avances, la estimación de la postura del perro está evolucionando más allá del simple seguimiento del movimiento: se está convirtiendo en una parte clave de un sistema integral de cuidado de mascotas impulsado por la IA, que ayuda a los perros a estar más sanos, más seguros y mejor controlados en tiempo real.
Con innovaciones como YOLO11 y el conjunto de datos Dog-Pose, estamos abriendo nuevas posibilidades en la visión por ordenador. Estos avances nos ayudan a comprender mejor el comportamiento y la salud de los perros de formas que antes no eran posibles.
Rastreando con precisión las posturas de los perros, podemos mejorar el adiestramiento, controlar la salud y hacer más eficaz el cuidado de las mascotas. Ya sea en investigación, atención veterinaria o adiestramiento canino, Vision AI está creando formas más inteligentes de cuidar a nuestros perros y mejorar su bienestar.
Únete a nuestra comunidad y explora nuestro repositorio de GitHub para aprender más sobre IA. Descubre cómo innovaciones como la visión por ordenador en la sanidad y la IA en los coches autoconducidos están dando forma al futuro. Echa un vistazo a nuestras opciones de licencia para empezar hoy mismo tus proyectos de Vision AI.
Comienza tu viaje con el futuro del aprendizaje automático