Comprende cómo SharkEye, presentado en YOLO Vision 2024, aprovecha Ultralytics YOLOv8 para la detección de objetos en tiempo real y la seguridad en las playas.
Vigilar a los animales en sus hábitats naturales, ya sea el ganado pastando en una granja o los tiburones moviéndose cerca de la orilla, siempre ha sido importante para su seguridad y bienestar. Sin embargo, observarlos manualmente no es fácil. A menudo puede requerir horas de paciencia y una cuidadosa concentración, ya que los observadores tienen que estar atentos a cualquier cambio de comportamiento o movimiento. Incluso así, es fácil pasar por alto señales sutiles pero importantes.
Gracias a la intervención de la inteligencia artificial (IA), este proceso se está volviendo más rápido, más inteligente y mucho más eficaz, lo que reduce la presión sobre los observadores humanos al tiempo que mejora la precisión. En particular, la visión por ordenador puede utilizarse para seguir a los animales, detectar peligros y tomar decisiones en tiempo real. Tareas que antes llevaban horas ahora pueden hacerse en minutos, abriendo nuevas vías para comprender el comportamiento animal.
En YOLO Vision 2024 (YV24), un evento híbrido anual organizado por Ultralytics, expertos e innovadores se reunieron para explorar cómo la IA está abordando los retos cotidianos. Algunos de los temas expuestos fueron los avances en la detección de objetos en tiempo real y la vigilancia de animales, demostrando cómo la IA está mejorando la seguridad y la eficiencia en diversos campos.
Uno de los aspectos más destacados del evento fue una charla de Jim Griffin, fundador de AI Master Group, en la que demostró cómo Vision AI está haciendo que las playas sean más seguras al detectar tiburones antes de que se acerquen demasiado a la orilla. Explicó cómo utilizaban Ultralytics YOLOv8un modelo de visión por ordenador de vanguardia, para identificar con precisión a los tiburones en tiempo real, incluso en condiciones difíciles como olas agitadas, deslumbramiento y obstáculos submarinos.
En este artículo, examinaremos más de cerca el proyecto SharkEye y compartiremos ideas interesantes de la charla de Jim.
Jim empezó su charla presentando Padaro Beach, un conocido destino de surf en California donde los surfistas y los tiburones suelen compartir las mismas aguas. Destacando el verdadero reto de la detección de tiburones, compartió: "Por supuesto, es fácil detectar a un tiburón si te muerde, así que lo que queríamos hacer era identificar a los tiburones de antemano."
SharkEye se creó para abordar este problema, con el apoyo de la Universidad de California en Santa Bárbara. Jim describió cómo se utilizaron drones con cámaras de IA de alta resolución para volar a unos 60 metros sobre el agua, escaneando el océano en tiempo real.
Si se detecta un tiburón, las alertas por SMS llegan a unas 80 personas, incluidos socorristas, propietarios de tiendas de surf y cualquiera que se haya inscrito para recibir actualizaciones. Jim señaló cómo estas notificaciones instantáneas permiten una respuesta rápida, manteniendo a los bañistas más seguros cuando hay un tiburón cerca de la orilla.
Jim también mencionó que SharkEye cuenta con un panel de control en vivo donde los usuarios pueden ver las estadísticas de detección de tiburones. Por ejemplo, a lo largo de 12 semanas, el sistema identificó dos tiburones grandes y 15 más pequeños, con una media de poco más de un tiburón por semana.
A continuación, presentó a Neil Nathan, el científico que dirigió los esfuerzos detrás de SharkEye. A pesar de tener formación en estudios medioambientales y no en informática, Nathan dirigió con éxito el proyecto. Jim hizo hincapié en cómo las herramientas modernas de IA, como las utilizadas en SharkEye, están diseñadas para ser accesibles, permitiendo que personas sin formación técnica desarrollen soluciones impactantes.
Profundizando en los detalles, Jim explicó lo que hay bajo el capó de SharkEye y cómo la solución de detección de tiburones no se limitaba a una simple tarea de detección de objetos. Tenía que enfrentarse a condiciones dinámicas e impredecibles, como algas flotantes que podían confundirse fácilmente con tiburones. A diferencia de la detección de un objeto inmóvil, la identificación de un tiburón requiere precisión y adaptabilidad, lo que convierte a YOLOv8 en la elección ideal.
Otra ventaja de YOLOv8 era que podía desplegarse en un dron sin depender de servidores en la nube. Jim explicó cómo este enfoque hizo posible que SharkEye enviara alertas inmediatas, algo esencial para garantizar respuestas oportunas en condiciones oceánicas impredecibles.
Tras destacar cómo funciona SharkEye y el esfuerzo de colaboración que hay detrás, Jim mostró una demostración en directo.
Jim Griffin comenzó su demostración en directo guiando al público a través de un ejemplo familiar: un fragmento de código "hola mundo" para los modelosYOLO de Ultralytics . Con sólo seis líneas de código Python , mostró cómo un modeloYOLOv8 de Ultralytics preentrenado podía detectar sin esfuerzo un autobús en una imagen.
En su demostración utilizó el modelo YOLOv8 Nano, una versión ligera para dispositivos de baja potencia como los drones. El mismo modelo se utilizó en SharkEye para la detección de tiburones en tiempo real.
Para proporcionar más contexto, Jim mencionó que el modelo de la demostración se estaba entrenando con COCO128, un subconjunto más pequeño del conjunto de datos COCO, ampliamente utilizado . El conjunto de datos COCO contiene más de 20.000 imágenes de 80 categorías de objetos diferentes. Aunque COCO128 funciona bien para demostraciones rápidas, señaló que SharkEye necesitaba algo más robusto: un conjunto de datos de detección de tiburones específico para una aplicación que pudiera manejar las complejidades de los escenarios del mundo real.
Según Jim, lo más difícil del proyecto SharkEye no fue entrenar el modelo de IA, sino reunir los datos adecuados. Comentó: "El trabajo principal de este proyecto no fue la IA. El principal trabajo de este proyecto fue sobrevolar esos drones durante cinco años, seleccionar las imágenes de esos vídeos y etiquetarlas adecuadamente".
Describió cómo el equipo recogió 15.000 imágenes en la playa de Padaro. Cada imagen tuvo que ser etiquetada manualmente para diferenciar entre tiburones, algas y otros objetos en el agua. Aunque el proceso fue lento y exigente, sentó las bases de todo lo que vino después.
Una vez que el conjunto de datos estuvo listo, Ultralytics YOLOV8 se entrenó a medida con él. Jim dijo: "El entrenamiento en sí no fue la parte difícil: sólo llevó 20 horas en GPUs T4 [unidades de procesamiento gráfico]". También añadió que el tiempo podría haberse reducido a tan sólo cinco horas con un hardware más potente, como las GPU A100.
A continuación, Jim habló de cómo se evaluaba el rendimiento de SharkEye. Explicó que la métrica clave era la precisión, es decir, la exactitud con la que el sistema identificaba a los tiburones reales. SharkEye alcanzó una impresionante precisión del 92%, lo que demostró que el modelo era muy eficaz para identificar tiburones en el complejo entorno oceánico.
Profundizando en la importancia de la precisión, Jim aclaró por qué la precisión importaba más que la recuperación en este caso. "La mayoría de las veces, a la gente le interesa el recuerdo, sobre todo en ámbitos como la sanidad, donde omitir un caso positivo puede ser crítico. Pero en este caso, no sabíamos cuántos tiburones había ahí fuera, así que lo que nos importaba era la precisión", explicó. SharkEye garantizó que las falsas alarmas se redujeran al mínimo centrándose en la precisión, lo que facilitó que los socorristas y otros intervinientes actuaran con rapidez.
Concluyó su charla comparando la IA con el rendimiento humano, señalando que la precisión del 92% de SharkEye superaba con creces la precisión del 60% de los expertos humanos. Subrayó esta diferencia diciendo: "Es porque somos humanos. Por muy expertos que seamos tú o yo, si tenemos que sentarnos delante de una pantalla todo el día a buscar tiburones, al final, dejaremos que nuestra mente divague". A diferencia de las personas, los modelos de IA no se cansan ni se distraen, lo que los convierte en una solución fiable para las tareas que requieren una supervisión continua.
Una intrigante cita de la charla de Jim Griffin, "Seis líneas de código podrían salvarte la vida algún día", capta a la perfección lo avanzada que se ha vuelto la IA, pero a la vez accesible. Los modelosYOLO de Ultralytics se han creado con esto en mente, haciendo que la tecnología de visión por ordenador de vanguardia sea accesible a desarrolladores y empresas de todos los tamaños. Ultralytics YOLO11 se basa en esto con inferencias más rápidas y mayor precisión.
He aquí un rápido vistazo a lo que distingue a YOLO11 :
Estas características hacen que YOLO11 sea ideal para el seguimiento del comportamiento animal en entornos dinámicos, ya sea en una granja o en la naturaleza.
Los avances en la IA de visión están facilitando la superación de los retos del mundo real al proporcionar herramientas prácticas para diversos campos. Por ejemplo, los modelos de visión por ordenador como YOLO11 pueden utilizarse para la vigilancia y el seguimiento de animales en tiempo real, incluso en condiciones difíciles.
El discurso de Jim Griffin en YV24 ilustró cómo puede utilizarse YOLOv8 para resolver problemas complejos con una codificación mínima. El proyecto SharkEye, que combina drones con IA para la detección de tiburones en tiempo real, mostró cómo la tecnología puede mejorar la seguridad en las playas.
Fue un estudio de caso fascinante sobre cómo la IA accesible capacita a personas de distintos orígenes para crear soluciones eficaces. A medida que la IA sigue evolucionando, está transformando las industrias y haciendo posible que las personas aprovechen su potencial para hacer del mundo un lugar más seguro, más inteligente y más eficiente.
Forma parte de nuestra comunidad y explora nuestro repositorio de GitHub para profundizar en la IA. Desde la visión por ordenador en la agricultura hasta la IA en los coches autoconducidos, descubre cómo estas tecnologías están impulsando la innovación. Echa un vistazo a nuestras opciones de licencia para comenzar tus proyectos de IA hoy mismo.
Comienza tu viaje con el futuro del aprendizaje automático