Contrôle vert
Lien copié dans le presse-papiers

SharkEye utilise Ultralytics YOLOv8 pour la détection d'objets

Comprends comment SharkEye, présenté à YOLO Vision 2024, s'appuie sur Ultralytics YOLOv8 pour la détection d'objets en temps réel et la sécurité sur les plages.

La surveillance des animaux dans leur habitat naturel, qu'il s'agisse du bétail qui broute dans une ferme ou des requins qui se déplacent près du rivage, a toujours été importante pour leur sécurité et leur bien-être. Cependant, les observer manuellement n'est pas facile. Elle peut souvent nécessiter des heures de patience et de concentration attentive, car les observateurs doivent surveiller de près tout changement de comportement ou de mouvement. Même dans ce cas, il est facile de manquer des signes subtils mais importants.

Grâce à l'intervention de l'intelligence artificielle (IA), ce processus devient plus rapide, plus intelligent et beaucoup plus efficace, réduisant la pression sur les observateurs humains tout en améliorant la précision. La vision artificielle peut notamment être utilisée pour suivre les animaux, repérer les dangers et prendre des décisions en temps réel. Des tâches qui prenaient autrefois des heures peuvent désormais être effectuées en quelques minutes, ce qui ouvre de nouvelles voies pour comprendre le comportement des animaux.

Lors de YOLO Vision 2024 (YV24), un événement hybride annuel organisé par Ultralytics, des experts et des innovateurs se sont réunis pour explorer la façon dont l'IA s'attaque aux défis quotidiens. Certains des sujets présentés comprenaient des avancées dans la détection d'objets en temps réel et la surveillance des animaux, démontrant comment l'IA améliore la sécurité et l'efficacité dans divers domaines.

L'un des temps forts de l'événement a été l'intervention de Jim Griffin, fondateur d'AI Master Group, qui a montré comment Vision AI rend les plages plus sûres en détectant les requins avant qu'ils ne s'approchent trop près du rivage. Il a expliqué comment ils ont utilisé Ultralytics YOLOv8un modèle de vision par ordinateur de pointe, pour identifier avec précision les requins en temps réel, même dans des conditions difficiles telles que des vagues agitées, des reflets et des obstacles sous-marins.

Dans cet article, nous allons examiner de plus près le projet SharkEye et partager des informations intéressantes tirées de la conférence de Jim.

Apprends à connaître SharkEye : Une application de vision par ordinateur

Jim a commencé son exposé en présentant Padaro Beach, une destination de surf bien connue en Californie où les surfeurs et les requins partagent souvent les mêmes eaux. Soulignant le véritable défi que représente la détection des requins, il a partagé : "Bien sûr, il est facile de détecter un requin s'il vous mord, donc ce que nous voulions faire, c'est identifier les requins à l'avance."

Fig 1. Jim sur scène lors de YOLO Vision 2024.

SharkEye a été créé pour s'attaquer à ce problème, avec le soutien de l'Université de Californie, Santa Barbara. Jim a décrit comment des drones équipés de caméras IA à haute résolution ont été utilisés pour voler à environ 200 pieds au-dessus de l'eau, scannant l'océan en temps réel.

Si un requin est détecté, les alertes SMS atteignent environ 80 personnes, y compris les sauveteurs, les propriétaires de magasins de surf et toutes les personnes qui se sont inscrites pour recevoir des mises à jour. Jim a souligné le fait que ces notifications instantanées permettent de réagir rapidement et d'assurer la sécurité des plagistes lorsqu'un requin se trouve à proximité du rivage.

Jim a également mentionné que SharkEye dispose d'un tableau de bord en direct où les utilisateurs peuvent voir les statistiques de détection des requins. Par exemple, sur 12 semaines, le système a identifié deux grands requins et 15 plus petits, soit en moyenne un peu plus d'un requin par semaine.

Il a ensuite présenté Neil Nathan, le scientifique qui a dirigé les efforts derrière SharkEye. Malgré une formation en études environnementales plutôt qu'en informatique, Nathan a mené le projet avec succès. Jim a insisté sur le fait que les outils modernes d'intelligence artificielle, comme ceux utilisés dans SharkEye, sont conçus pour être accessibles, ce qui permet à des personnes n'ayant pas de formation technique de développer des solutions efficaces.

Utilise Ultralytics YOLOv8 pour détecter les requins

En entrant dans les détails, Jim a expliqué ce qui se cache sous le capot de SharkEye et comment la solution de détection des requins ne se limite pas à une simple tâche de détection d'objets. Elle devait faire face à des conditions dynamiques et imprévisibles telles que des algues flottantes qui pouvaient facilement être confondues avec des requins. Contrairement au repérage d'un objet stationnaire, l'identification d'un requin exige précision et adaptabilité, ce qui fait de YOLOv8 un choix idéal.

Un autre avantage de YOLOv8 était qu'il pouvait être déployé sur un drone sans dépendre des serveurs du cloud. Jim a expliqué comment cette approche permettait à SharkEye d'envoyer des alertes immédiates - un élément essentiel pour garantir des réponses opportunes dans des conditions océaniques imprévisibles.

Détection d'objets avec seulement six lignes de code

Après avoir expliqué le fonctionnement de SharkEye et l'effort de collaboration qui le sous-tend, Jim a présenté une démonstration en direct.

Jim Griffin a commencé sa démonstration en direct en présentant au public un exemple familier - un extrait de code "hello world" pour les modèlesYOLO d 'Ultralytics . Avec seulement six lignes de code Python , il a montré comment un modèle Ultralytics YOLOv8 pré-entraîné pouvait détecter sans effort un bus sur une image. 

Fig 2. Démonstration de Jim à YOLO Vision 2024.

Sa démo a utilisé le modèle YOLOv8 Nano, une version légère pour les appareils de faible puissance comme les drones. Le même modèle a été utilisé dans SharkEye pour la détection des requins en temps réel. 

Pour donner plus de contexte, Jim a mentionné que le modèle de la démo était entraîné sur COCO128, un sous-ensemble plus petit de l'ensemble de données COCO largement utilisé. L'ensemble de données COCO contient plus de 20 000 images réparties dans 80 catégories d'objets différentes. Bien que COCO128 fonctionne bien pour les démonstrations rapides, il a souligné que SharkEye avait besoin de quelque chose de plus robuste - un ensemble de données de détection de requins spécifique à l'application qui pourrait gérer les complexités des scénarios du monde réel.

Entraînement personnalisé de YOLOv8 pour SharkEye 

Selon Jim, la partie la plus difficile du projet SharkEye n'était pas d'entraîner le modèle d'IA, mais de recueillir les bonnes données. Il commente : "Le travail principal de ce projet n'était pas l'IA. Le travail principal de ce projet a consisté à faire voler ces drones pendant cinq ans, à extraire les images de ces vidéos et à les étiqueter de manière appropriée."

Il a décrit comment l'équipe a recueilli 15 000 images à la plage de Padaro. Chaque image a dû être étiquetée manuellement pour différencier les requins, les algues et les autres objets dans l'eau. Bien que le processus ait été lent et exigeant, il a jeté les bases de tout ce qui a suivi.

Fig 3. Utilisation de drones pour capturer des images de requins pour la détection d'objets en temps réel.

Une fois l'ensemble de données prêt, Ultralytics YOLOV8 a fait l'objet d'un entraînement personnalisé. Jim a déclaré : "La formation proprement dite n'a pas été la partie la plus difficile - elle n'a pris que 20 heures sur des GPU T4 [unités de traitement graphique]." Il a également ajouté que le temps aurait pu être réduit à cinq heures seulement avec du matériel plus puissant, comme les GPU A100.

Évaluation de SharkEye : La précision plutôt que le rappel

Jim a ensuite expliqué comment les performances de SharkEye étaient évaluées. Il a expliqué que la mesure clé était la précision, c'est-à-dire l'exactitude avec laquelle le système identifiait les vrais requins. Avec une précision impressionnante de 92 %, le modèle SharkEye s'est avéré très efficace pour identifier avec précision les requins dans l'environnement complexe de l'océan.

En approfondissant l'importance de la précision, Jim a précisé pourquoi la précision comptait plus que le rappel dans ce cas. "La plupart du temps, les gens s'intéressent au rappel, en particulier dans des domaines comme la santé où manquer un cas positif peut être critique. Mais dans ce cas, nous ne savions pas combien de requins se trouvaient là, alors ce qui nous importait, c'était la précision", a-t-il expliqué. SharkEye s'est assuré que les fausses alertes étaient minimisées en se concentrant sur la précision, ce qui a permis aux sauveteurs et aux autres intervenants d'agir plus facilement et plus rapidement.

Fig 4. Jim présente SharkEye à YOLO Vision 2024.

Il a terminé son exposé en comparant les performances de l'IA à celles de l'homme, notant que la précision de 92 % de SharkEye dépassait de loin celle de 60 % des experts humains. Il a insisté sur cet écart en disant : "C'est parce que nous sommes humains. Quel que soit notre degré d'expertise, à toi ou à moi, si nous devons rester assis devant un écran toute la journée à chercher des requins, nous finirons par laisser notre esprit vagabonder." Contrairement aux humains, les modèles d'IA ne se fatiguent pas et ne se laissent pas distraire, ce qui en fait une solution fiable pour les tâches nécessitant une surveillance continue.

Ultralytics YOLO11: Le dernier YOLO

Une citation intrigante tirée de la conférence de Jim Griffin, "Six lignes de code pourraient vous sauver la vie un jour", illustre parfaitement à quel point l'IA est devenue à la fois avancée et accessible. Les modèlesYOLO d'Ultralytics ont été créés dans cet esprit, rendant la technologie de pointe de la vision par ordinateur accessible aux développeurs et aux entreprises de toutes tailles. Ultralytics YOLO11 s'appuie sur ce principe en proposant des inférences plus rapides et une plus grande précision. 

Voici un aperçu rapide de ce qui distingue YOLO11 :

  • Architecture repensée: L'architecture améliorée de l'épine dorsale et du cou permet une meilleure extraction des caractéristiques et une précision accrue.
  • Facilité d'utilisation: Il est possible d'y accéder grâce à un codage Python ou à des outils sans code comme Ultralytics HUB.
  • Flexibilité entre les tâches: YOLO11 prend en charge des tâches de vision artificielle telles que la détection d'objets, la segmentation d'instances, la classification d'images, le suivi, l'estimation de la pose et les boîtes de délimitation orientées (OBB).
  • Précision améliorée: YOLO11 atteint une précision moyenne supérieure de 22 % (mAP) par rapport à YOLOv8m sur l'ensemble de données COCO, offrant ainsi des détections plus précises.

Grâce à ces caractéristiques, YOLO11 est parfaitement adapté au suivi du comportement des animaux dans des environnements dynamiques, que ce soit dans une ferme ou dans la nature.

Principaux enseignements

Les avancées en matière d'IA de vision permettent de relever plus facilement les défis du monde réel en fournissant des outils pratiques pour différents domaines. Par exemple, des modèles de vision par ordinateur comme YOLO11 peuvent être utilisés pour la surveillance et le suivi en temps réel des animaux, même dans des conditions difficiles. 

Le discours liminaire de Jim Griffin à YV24 a illustré la façon dont YOLOv8 peut être utilisé pour résoudre des problèmes complexes avec un minimum de codage. Le projet SharkEye, qui associe des drones à l'IA pour la détection des requins en temps réel, a montré comment la technologie peut améliorer la sécurité sur les plages. 

Il s'agissait d'une étude de cas fascinante sur la façon dont l'IA accessible permet à des personnes d'horizons différents de créer des solutions efficaces. À mesure que l'IA continue d'évoluer, elle transforme les industries et permet aux individus d'exploiter son potentiel pour rendre le monde plus sûr, plus intelligent et plus efficace.

Fais partie de notre communauté et explore notre dépôt GitHub pour plonger plus profondément dans l'IA. De la vision par ordinateur dans l'agriculture à l 'IA dans les voitures auto-conduites, vois comment ces technologies favorisent l'innovation. Découvre nos options de licence pour commencer tes projets d'IA dès aujourd'hui !

Logo FacebookLogo de TwitterLogo LinkedInSymbole du lien de copie

Lire la suite dans cette catégorie

Construisons ensemble le futur
de l'IA !

Commence ton voyage avec le futur de l'apprentissage automatique.