Grüner Scheck
Link in die Zwischenablage kopiert

Behavioral AI macht Computer Vision effektiver

Sei dabei, wenn wir David Scotts YOLO Vision 2024 Keynote über KI-gesteuerte Verhaltensanalyse und ihre realen Anwendungen in Bereichen wie der Tierhaltung wiederholen.

Seit vielen Jahren konzentrieren sich Innovationen im Bereich der Computer Vision auf Aufgaben wie die Objekterkennung - die Identifizierung von Objekten wie einem Hund oder einem Auto in Bildern und Videos. Diese Ansätze haben Anwendungen in Bereichen wie autonome Fahrzeuge, Fertigung und Gesundheitswesen ermöglicht. 

Diese Aufgaben konzentrieren sich jedoch oft nur darauf, zu erkennen, was ein Objekt ist. Was wäre, wenn Vision AI-Systeme einen Schritt weiter gehen könnten? Anstatt einfach nur einen Hund zu erkennen, könnte es zum Beispiel verstehen, dass der Hund einem Ball nachjagt oder dass ein Auto plötzlich bremst, weil ein Fußgänger über die Straße geht. Dieser Übergang von der einfachen Erkennung zum kontextbezogenen Verstehen ist ein wichtiger Schritt hin zu einer intelligenteren, kontextbezogenen VerhaltenskI.

Auf der YOLO Vision 2024 (YV24), der jährlichen Hybrid-Veranstaltung von Ultralytics, auf der die Fortschritte in der KI gefeiert werden, stand das Konzept der KI-gesteuerten Verhaltensanalyse im Mittelpunkt eines interessanten Vortrags von David Scott, CEO von The Main Branch.

In seinem Vortrag ging David auf den Übergang von grundlegenden Computer-Vision-Aufgaben zum Behavioral Tracking ein. Mit über 25 Jahren Erfahrung in der Entwicklung modernster technischer Anwendungen zeigte er die Auswirkungen dieses Sprungs auf. Er betonte, wie die Entschlüsselung von Mustern und Verhaltensweisen Branchen wie die Landwirtschaft und den Tierschutz umgestaltet.

In diesem Artikel gehen wir die Höhepunkte von Davids Vortrag durch und erkunden, wie Behavioral Tracking KI praktischer macht. 

Die Herausforderungen der KI-Einführung verstehen

David Scott begann seine Keynote mit einem mutigen Realitätscheck und sagte: "Ein Kollege von mir sagt oft: 'Wissenschaft verkauft sich nicht', was viele von uns hier irgendwie beleidigt, weil wir Wissenschaft wirklich mögen. KI ist wirklich cool - warum sollten die Leute sie nicht einfach kaufen? Aber die Realität sieht so aus, dass die Leute es nicht kaufen wollen, nur weil wir es cool finden; sie brauchen einen Grund, es zu kaufen.

Er fuhr fort und erklärte, dass in seinem Unternehmen, The Main Branch, der Fokus immer darauf liegt, echte Probleme mit KI zu lösen und nicht nur ihre Fähigkeiten zu zeigen. Viele Kunden kommen zu uns, um darüber zu sprechen, wie sie KI allgemein nutzen können, aber er hält das für einen rückwärtsgewandten Ansatz - es ist, als hätte man eine Lösung ohne ein Problem. Stattdessen arbeiten sie mit Kunden zusammen, die spezifische Herausforderungen mitbringen, damit sie KI-Lösungen entwickeln können, die tatsächlich etwas bewirken.

Abb. 1. David Scott auf der Bühne bei YV24.

David erzählte auch, dass ihre Arbeit oft über das bloße Erkennen von Objekten in einer Szene hinausgeht. Zu erkennen, was da ist, ist nur der erste Schritt. Der eigentliche Wert entsteht, wenn man herausfindet, was man mit diesen Informationen machen kann und wie man sie in der gesamten Wertschöpfungskette nutzen kann. 

Technologie zur Verhaltensbeobachtung: der Schlüssel zu handlungsfähiger KI

Ein wichtiger Schritt, um KI wirklich nützlich zu machen, ist es, über grundlegende Computer Vision-Aufgaben wie die Objekterkennung hinauszugehen und diese Erkenntnisse für das Behavioral Tracking zu nutzen. David betonte, dass sich KI auf das Verstehen von Handlungen und Mustern konzentriert, nicht nur auf die Identifizierung von Objekten. Dadurch ist KI in der Lage, bedeutungsvolle Ereignisse zu erkennen und verwertbare Erkenntnisse zu liefern.

Er nannte das Beispiel eines Tieres, das sich auf dem Boden wälzt, was auf eine Krankheit hinweisen könnte. Während Menschen ein Tier nicht rund um die Uhr beobachten können, können KI-gesteuerte Überwachungssysteme mit Verhaltensverfolgungsfunktionen dies tun. Solche Lösungen können Objekte kontinuierlich überwachen, bestimmte Verhaltensweisen erkennen, einen Alarm auslösen und rechtzeitiges Handeln ermöglichen. So werden die Rohdaten zu etwas Praktischem und Wertvollem.

David zeigte auch auf, dass dieser Ansatz KI nicht nur interessant, sondern auch wirklich wirkungsvoll macht. Indem sie reale Probleme angeht, wie z.B. das Überwachen von Verhaltensweisen und das darauffolgende Handeln, kann das Verhaltenstracking ein wichtiger Bestandteil effektiver KI-Lösungen in verschiedenen Branchen werden.

Verhaltensorientierte KI zum Leben erwecken

David Scott erläuterte anschließend, wie Ultralytics YOLOv8ein Computer-Vision-Modell, einen Durchbruch für die Verhaltensverfolgungsprojekte seines Teams bedeutete. Es gab ihnen eine solide Grundlage für die Erkennung, Klassifizierung und Verfolgung von Objekten. Sein Team ging sogar noch einen Schritt weiter und trainierte YOLOv8 so, dass es sich auf die Beobachtung von Verhaltensweisen im Zeitverlauf konzentriert.

Interessant ist, dass mit der Veröffentlichung von Ultralytics YOLO11können Lösungen wie die von The Main Branch noch zuverlässiger und genauer werden. Dieses neueste Modell bietet Funktionen wie verbesserte Präzision und schnellere Verarbeitung, die die Fähigkeit, Verhaltensweisen zu verfolgen, verbessern. Wir werden das genauer besprechen, nachdem wir ein besseres Verständnis für die Einsatzmöglichkeiten von KI erlangt haben.

Als Nächstes wollen wir uns die Lösungen ansehen, über die David gesprochen hat, und erfahren, wie die Technologie zum Verhaltenstracking in der Praxis eingesetzt wird, um alltägliche Herausforderungen zu lösen und etwas zu bewirken.

HerdSense mit KI-gesteuerter Verhaltensanalyse

Zunächst berichtete David von einer spannenden Herausforderung, die sie mit einem Projekt namens HerdSense angegangen sind, bei dem es darum ging, die Gesundheit von Tausenden von Kühen in einem riesigen Mastbetrieb zu überwachen. Das Ziel war es, das Verhalten der einzelnen Kühe zu verfolgen, um mögliche Gesundheitsprobleme zu erkennen. Das bedeutete, Zehntausende von Tieren gleichzeitig im Auge zu behalten, und das war keine einfache Aufgabe.

Abb. 2. HerdSense konzentriert sich auf die Überwachung und Identifizierung von Kühen durch verhaltensorientierte AI.

Um das Problem zu lösen, jede Kuh zu identifizieren und ihr Verhalten zu verfolgen, führte Davids Team einen zweitägigen Workshop durch, um alle möglichen Verhaltensweisen zu beschreiben, die sie überwachen mussten. Insgesamt identifizierten sie über 200 Verhaltensweisen.

Bei jedem der 200 Verhaltensweisen kam es darauf an, die einzelnen Kühe genau zu erkennen, da alle Daten mit bestimmten Tieren verknüpft werden mussten. Ein großes Problem war es, die Kühe zu verfolgen, wenn sie sich in Gruppen zusammenrotteten, was es schwierig machte, einzelne Tiere zu erkennen. 

Davids Team entwickelte ein Computer-Vision-System, das sicherstellt, dass jede Kuh auch in kniffligen Situationen eindeutig identifiziert wird. Sie konnten bestätigen, dass ein und dieselbe Kuh immer die gleiche ID erhielt, auch wenn sie aus dem Blickfeld verschwand, sich unter andere mischte oder später wieder auftauchte.

Überwachung der Pferdegesundheit mit Computer Vision

Im Anschluss stellte David ein weiteres faszinierendes Projekt vor, bei dem ähnliche Techniken zur Verhaltensüberwachung bei Pferden eingesetzt wurden. Bei diesem Projekt musste Davids Team die IDs der einzelnen Pferde nicht so genau verfolgen , wie sie es bei den Kühen taten. Stattdessen konzentrierten sie sich auf bestimmte Verhaltensweisen und verfolgten Details wie das Fressverhalten und das allgemeine Aktivitätsniveau, um eventuelle Gesundheitsprobleme frühzeitig zu erkennen. Das Erkennen kleiner Verhaltensänderungen könnte zu einem schnelleren Eingreifen führen, um eine bessere Versorgung zu gewährleisten und Probleme zu verhindern, bevor sie ernst werden.

Abb. 3. Überwachung von Pferden mit Hilfe von Behavioral AI.

Warum verhaltensorientierte KI nicht so einfach ist, wie es scheint

David erläuterte auch die Komplexität der Verhaltensanalyse anhand eines interessanten Beispiels. Bei der Suche nach Möglichkeiten zur Verbesserung der Verhaltensanalyse stieß sein Team auf ein Unternehmen, das behauptet, Ladendiebstahl durch die Analyse bestimmter Körperhaltungen zu erkennen, z. B. wenn jemand die Hand in der Tasche hat. Auf den ersten Blick schien das eine clevere Idee zu sein - bestimmte Bewegungen könnten auf verdächtiges Verhalten hindeuten, oder?

Abb. 4. Die Herausforderungen der Technologie zur Verhaltensbeobachtung verstehen.

Als David jedoch weiter forschte, erkannte er die Grenzen dieser Methode. Eine einzelne Pose, wie z. B. eine Hand in der Tasche, bedeutet nicht unbedingt, dass jemand klaut. Sie könnte auch bedeuten, dass die Person entspannt ist, nachdenkt oder ihr sogar kalt ist. Das Problem bei der Konzentration auf einzelne Posen ist, dass sie den größeren Zusammenhang außer Acht lässt. Verhalten ist nicht nur eine einzelne Handlung - es ist ein Muster von Handlungen, das von Kontext und Absicht geprägt ist.

David betonte, dass echtes Verhaltenstracking viel komplexer ist und einen ganzheitlichen Ansatz erfordert. Es geht darum, Abfolgen von Aktionen zu analysieren und zu verstehen, was sie im Gesamtbild bedeuten. Die KI-Branche macht zwar Fortschritte, aber es gibt noch viel zu tun, um das Verhaltenstracking so zu verbessern, dass es aussagekräftige und genaue Erkenntnisse liefert.

Intelligente KI-Modelle schaffen, die Handlungen verstehen

Anschließend nahm David die Zuhörer/innen mit hinter die Kulissen, um ihnen zu zeigen, wie sein Team mit Hilfe von YOLOv8 eine Computer-Vision-Lösung zur Überwachung des Gesundheitszustands von Kühen und deren Posenschätzung entwickelt hat.

Sie begannen damit, einen eigenen Datensatz für die Posenschätzung einer Kuh zu erstellen und die Standardanzahl der Schlüsselpunkte von 17 auf 145 zu erhöhen, damit das Modell die Bewegung besser analysieren kann. Dann wurde das Modell mit einem riesigen Datensatz von über 2 Millionen Bildern und 110 Millionen Verhaltensbeispielen trainiert. 

Mithilfe einer fortschrittlichen Hardware-Infrastruktur konnte Davids Team das Modell in nur zwei Tagen trainieren, anstatt Wochen, die es auf herkömmlicher Hardware gebraucht hätte. Das trainierte Modell wurde dann in einen speziellen Verhaltenstracker integriert, der mehrere Videobilder gleichzeitig analysierte, um Muster in den Handlungen der Kühe zu erkennen.

Das Ergebnis war eine KI-gesteuerte Lösung, die acht verschiedene Verhaltensweisen von Kühen wie Fressen, Trinken und Liegen erkennen und verfolgen kann, um kleine Verhaltensänderungen zu erkennen, die auf gesundheitliche Probleme hinweisen könnten. So können die Landwirte schnell handeln und das Herdenmanagement verbessern.

Der Weg für verhaltensorientierte KI

Zum Abschluss seines Vortrags gab David den Zuhörern eine wichtige Lektion mit auf den Weg: "Wenn du der KI keinen Raum zum Scheitern gibst, machst du dich selbst zum Versager, denn am Ende des Tages ist sie eine Statistik." Er wies darauf hin, dass KI trotz ihrer Stärken nicht fehlerfrei ist. Sie ist ein Werkzeug, das aus Mustern lernt, und es wird immer Zeiten geben, in denen sie etwas nicht richtig macht. Anstatt sich vor diesen Fehlern zu fürchten, müssen wir Systeme entwickeln, die damit umgehen können und sich mit der Zeit immer weiter verbessern.

Das gilt auch, wenn es um die Computer Vision Modelle selbst geht. So wurde zum Beispiel Ultralytics YOLO11 , die neueste Version der Modelle Ultralytics YOLO , mit dem Ziel entwickelt, die Dinge im Vergleich zu YOLOv8 auf die nächste Stufe zu heben. 

Abb. 5. Computer Vision Aufgaben, die von YOLO11 unterstützt werden.

Insbesondere bietet YOLO11 eine bessere Leistung, vor allem bei Echtzeitanwendungen, bei denen es auf Präzision ankommt, wie in der Landwirtschaft und im Gesundheitswesen. Mit seinen fortschrittlichen Funktionen definiert YOLO11 die Art und Weise, wie die Industrie KI einsetzt, neu, indem es innovative Echtzeit-Einsichten liefert und dabei hilft, Herausforderungen effektiver zu bewältigen.

Die wichtigsten Erkenntnisse

Davids Keynote bei YV24 erinnerte uns daran, dass KI mehr als nur eine coole Innovation ist - sie ist ein mächtiges Werkzeug, um echte Probleme zu lösen und die Art und Weise, wie wir leben und arbeiten, zu verbessern. Indem sie sich auf das Verhalten konzentriert, hat KI bereits Auswirkungen auf Bereiche wie die Verfolgung der Gesundheit von Tieren und die Erkennung sinnvoller Muster in alltäglichen Handlungen. 

Das Potenzial der verhaltensorientierten KI ist aufregend, und wir stehen erst am Anfang. Durch die Umwandlung von Rohdaten in verwertbare Erkenntnisse geht die verhaltensbasierte KI von der passiven Überwachung zur aktiven Problemlösung über. Wenn sie sich weiterentwickelt, wird die verhaltensbasierte KI zu intelligenteren Entscheidungen führen, Prozesse rationalisieren und unser Leben sinnvoll verbessern.

Bleib mit unserer Community in Verbindung, um mehr über KI und ihre praktischen Anwendungen zu erfahren. Besuche unser GitHub-Repository, um Innovationen in Bereichen wie KI in der Landwirtschaft und Computer Vision in der Produktion zu entdecken.

Facebook-LogoTwitter-LogoLinkedIn-LogoKopier-Link-Symbol

Lies mehr in dieser Kategorie

Lass uns gemeinsam die Zukunft
der KI gestalten!

Beginne deine Reise in die Zukunft des maschinellen Lernens