Behavioral AI macht Computer Vision noch wirkungsvoller

Abirami Vina

4 Minuten lesen

6. Januar 2025

Seien Sie dabei, wenn wir David Scotts YOLO Vision 2024-Keynote über KI-gesteuerte Verhaltensanalyse und ihre realen Anwendungen in Bereichen wie der Tierhaltung wiederholen.

Seit vielen Jahren konzentrieren sich Innovationen im Bereich der Computer Vision auf Aufgaben wie die Objekterkennung - die Identifizierung von Objekten wie einem Hund oder einem Auto in Bildern und Videos. Diese Ansätze haben Anwendungen in Bereichen wie autonome Fahrzeuge, Fertigung und Gesundheitswesen ermöglicht. 

Diese Aufgaben konzentrieren sich jedoch oft nur darauf, zu erkennen, was ein Objekt ist. Was wäre, wenn Vision-KI-Systeme einen Schritt weiter gehen könnten? Anstatt einfach nur einen Hund zu erkennen, könnte es zum Beispiel verstehen, dass der Hund einem Ball hinterherjagt oder dass ein Auto plötzlich bremst, weil ein Fußgänger die Straße überquert. Dieser Übergang von der einfachen Erkennung zum kontextbezogenen Verstehen ist ein wichtiger Schritt hin zu einer intelligenteren, kontextbewussten VerhaltenskI.

Auf der YOLO Vision 2024 (YV24), der jährlichen Hybrid-Veranstaltung von Ultralytics, auf der die Fortschritte im Bereich Vision AI gefeiert werden, stand das Konzept der KI-gesteuerten Verhaltensanalyse im Mittelpunkt eines interessanten Vortrags von David Scott, CEO von The Main Branch.

In seinem Vortrag untersuchte David den Übergang von grundlegenden Computer-Vision-Aufgaben zum Behavioral Tracking. Mit über 25 Jahren Erfahrung in der Entwicklung modernster technischer Anwendungen zeigte er die Auswirkungen dieses Sprungs auf. Er betonte, wie die Entschlüsselung von Mustern und Verhaltensweisen Branchen wie die Landwirtschaft und den Tierschutz umgestaltet.

In diesem Artikel gehen wir die Höhepunkte von Davids Vortrag durch und erkunden, wie Behavioral Tracking KI praktischer macht. 

Die Herausforderungen der KI-Einführung verstehen

David Scott begann seine Keynote mit einem kühnen Realitätscheck und sagte: "Ein Kollege von mir sagt oft: 'Wissenschaft verkauft sich nicht', was viele von uns hier irgendwie beleidigt, weil wir Wissenschaft wirklich mögen. KI ist wirklich cool - warum sollten die Leute sie nicht einfach kaufen? Aber die Realität ist, dass die Leute es nicht kaufen wollen, nur weil wir es cool finden; sie brauchen einen Grund, es zu kaufen.

Er fuhr fort und erklärte, dass in seinem Unternehmen, The Main Branch, der Schwerpunkt immer auf der Lösung echter Probleme mit KI liegt und nicht nur auf der Präsentation ihrer Fähigkeiten. Viele Kunden kommen zu uns und wollen darüber sprechen, wie sie KI im Allgemeinen nutzen können, aber er hält das für einen rückwärtsgewandten Ansatz - es ist, als hätte man eine Lösung ohne ein Problem. Stattdessen arbeiten sie mit Kunden zusammen, die spezifische Herausforderungen mitbringen, damit sie KI-Lösungen entwickeln können, die tatsächlich einen Unterschied machen.

__wf_reserved_inherit
Abbildung 1. David Scott auf der Bühne bei YV24.

David erzählte auch, dass ihre Arbeit oft über das bloße Erkennen von Objekten in einer Szene hinausgeht. Das Erkennen von Objekten ist nur der erste Schritt. Der eigentliche Wert entsteht, wenn man herausfindet, was man mit diesen Informationen tun kann und sie in der größeren Wertschöpfungskette nutzbar macht. 

Technologie zur Verfolgung von Verhaltensweisen: der Schlüssel zu handlungsfähiger KI

Ein entscheidender Schritt, um KI wirklich nützlich zu machen, besteht darin, über grundlegende Computer-Vision-Aufgaben wie die Objekterkennung hinauszugehen und diese Erkenntnisse für die Verhaltensverfolgung zu nutzen. David betonte, dass sich die verhaltensorientierte KI auf das Verstehen von Handlungen und Mustern konzentriert, nicht nur auf die Identifizierung von Objekten. Dadurch ist die KI in der Lage, sinnvolle Ereignisse zu erkennen und verwertbare Erkenntnisse zu liefern.

Als Beispiel nannte er ein Tier, das sich auf dem Boden wälzt, was auf eine Krankheit hinweisen könnte. Während Menschen ein Tier nicht rund um die Uhr beobachten können, können KI-gesteuerte Überwachungssysteme mit Verhaltensverfolgungsfunktionen dies tun. Solche Lösungen können Objekte kontinuierlich überwachen, bestimmte Verhaltensweisen erkennen, einen Alarm senden und rechtzeitiges Handeln ermöglichen. Auf diese Weise werden Rohdaten in etwas Praktisches und Wertvolles verwandelt.

David zeigte auch auf, dass dieser Ansatz KI nicht nur interessant, sondern wirklich wirkungsvoll macht. Durch die Lösung echter Probleme, wie die Überwachung von Verhaltensweisen und das Ergreifen von Maßnahmen, kann die Verhaltensverfolgung zu einem wichtigen Bestandteil effektiver KI-Lösungen in verschiedenen Branchen werden.

Verhaltensorientierte KI zum Leben erwecken

David Scott erläuterte dann, wie Ultralytics YOLOv8, ein Computer-Vision-Modell, einen Durchbruch für die Projekte seines Teams zur Verhaltensverfolgung bedeutete. Es bot ihnen eine solide Grundlage für die Erkennung, Klassifizierung und Verfolgung von Objekten. Sein Team ging sogar noch einen Schritt weiter und trainierte YOLOv8 so, dass es sich auf die Überwachung von Verhaltensweisen über einen längeren Zeitraum konzentriert, was es praktischer und hilfreicher für reale Situationen macht.

Interessanterweise können Lösungen wie die von The Main Branch mit der Veröffentlichung von Ultralytics YOLO11 noch zuverlässiger und genauer werden. Dieses neueste Modell bietet Funktionen wie verbesserte Präzision und schnellere Verarbeitung, die seine Fähigkeit, Verhaltensweisen zu verfolgen, verbessern. Wir werden dies im Detail besprechen, nachdem wir ein besseres Verständnis für die Anwendungen von Behavioral AI erlangt haben.

Als Nächstes wollen wir uns die Lösungen ansehen, über die David gesprochen hat, und erfahren, wie die Technologie zur Verhaltensverfolgung in der Praxis eingesetzt wird, um alltägliche Probleme zu lösen und eine sinnvolle Wirkung zu erzielen.

HerdSense mit AI-gesteuerter Verhaltensanalyse

Zunächst berichtete David von einer spannenden Herausforderung, die sie mit einem Projekt namens HerdSense in Angriff genommen haben, bei dem es um die Überwachung des Gesundheitszustands von Tausenden von Kühen in einem riesigen Mastbetrieb ging. Ziel war es, das Verhalten der einzelnen Kühe zu verfolgen, um mögliche Gesundheitsprobleme zu erkennen. Das bedeutete, Zehntausende von Tieren gleichzeitig im Auge zu behalten, und das war keine einfache Aufgabe.

__wf_reserved_inherit
Abbildung 2. HerdSense konzentrierte sich auf die Überwachung und Identifizierung von Kühen durch verhaltensorientierte AI.

Um das Problem der Identifizierung jeder einzelnen Kuh und der Verfolgung ihrer Verhaltensweisen zu lösen, führte Davids Team einen zweitägigen Workshop durch, um alle möglichen Verhaltensweisen, die überwacht werden sollten, zu skizzieren. Insgesamt identifizierten sie über 200 Verhaltensweisen.

Jedes der 200 Verhaltensweisen hing von der genauen Erkennung einzelner Kühe ab, da alle Daten mit bestimmten Tieren verknüpft werden mussten. Ein großes Problem war die Verfolgung der Kühe, wenn sie sich in Gruppen zusammenfanden, was es schwierig machte, einzelne Tiere zu erkennen. 

Davids Team entwickelte ein Computer-Vision-System, um sicherzustellen, dass jede Kuh auch in kniffligen Situationen eindeutig identifiziert wurde. Sie konnten bestätigen, dass ein und dieselbe Kuh immer die gleiche ID erhielt, selbst wenn sie aus dem Blickfeld verschwand, sich unter andere mischte oder später wieder auftauchte.

Überwachung der Gesundheit von Pferden mit Hilfe von Computer Vision

Im Anschluss daran stellte David ein weiteres faszinierendes Projekt vor, bei dem ähnliche Techniken zur Verhaltensüberwachung von Pferden eingesetzt wurden. Bei diesem Projekt musste Davids Team die IDs der einzelnen Pferde nicht so genau verfolgen , wie sie es bei den Kühen taten. Stattdessen konzentrierten sie sich auf bestimmte Verhaltensweisen und verfolgten Details wie das Fressverhalten und das allgemeine Aktivitätsniveau, um etwaige Gesundheitsprobleme frühzeitig zu erkennen. Das Erkennen kleiner Verhaltensänderungen könnte zu einem schnelleren Eingreifen führen, um eine bessere Versorgung zu gewährleisten und Probleme zu verhindern, bevor sie ernst werden.

__wf_reserved_inherit
Abb. 3. Überwachung von Pferden mit Hilfe von Behavioral AI.

Warum verhaltensorientierte KI nicht so einfach ist, wie es scheint

David erörterte auch die Komplexität der Verhaltensverfolgung anhand eines faszinierenden Beispiels. Bei der Suche nach Möglichkeiten zur Verbesserung der Verhaltensanalyse stieß sein Team auf ein Unternehmen, das behauptete, Ladendiebstahl durch die Analyse bestimmter Körperhaltungen erkennen zu können, z. B. wenn jemand die Hand in der Tasche hat. Auf den ersten Blick schien dies eine clevere Idee zu sein - bestimmte Bewegungen könnten doch auf verdächtiges Verhalten hindeuten, oder?

__wf_reserved_inherit
Abb. 4. Verständnis für die Herausforderungen der Technologie zur Verhaltensverfolgung.

Als David jedoch weiter forschte, erkannte er die Grenzen dieser Methode. Eine einzelne Pose, wie z. B. eine Hand in der Tasche, bedeutet nicht unbedingt, dass jemand einen Ladendiebstahl begeht. Sie könnte auch bedeuten, dass die Person entspannt ist, nachdenkt oder sogar friert. Das Problem bei der Konzentration auf einzelne Posen ist, dass der größere Zusammenhang außer Acht gelassen wird. Verhalten ist nicht nur eine einzelne Handlung - es ist ein Muster von Handlungen im Laufe der Zeit, das von Kontext und Absicht geprägt ist.

David wies darauf hin, dass eine echte Verhaltenskontrolle viel komplexer ist und einen ganzheitlichen Ansatz erfordert. Es geht darum, Sequenzen von Aktionen zu analysieren und zu verstehen, was sie im Gesamtbild bedeuten. Während die KI-Branche Fortschritte macht, stellte er fest, dass es noch viel zu tun gibt, um das Verhaltenstracking so zu verbessern, dass es aussagekräftige und genaue Erkenntnisse liefert.

Schaffung intelligenter KI-Modelle, die Handlungen verstehen

Anschließend nahm David die Zuhörer mit hinter die Kulissen, um ihnen zu zeigen, wie sein Team mit Hilfe von YOLOv8 eine Computer-Vision-Lösung zur Überwachung des Gesundheitszustands von Kühen entwickelt hat und welche Möglichkeiten die Posenschätzung bietet.

Sie begannen mit der Erstellung eines benutzerdefinierten Datensatzes für die Schätzung der Haltung einer Kuh, wobei sie die Standardanzahl der Schlüsselpunkte von 17 auf 145 erhöhten, damit das Modell die Bewegung besser analysieren konnte. Dann wurde das Modell mit einem umfangreichen Datensatz von über 2 Millionen Bildern und 110 Millionen Verhaltensbeispielen trainiert. 

Mithilfe einer fortschrittlichen Hardware-Infrastruktur konnte Davids Team das Modell in nur zwei Tagen trainieren, statt Wochen, die es auf herkömmlicher Hardware gebraucht hätte. Das trainierte Modell wurde dann in einen benutzerdefinierten Verhaltenstracker integriert, der mehrere Videobilder gleichzeitig analysierte, um Muster in den Handlungen der Kühe zu erkennen.

Das Ergebnis war eine KI-gesteuerte Lösung, die acht verschiedene Verhaltensweisen von Kühen wie Fressen, Trinken und Liegen erkennen und verfolgen kann, um kleinere Verhaltensänderungen zu erkennen, die auf gesundheitliche Probleme hindeuten könnten. So können Landwirte schnell handeln und das Herdenmanagement verbessern.

Die Zukunft der verhaltensorientierten KI

Zum Abschluss seines Vortrags gab David den Zuhörern eine wichtige Lektion mit auf den Weg: "Wenn man der KI keinen Raum zum Scheitern gibt, bereitet man sich selbst auf das Scheitern vor, denn letztendlich ist sie eine statistische Größe." Er wies darauf hin, dass KI trotz ihrer Stärken nicht fehlerfrei ist. Sie ist ein Werkzeug, das aus Mustern lernt, und es wird immer wieder vorkommen, dass sie etwas nicht richtig macht. Anstatt sich vor diesen Fehlern zu fürchten, gilt es, Systeme zu entwickeln, die mit ihnen umgehen können und sich im Laufe der Zeit weiter verbessern.

Dies gilt auch für die Computer-Vision-Modelle selbst. Ultralytics YOLO11 zum Beispiel, die neueste Version der Ultralytics YOLO-Modelle, wurde unter Berücksichtigung der Notwendigkeit entwickelt, die Dinge im Vergleich zu YOLOv8 auf die nächste Stufe zu heben.

 

__wf_reserved_inherit
Abb. 5. Von YOLO11 unterstützte Bildverarbeitungsaufgaben.

Insbesondere bietet YOLO11 eine bessere Leistung, vor allem im Hinblick auf Echtzeitanwendungen, bei denen es auf Präzision ankommt, wie etwa in der Landwirtschaft und im Gesundheitswesen. Mit seinen fortschrittlichen Funktionen definiert YOLO11 die Art und Weise neu, wie Branchen KI nutzen, indem es innovative Echtzeit-Einsichten liefert und ihnen hilft, Herausforderungen effektiver zu bewältigen.

Die wichtigsten Erkenntnisse

Davids Keynote bei YV24 erinnerte daran, dass KI mehr als nur eine coole Innovation ist - sie ist ein leistungsfähiges Werkzeug zur Lösung echter Probleme und zur Verbesserung unserer Lebens- und Arbeitsbedingungen. Indem sie sich auf das Verhalten konzentriert, hat KI bereits Auswirkungen auf Bereiche wie die Verfolgung der Gesundheit von Tieren und die Erkennung sinnvoller Muster in alltäglichen Handlungen. 

Das Potenzial der verhaltensbasierten KI ist aufregend, und wir stehen erst am Anfang. Durch die Umwandlung von Rohdaten in verwertbare Erkenntnisse geht die verhaltensbasierte KI von der passiven Überwachung zur aktiven Problemlösung über. Wenn sie sich weiterentwickelt, wird die verhaltensorientierte KI zu intelligenteren Entscheidungen führen, Prozesse rationalisieren und unser Leben sinnvoll verbessern.

Bleiben Sie mit unserer Community in Verbindung, um mehr über KI und ihre praktischen Anwendungen zu erfahren. Besuchen Sie unser GitHub-Repository, um Innovationen in Bereichen wie KI in der Landwirtschaft und Computer Vision in der Fertigung zu entdecken.

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert