So verwenden Sie Ultralytics YOLO11 für die Posenschätzung

Abirami Vina

3 Minuten lesen

14. Oktober 2024

Lernen Sie, wie Sie das Ultralytics YOLO11-Modell für eine genaue Posenschätzung verwenden können. Wir behandeln Echtzeit-Inferencing und benutzerdefiniertes Modelltraining für verschiedene Anwendungen.

Die Forschung im Bereich Computer Vision, einem Teilgebiet der künstlichen Intelligenz (KI), lässt sich bis in die 1960er Jahre zurückverfolgen. Doch erst in den 2010er Jahren, mit dem Aufkommen des Deep Learning, kam es zu großen Durchbrüchen bei der Art und Weise, wie Maschinen Bilder verstehen. Einer der jüngsten Fortschritte in der Computer Vision sind die innovativen Ultralytics YOLO11-Modelle. Die YOLO11-Modelle, die erstmals auf der jährlichen Hybrid-Veranstaltung von Ultralytics, der YOLO Vision 2024 (YV24), vorgestellt wurden, unterstützen eine Reihe von Computer-Vision-Aufgaben, einschließlich der Posenschätzung.

Die Posenschätzung kann dazu verwendet werden, Schlüsselpunkte einer Person oder eines Objekts in einem Bild oder Video zu erkennen, um deren Position, Haltung oder Bewegung zu verstehen. Sie wird häufig in Anwendungen wie der Sportanalyse, der Überwachung des Verhaltens von Tieren und der Robotik eingesetzt, um Maschinen bei der Interpretation physischer Aktionen in Echtzeit zu unterstützen. Dank seiner verbesserten Genauigkeit, Effizienz und Geschwindigkeit im Vergleich zu früheren Modellen der YOLO-Serie (You Only Look Once) eignet sich YOLO11 hervorragend für Echtzeit-Positionsschätzungsaufgaben.

__wf_reserved_inherit
Abb. 1. Ein Beispiel für die Verwendung von Ultralytics YOLO11 für die Posenschätzung.

In diesem Artikel erfahren Sie, was Pose Estimation ist, diskutieren einige ihrer Anwendungen und erfahren, wie Sie YOLO11 mit dem Ultralytics Python-Paket für Pose Estimation verwenden können. Wir werden auch einen Blick darauf werfen, wie Sie Ultralytics HUB verwenden können, um YOLO11 und die Pose Estimation mit ein paar einfachen Klicks auszuprobieren. Los geht's!

Was ist Posenschätzung?

Bevor wir uns mit der Verwendung des neuen Ultralytics YOLO11-Modells für die Posenschätzung befassen, sollten wir uns ein besseres Verständnis der Posenschätzung verschaffen.

Bei der Posenschätzung handelt es sich um eine Computer-Vision-Technik, mit der die Pose einer Person oder eines Objekts in einem Bild oder Video analysiert werden kann. Deep-Learning-Modelle wie YOLO11 können Schlüsselpunkte auf einem bestimmten Objekt oder einer Person identifizieren, lokalisieren und verfolgen. Bei Objekten können diese Schlüsselpunkte Ecken, Kanten oder deutliche Oberflächenmarkierungen sein, während diese Schlüsselpunkte bei Menschen wichtige Gelenke wie Ellbogen, Knie oder Schulter darstellen. 

Die Schätzung der Körperhaltung ist im Vergleich zu anderen Bildverarbeitungsaufgaben wie der Objekterkennung einzigartig und komplexer. Während bei der Objekterkennung Objekte in einem Bild lokalisiert werden, indem ein Kasten um sie herum gezeichnet wird, geht die Posenschätzung weiter, indem sie die genauen Positionen von Schlüsselpunkten auf dem Objekt vorhersagt.

__wf_reserved_inherit
Abb. 2. Verwendung von YOLO11 zur Erkennung und Schätzung der Posen von Personen in einem Büro.

Bei der Schätzung der Körperhaltung gibt es zwei Hauptmethoden: Bottom-up und Top-down. Der Bottom-up-Ansatz erkennt einzelne Schlüsselpunkte und gruppiert sie zu Skeletten, während sich der Top-down-Ansatz darauf konzentriert, zunächst Objekte zu erkennen und dann die Schlüsselpunkte innerhalb dieser Objekte zu schätzen. 

YOLO11 kombiniert die Stärken der Top-down- und der Bottom-up-Methode. Wie der Bottom-up-Ansatz ist es einfach und schnell, ohne dass Schlüsselpunkte manuell gruppiert werden müssen. Gleichzeitig nutzt es die Genauigkeit der Top-Down-Methode, indem es Personen erkennt und ihre Posen in einem einzigen Schritt schätzt.

Anwendungsfälle der Posenschätzung für YOLO11 

Die vielseitigen Möglichkeiten von YOLO11 zur Posenschätzung eröffnen ein breites Spektrum an Anwendungsmöglichkeiten in vielen Branchen. Werfen wir einen genaueren Blick auf einige Anwendungsfälle von YOLO11 für die Posenschätzung.

Echtzeit-Positionsabschätzung mit YOLO11: Verbesserung der Arbeitssicherheit

Sicherheit ist ein wichtiger Aspekt bei jedem Bauprojekt. Dies gilt umso mehr, als es auf Baustellen statistisch gesehen mehr arbeitsbedingte Verletzungen gibt. Im Jahr 2021 ereigneten sich etwa 20 % aller arbeitsbedingten tödlichen Verletzungen auf oder in der Nähe von Baustellen. In Anbetracht der täglichen Risiken wie schwerer Ausrüstung und elektrischer Anlagen sind strenge Sicherheitsmaßnahmen unerlässlich, um die Sicherheit der Arbeiter zu gewährleisten. Herkömmliche Methoden wie die Verwendung von Schildern, Absperrungen und die manuelle Überwachung durch Aufsichtspersonen sind nicht immer wirksam und halten die Aufsichtspersonen oft von wichtigeren Aufgaben ab.

KI kann zur Verbesserung der Sicherheit beitragen, und das Unfallrisiko kann durch den Einsatz eines auf Posenschätzung basierenden Überwachungssystems für Arbeiter verringert werden. Die YOLO11-Modelle von Ultralytics können verwendet werden, um die Bewegungen und Haltungen der Arbeiter zu verfolgen. Potenzielle Gefahren, wie z. B. Arbeiter, die zu nahe an gefährlichen Geräten stehen oder Aufgaben falsch ausführen, können schnell erkannt werden. Wenn ein Risiko erkannt wird, können Vorgesetzte benachrichtigt werden, oder ein Alarm kann den Arbeiter alarmieren. Ein kontinuierliches Überwachungssystem kann Baustellen sicherer machen, da es stets nach Gefahren Ausschau hält und die Arbeiter schützt

__wf_reserved_inherit
Abb. 3. Ein Beispiel für die Posenschätzung auf einer Baustelle mit YOLO11.

Posenschätzung mit YOLO11 für die Überwachung von Viehbeständen

Landwirte und Forscher können mit YOLO11 die Bewegungen und das Verhalten von Nutztieren wie Rindern untersuchen, um frühe Anzeichen von Krankheiten wie Lahmheit zu erkennen. Lahmheit ist ein Zustand, bei dem ein Tier aufgrund von Schmerzen in den Beinen oder Füßen Schwierigkeiten hat, sich richtig zu bewegen. Bei Rindern beeinträchtigen Krankheiten wie Lahmheit nicht nur ihre Gesundheit und ihr Wohlbefinden, sondern führen auch zu Produktionsproblemen in Milchviehbetrieben. Studien zeigen, dass in der Milchwirtschaft weltweit zwischen 8 % der Rinder in Weidehaltung und 15 bis 30 % in Stallhaltung von Lahmheiten betroffen sind. Die frühzeitige Erkennung und Behandlung von Lahmheiten kann dazu beitragen, das Wohlergehen der Tiere zu verbessern und die mit dieser Erkrankung verbundenen Produktionsverluste zu verringern.

Die Funktionen von YOLO11 zur Schätzung der Körperhaltung können den Landwirten helfen, das Gangbild der Tiere zu verfolgen und Anomalien, die auf Gesundheitsprobleme wie Gelenkprobleme oder Infektionen hinweisen könnten, schnell zu erkennen. Das frühzeitige Erkennen dieser Probleme ermöglicht eine schnellere Behandlung, wodurch sich die Beschwerden der Tiere verringern und die Landwirte wirtschaftliche Verluste vermeiden können.

KI-gestützte Überwachungssysteme können auch dazu beitragen, das Ruheverhalten, soziale Interaktionen und Fütterungsmuster zu analysieren. Landwirte können auch Posenschätzungen verwenden, um Anzeichen von Stress oder Aggression zu erkennen. Diese Erkenntnisse können genutzt werden, um bessere Lebensbedingungen für die Tiere zu schaffen und ihr Wohlbefinden zu steigern.

__wf_reserved_inherit
Abb. 4. Eine Visualisierung der Schätzung der Kuhhaltung.

Anwendungsfälle von YOLO11 in der Fitnessbranche

Die Posenschätzung kann Menschen auch dabei helfen, ihre Körperhaltung in Echtzeit zu verbessern, während sie trainieren. Mit YOLO11 können Fitnessstudio- und Yogalehrer die Körperbewegungen von Trainierenden überwachen und verfolgen und sich dabei auf Schlüsselpunkte wie Gelenke und Gliedmaßen konzentrieren, um deren Haltung zu beurteilen. Die gesammelten Daten können mit idealen Posen und Trainingstechniken verglichen werden, und die Trainer können Warnungen erhalten, wenn jemand eine Bewegung falsch ausführt, um Verletzungen zu vermeiden.

__wf_reserved_inherit
Abb. 5. Verwendung der Posenschätzung zur Analyse eines Trainings.

In einer Yogastunde kann die Einschätzung der Körperhaltung beispielsweise dabei helfen, zu überwachen, ob alle Teilnehmer das richtige Gleichgewicht und die richtige Ausrichtung beibehalten. Mobile Anwendungen, die mit Computer Vision und Posenschätzung integriert sind, können den Zugang zu Fitness für Menschen erleichtern, die zu Hause trainieren oder keinen Zugang zu persönlichen Trainern haben. Dieses kontinuierliche Echtzeit-Feedback hilft den Nutzern, ihre Technik zu verbessern und ihre Fitnessziele zu erreichen und gleichzeitig das Verletzungsrisiko zu verringern.

Erprobung der Echtzeit-Positionsschätzung mit dem YOLO11-Modell

Jetzt haben wir herausgefunden, was die Posenschätzung ist und einige ihrer Anwendungen besprochen. Schauen wir uns nun an, wie Sie die Posenschätzung mit dem neuen YOLO11-Modell ausprobieren können. Für den Einstieg gibt es zwei bequeme Möglichkeiten: mit dem Ultralytics Python-Paket oder über Ultralytics HUB. Werfen wir einen Blick auf beide Optionen.

Inferenzen mit YOLO11 durchführen

Beim Ausführen einer Schlussfolgerung verarbeitet das YOLO11-Modell neue Daten außerhalb seiner Trainingssätze und verwendet die erlernten Muster, um auf der Grundlage dieser Daten Vorhersagen zu treffen. Mit dem Ultralytics Python-Paket können Sie Inferenzen durch Code ausführen. Alles, was Sie tun müssen, ist, das Ultralytics-Paket mit pip, conda oder Docker zu installieren. Sollten Sie während der Installation auf Probleme stoßen, finden Sie in unserem Leitfaden für häufige Probleme hilfreiche Tipps zur Fehlerbehebung. 

Nach erfolgreicher Installation des Pakets wird im folgenden Code beschrieben, wie ein Modell geladen und zur Vorhersage der Posen von Objekten in einem Bild verwendet wird.

__wf_reserved_inherit
Abb. 6. Ein Codeschnipsel, der die Durchführung von Inferenzen mit YOLO11 zeigt.

Training eines benutzerdefinierten YOLO11-Modells

Nehmen wir an, Sie arbeiten an einem Computer-Vision-Projekt und haben einen spezifischen Datensatz für eine bestimmte Anwendung, die eine Posenschätzung beinhaltet. Dann können Sie ein benutzerdefiniertes YOLO11-Modell feinabstimmen und trainieren, das für Ihre Anwendung geeignet ist. Zum Beispiel können Sie einen Datensatz von Keypoints verwenden, um die Pose eines Tigers in Bildern zu analysieren und zu verstehen, indem Sie Schlüsselmerkmale wie die Position seiner Gliedmaßen, seines Kopfes und seines Schwanzes identifizieren.

Sie können das folgende Code-Snippet verwenden, um ein YOLO11-Positionsschätzungsmodell zu laden und zu trainieren. Das Modell kann aus einer YAML-Konfiguration erstellt werden, oder Sie können ein bereits trainiertes Modell zum Training laden. Mit diesem Skript können Sie auch Gewichte übertragen und mit dem Training des Modells unter Verwendung eines bestimmten Datensatzes beginnen, z. B. des COCO-Datensatzes für die Pose-Schätzung.

__wf_reserved_inherit
Abb. 7. Benutzerdefinierte Ausbildung YOLO11.

Mit dem neu trainierten benutzerdefinierten Modell können Sie Rückschlüsse auf ungesehene Bilder ziehen, die mit Ihrer Computer-Vision-Lösung in Zusammenhang stehen. Das trainierte Modell kann über den Exportmodus auch in andere Formate konvertiert werden.

Probieren Sie YOLO11 auf Ultralytics HUB aus

Bisher haben wir uns Methoden zur Nutzung von YOLO11 angesehen, die einige grundlegende Programmierkenntnisse erfordern. Wenn das nicht das ist, wonach Sie suchen, oder wenn Sie mit der Programmierung nicht vertraut sind, gibt es eine weitere Möglichkeit: Ultralytics HUB. Ultralytics HUB ist eine benutzerfreundliche Plattform, die den Prozess der Ausbildung und des Einsatzes von YOLO-Modellen vereinfachen soll. Mit HUB können Sie problemlos Datensätze verwalten, Modelle trainieren und bereitstellen, ohne dass Sie über technisches Fachwissen verfügen müssen.

Um Rückschlüsse auf Bilder zu ziehen, können Sie ein Konto erstellen, zum Abschnitt "Modelle" navigieren und das YOLO11-Modell für die Posenschätzung auswählen, das Sie interessiert. Im Bereich "Vorschau" können Sie ein Bild hochladen und die Ergebnisse der Vorhersage wie unten gezeigt anzeigen. 

__wf_reserved_inherit
Abb. 8. Pose-Schätzung auf Ultralytics HUB mit YOLO11.

YOLO11: Fortschritte bei der Erkennung menschlicher Posen

Ultralytics YOLO11 bietet genaue und flexible Lösungen für Aufgaben wie die Posenschätzung in einem breiten Spektrum von Anwendungen. Von der Verbesserung der Sicherheit von Arbeitern auf Baustellen über die Überwachung der Gesundheit von Tieren bis hin zur Unterstützung bei der Haltungskorrektur im Fitnessbereich - YOLO11 bietet Präzision und Echtzeit-Feedback durch fortschrittliche Computer-Vision-Technologie. 

Seine Vielseitigkeit mit mehreren Modellvarianten und der Möglichkeit, für bestimmte Anwendungsfälle individuell zu trainieren, macht es zu einem sehr wertvollen Werkzeug für Entwickler und Unternehmen gleichermaßen. Ob durch Kodierung mit dem Ultralytics Python-Paket oder durch Verwendung des Ultralytics HUB für eine einfachere Implementierung, YOLO11 macht Posenschätzung zugänglich und wirkungsvoll.

Um mehr zu erfahren, besuchen Sie unser GitHub-Repository und beteiligen Sie sich an unserer Community. Entdecken Sie KI-Anwendungen in der Fertigung und Landwirtschaft auf unseren Lösungsseiten. 🚀

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert