Lerne, wie du das Modell Ultralytics YOLO11 für eine genaue Posenschätzung nutzen kannst. Wir behandeln Echtzeit-Inferencing und benutzerdefiniertes Modelltraining für verschiedene Anwendungen.
Die Forschung im Bereich Computer Vision, einem Teilgebiet der künstlichen Intelligenz (KI), lässt sich bis in die 1960er Jahre zurückverfolgen. Aber erst in den 2010er Jahren, mit dem Aufkommen des Deep Learning, gab es große Durchbrüche bei der Art und Weise, wie Maschinen Bilder verstehen. Einer der neuesten Fortschritte im Bereich der Computer Vision sind die hochmodernen Ultralytics YOLO11 Modelle. UltralyticsDie Modelle vonYOLO11 , die erstmals auf der jährlichen Hybrid-Veranstaltung YOLO Vision 2024 (YV24) vorgestellt wurden, unterstützen eine Reihe von Bildverarbeitungsaufgaben, darunter auch die Posenschätzung.
Die Posenschätzung kann dazu verwendet werden, Schlüsselpunkte einer Person oder eines Objekts in einem Bild oder Video zu erkennen, um ihre Position, Haltung oder Bewegung zu verstehen. Sie wird häufig in Anwendungen wie der Sportanalyse, der Überwachung des Verhaltens von Tieren und in der Robotik eingesetzt, um Maschinen dabei zu helfen, physische Aktionen in Echtzeit zu interpretieren. Dank seiner verbesserten Genauigkeit, Effizienz und Geschwindigkeit im Vergleich zu früheren Modellen der YOLO (You Only Look Once) Serie, YOLO11(You Only Look Once) eignet sich gut für Echtzeit-Positionsschätzungsaufgaben.
In diesem Artikel erfahren wir, was Pose Estimation ist, besprechen einige ihrer Anwendungen und zeigen, wie du mit dem YOLO11 mit dem PaketUltralytics Python für die Posenschätzung nutzen kannst. Außerdem schauen wir uns an, wie du Ultralytics HUB nutzen kannst, um YOLO11 und die Posenschätzung mit ein paar einfachen Klicks auszuprobieren. Los geht's!
Bevor wir uns damit beschäftigen, wie wir das neue ModellUltralytics YOLO11 für die Posenschätzung nutzen können, wollen wir die Posenschätzung besser verstehen.
Die Posenschätzung ist eine Computer-Vision-Technik, die verwendet wird, um die Pose einer Person oder eines Objekts in einem Bild oder Video zu analysieren. Deep Learning-Modelle wie YOLO11 können Schlüsselpunkte auf einem bestimmten Objekt oder einer Person identifizieren, lokalisieren und verfolgen. Bei Objekten können dies z. B. Ecken, Kanten oder bestimmte Oberflächenmarkierungen sein, während bei Menschen diese Schlüsselpunkte wichtige Gelenke wie Ellbogen, Knie oder Schulter darstellen.
Die Schätzung der Körperhaltung ist einzigartig und komplexer als andere Computer Vision Aufgaben wie die Objekterkennung. Während bei der Objekterkennung Objekte in einem Bild lokalisiert werden, indem ein Rahmen um sie herum gezeichnet wird, geht die Posenschätzung weiter, indem sie die genauen Positionen von Schlüsselpunkten auf dem Objekt vorhersagt.
Bei der Schätzung der Körperhaltung gibt es zwei Hauptmethoden: Bottom-up und Top-down. Der Bottom-up-Ansatz erkennt einzelne Schlüsselpunkte und gruppiert sie zu Skeletten, während sich der Top-down-Ansatz darauf konzentriert, zuerst Objekte zu erkennen und dann die Schlüsselpunkte innerhalb dieser Objekte zu schätzen.
YOLO11 kombiniert die Stärken der Top-Down- und Bottom-Up-Methode. Wie die Bottom-up-Methode ist sie einfach und schnell, ohne dass die Schlüsselpunkte manuell gruppiert werden müssen. Gleichzeitig nutzt sie die Genauigkeit der Top-Down-Methode, indem sie die Personen in einem einzigen Schritt erkennt und ihre Posen schätzt.
Die vielseitigen Möglichkeiten von YOLO11 für die Pose-Schätzung eröffnen ein breites Spektrum an Anwendungsmöglichkeiten in vielen Branchen. Schauen wir uns einige Anwendungsfälle für die Posenschätzung von YOLO11 näher an.
Sicherheit ist ein wichtiger Aspekt bei jedem Bauprojekt. Das gilt besonders, weil es auf Baustellen statistisch gesehen mehr arbeitsbedingte Verletzungen gibt. Im Jahr 2021 ereigneten sich etwa 20 % aller tödlichen Arbeitsunfälle auf oder in der Nähe von Baustellen. Angesichts der täglichen Risiken wie schwerer Ausrüstung und elektrischer Anlagen sind strenge Sicherheitsmaßnahmen unerlässlich, um die Arbeiter zu schützen. Herkömmliche Methoden wie die Verwendung von Schildern, Absperrungen und die manuelle Überwachung durch Aufsichtspersonen sind nicht immer effektiv und halten die Aufsichtspersonen oft von wichtigeren Aufgaben ab.
KI kann die Sicherheit verbessern und das Unfallrisiko verringern, indem ein auf Posenschätzung basierendes System zur Überwachung von Arbeitnehmern eingesetzt wird. Ultralytics YOLO11 können Modelle verwendet werden, um die Bewegungen und Körperhaltungen der Arbeitnehmer zu verfolgen. Potenzielle Gefahren, z. B. wenn die Beschäftigten zu nahe an gefährlichen Geräten stehen oder Aufgaben falsch ausführen, können schnell erkannt werden. Wenn ein Risiko erkannt wird, können Vorgesetzte benachrichtigt werden, oder ein Alarm kann den Arbeiter alarmieren. Ein kontinuierliches Überwachungssystem kann Baustellen sicherer machen, indem es immer nach Gefahren Ausschau hält und die Beschäftigten schützt.
Landwirte und Forscher können YOLO11 nutzen, um die Bewegungen und das Verhalten von Nutztieren wie Rindern zu untersuchen und frühe Anzeichen von Krankheiten wie Lahmheit zu erkennen. Lahmheit ist ein Zustand, bei dem ein Tier aufgrund von Schmerzen in den Beinen oder Füßen Schwierigkeiten hat, sich richtig zu bewegen. Bei Rindern beeinträchtigen Krankheiten wie Lahmheit nicht nur ihre Gesundheit und ihr Wohlbefinden, sondern führen auch zu Produktionsproblemen in Milchviehbetrieben. Studien zeigen, dass in der Milchwirtschaft weltweit zwischen 8% der Rinder in Weidehaltung und 15% bis 30% in Stallhaltung von Lahmheit betroffen sind. Die frühzeitige Erkennung und Behandlung von Lahmheiten kann dazu beitragen, das Wohlbefinden der Tiere zu verbessern und die damit verbundenen Produktionsverluste zu verringern.
YOLO11kann den Landwirten dabei helfen, das Gangbild der Tiere zu verfolgen und Anomalien, die auf Gesundheitsprobleme wie Gelenkprobleme oder Infektionen hindeuten könnten, schnell zu erkennen. Wenn diese Probleme frühzeitig erkannt werden, können sie schneller behandelt werden, wodurch sich die Beschwerden der Tiere verringern und die Landwirte wirtschaftliche Verluste vermeiden können.
KI-gestützte Überwachungssysteme können auch helfen, das Ruheverhalten, soziale Interaktionen und Fütterungsmuster zu analysieren. Landwirte können auch Posenschätzungen verwenden, um Anzeichen von Stress oder Aggression zu erkennen. Diese Erkenntnisse können genutzt werden, um bessere Lebensbedingungen für die Tiere zu schaffen und ihr Wohlbefinden zu steigern.
Die Posenschätzung kann Menschen auch dabei helfen, ihre Körperhaltung beim Training in Echtzeit zu verbessern. Mit YOLO11 können Fitnessstudio- und Yogalehrer/innen die Körperbewegungen der Trainierenden überwachen und verfolgen und sich dabei auf Schlüsselpunkte wie Gelenke und Gliedmaßen konzentrieren, um die Haltung zu beurteilen. Die gesammelten Daten können mit idealen Körperhaltungen und Trainingstechniken verglichen werden, und die Ausbilder/innen können Warnungen erhalten, wenn jemand eine Bewegung falsch ausführt, um Verletzungen zu vermeiden.
In einer Yogastunde kann die Posenschätzung zum Beispiel dabei helfen, zu überwachen, ob alle Schüler/innen das Gleichgewicht und die richtige Ausrichtung halten. Mobile Anwendungen, die mit Computer Vision und Pose Estimation arbeiten, können den Zugang zum Fitnesstraining für Menschen erleichtern, die zu Hause trainieren oder keinen Zugang zu persönlichen Trainern haben. Dieses kontinuierliche Echtzeit-Feedback hilft den Nutzern, ihre Technik zu verbessern und ihre Fitnessziele zu erreichen, während gleichzeitig das Verletzungsrisiko reduziert wird.
Jetzt haben wir herausgefunden, was Posenschätzung ist und einige ihrer Anwendungen besprochen. Sehen wir uns nun an, wie du die Posenschätzung mit dem neuen Modell YOLO11 ausprobieren kannst. Für den Anfang gibt es zwei bequeme Möglichkeiten: mit dem Paket Ultralytics Python oder mit Ultralytics HUB. Schauen wir uns beide Möglichkeiten an.
Wenn du eine Schlussfolgerung durchführst, verarbeitet das Modell YOLO11 neue Daten außerhalb der Trainingsmengen und verwendet die gelernten Muster, um Vorhersagen auf der Grundlage dieser Daten zu treffen. Mit dem Paket Ultralytics Python kannst du Inferenzen durch Code ausführen. Um loszulegen , musst du nur das Paket Ultralytics mit pip, conda oder Docker installieren. Wenn du bei der Installation auf Probleme stößt, findest du in unserem Leitfaden für häufige Probleme hilfreiche Tipps zur Fehlerbehebung.
Wenn du das Paket erfolgreich installiert hast, zeigt dir der folgende Code, wie du ein Modell lädst und es benutzt, um die Posen von Objekten in einem Bild vorherzusagen.
Angenommen, du arbeitest an einem Computer-Vision-Projekt und hast einen bestimmten Datensatz für eine bestimmte Anwendung, die eine Posenschätzung erfordert. Dann kannst du ein benutzerdefiniertes YOLO11 Modell anpassen und trainieren, das für deine Anwendung geeignet ist. Du kannst zum Beispiel einen Datensatz mit Keypoints verwenden, um die Haltung eines Tigers auf Bildern zu analysieren und zu verstehen, indem du Schlüsselmerkmale wie die Position seiner Gliedmaßen, seines Kopfes und seines Schwanzes identifizierst.
Mit dem folgenden Codeschnipsel kannst du ein YOLO11 Posenschätzungsmodell laden und trainieren. Das Modell kann aus einer YAML-Konfiguration erstellt werden, oder du kannst ein bereits trainiertes Modell zum Training laden. Mit diesem Skript kannst du auch Gewichte übertragen und das Modell mit einem bestimmten Datensatz trainieren, z. B. mit dem COCO-Datensatz für die Posenschätzung.
Mit dem neu trainierten benutzerdefinierten Modell kannst du Rückschlüsse auf ungesehene Bilder ziehen, die mit deiner Computer Vision Lösung zusammenhängen. Das trainierte Modell kann über den Exportmodus auch in andere Formate konvertiert werden.
Bisher haben wir uns die Methoden angesehen, mit denen du YOLO11 nutzen kannst und die einige grundlegende Programmierkenntnisse erfordern. Wenn das nicht das ist, was du suchst, oder du dich nicht mit Programmierung auskennst, gibt es eine weitere Möglichkeit: Ultralytics HUB. Ultralytics HUB ist eine benutzerfreundliche Plattform, die das Training und den Einsatz von YOLO Modellen vereinfacht. Mit HUB kannst du ganz einfach Datensätze verwalten, Modelle trainieren und einsetzen, ohne dass du technische Kenntnisse brauchst.
Um Rückschlüsse auf Bilder zu ziehen, kannst du ein Konto erstellen, zum Bereich "Modelle" navigieren und das YOLO11 Posenschätzungsmodell auswählen, an dem du interessiert bist. Im Bereich "Vorschau" kannst du ein Bild hochladen und die Ergebnisse der Vorhersage ansehen (siehe unten).
Ultralytics YOLO11 bietet genaue und flexible Lösungen für Aufgaben wie Posenschätzung in einer Vielzahl von Anwendungen. Ob es darum geht, die Sicherheit von Arbeitern auf Baustellen zu verbessern, die Gesundheit von Tieren zu überwachen oder die Körperhaltung bei Fitnessübungen zu korrigieren, YOLO11 bietet Präzision und Echtzeit-Feedback durch fortschrittliche Computer Vision Technologie.
Seine Vielseitigkeit mit mehreren Modellvarianten und der Möglichkeit, für bestimmte Anwendungsfälle individuell zu trainieren, macht es zu einem sehr wertvollen Werkzeug für Entwickler und Unternehmen gleichermaßen. Egal, ob du mit dem Ultralytics Python Paket kodierst oder den Ultralytics HUB für eine einfachere Implementierung verwendest, YOLO11 macht die Posenschätzung zugänglich und wirkungsvoll.
Um mehr zu erfahren, besuche unser GitHub-Repository und beteilige dich an unserer Community. Entdecke KI-Anwendungen in der Produktion und Landwirtschaft auf unseren Lösungsseiten. 🚀
Beginne deine Reise in die Zukunft des maschinellen Lernens