Glossar

Bildsegmentierung

Entdecke die Leistungsfähigkeit der Bildsegmentierung mit Ultralytics YOLO . Erforsche die Präzision auf Pixelebene, Typen, Anwendungen und reale KI-Einsatzfälle.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Bildsegmentierung ist eine grundlegende Technik der Computer Vision (CV), bei der ein digitales Bild in mehrere unterschiedliche Regionen oder Segmente unterteilt wird. Das Hauptziel besteht darin, jedem Pixel des Bildes ein Klassensymbol zuzuordnen und so die Bilddarstellung zu vereinfachen, sodass sie für Maschinen leichter zu analysieren ist. Im Gegensatz zur Objekterkennung, bei der Objekte anhand von rechteckigen Begrenzungsrahmen (Bounding Boxes) identifiziert werden, liefert die Bildsegmentierung ein viel genaueres Verständnis des Bildinhalts auf Pixelebene und beschreibt die genaue Form der Objekte. Diese Präzision ist entscheidend für Aufgaben, die ein detailliertes räumliches Verständnis erfordern.

Wie die Bildsegmentierung funktioniert

Bildsegmentierungsalgorithmen untersuchen ein Bild Pixel für Pixel und gruppieren Pixel, die bestimmte Merkmale - wie Farbe, Intensität, Textur oder räumliche Lage - gemeinsam haben, zu Segmenten. Frühe Methoden stützten sich auf Techniken wie Schwellenwertbildung, Regionsbildung und Clustering(K-Means, DBSCAN). Moderne Ansätze nutzen jedoch in hohem Maße Deep Learning (DL), insbesondere Convolutional Neural Networks (CNNs). Diese neuronalen Netze lernen komplexe hierarchische Merkmale direkt aus den Trainingsdaten, um eine pixelgenaue Klassifizierung durchzuführen. Das Ergebnis ist in der Regel eine Segmentierungsmaske, ein Bild, in dem der Wert jedes Pixels dem Klassenlabel entspricht, zu dem es gehört, und das die genauen Grenzen von Objekten oder Regionen visuell hervorhebt. Frameworks wie PyTorch und TensorFlow werden häufig verwendet, um diese Modelle zu erstellen und zu trainieren.

Arten der Bildsegmentierung

Bildsegmentierungsaufgaben können sich je nach Art der Objekte und Klassen unterscheiden:

  • Semantische Segmentierung: Ordnet jedes Pixel einer vordefinierten Kategorie zu (z. B. "Auto", "Straße", "Himmel"). Dabei wird nicht zwischen verschiedenen Instanzen derselben Objektklasse unterschieden. Alle Autos würden zum Beispiel das gleiche Label erhalten.
  • Instanz Segmentierung: Geht einen Schritt weiter als die semantische Segmentierung, indem sie jedes einzelne Objekt in einem Bild identifiziert und abgrenzt. Jedes einzelne Auto erhält eine eigene Kennung oder Maske, auch wenn es zur selben Klasse gehört. Dies ist besonders nützlich, wenn einzelne Objekte gezählt oder verfolgt werden müssen.
  • Panoptische Segmentierung: Kombiniert semantische und instanzielle Segmentierung. Sie ordnet jedem Pixel eine Klassenbezeichnung zu (wie die semantische Segmentierung) und identifiziert jedes Objekt eindeutig (wie die Instanzsegmentierung). Sie liefert ein umfassendes, einheitliches Verständnis der Szene.

Abgrenzung der Bildsegmentierung von verwandten Begriffen

  • Bildsegmentierung vs. Objekterkennung: Bei der Objekterkennung werden Begrenzungsrahmen (Bounding Boxes) um die Objekte gezogen, die ihre Position und Klasse angeben. Die Bildsegmentierung liefert eine Maske auf Pixelebene, die die genaue Form jedes Objekts oder Bereichs beschreibt und mehr Details bietet als ein einfacher Rahmen.
  • Bildsegmentierung vs. Bildklassifizierung: Bei der Bildklassifizierung wird dem gesamten Bild ein einziges Label zugewiesen (z. B. "enthält eine Katze"). Bei der Bildsegmentierung wird jedem Pixel des Bildes ein Etikett zugewiesen, das mehrere Objekte oder Regionen und deren Formen identifiziert.
  • Bildsegmentierung vs. Bilderkennung: Bilderkennung ist ein breiterer Begriff für Aufgaben, bei denen KI Objekte, Personen, Orte usw. in Bildern identifiziert. Die Bildsegmentierung ist eine spezielle Art der Bilderkennung, die sich auf die Aufteilung auf Pixelebene konzentriert.

Anwendungen in der realen Welt

Die detaillierte Analyse durch die Bildsegmentierung ermöglicht zahlreiche Anwendungen:

Bildsegmentierung und Ultralytics YOLO

Ultralytics YOLO Modelle, wie zum Beispiel YOLOv8 und YOLO11bieten modernste Leistung bei der Segmentierung von Beispielen und sorgen für ein ausgewogenes Verhältnis zwischen Geschwindigkeit und Genauigkeit für Echtzeit-Inferenzen. Das Ultralytics vereinfacht das Training von benutzerdefinierten Segmentierungsmodellen auf Datensätzen wie COCO oder spezialisierten Datensätzen wie Autoteile oder Risssegmentierung. Tools wie Ultralytics HUB bieten eine optimierte Plattform für die Verwaltung von Datensätzen, das Training von Modellen(Cloud-Training möglich) und deren Einsatz. In der Dokumentation zu den Segmentierungsaufgaben findest du Details zur Implementierung oder du kannst Anleitungen wie die Segmentierung mit vortrainierten YOLOv8 oder die Bildsegmentierung mit YOLO11 auf Google Colab folgen.

Alles lesen