Glossar

Semantische Segmentierung

Entdecke die Macht der semantischen Segmentierung - klassifiziere jedes Pixel in Bildern für ein präzises Verständnis der Szene. Entdecke jetzt Anwendungen und Tools!

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die semantische Segmentierung ist eine grundlegende Aufgabe in der Computer Vision, bei der es darum geht, jedem einzelnen Pixel eines Bildes ein bestimmtes Klassenlabel zuzuweisen. Im Gegensatz zu anderen Bildverarbeitungsaufgaben, die Objekte identifizieren oder das gesamte Bild klassifizieren, liefert die semantische Segmentierung ein dichtes Verständnis des Bildinhalts auf Pixelebene. Das bedeutet, dass nicht nur erkannt wird , dass es ein Auto gibt, sondern auch genau festgelegt wird , welche Pixel zur Kategorie Auto gehören und wie sie sich von den Pixeln unterscheiden, die zur Straße, zum Himmel oder zu den Fußgängern gehören.

Was ist Semantische Segmentierung?

Das Hauptziel der semantischen Segmentierung ist es, ein Bild in aussagekräftige Regionen zu unterteilen, die verschiedenen Objektkategorien entsprechen. In einem Bild mit mehreren Autos, Fußgängern und Bäumen würde ein semantisches Segmentierungsmodell zum Beispiel alle Pixel eines Autos als "Auto", alle Pixel eines Fußgängers als "Fußgänger" und alle Pixel eines Baums als "Baum" bezeichnen. Es behandelt alle Instanzen der gleichen Objektklasse gleich. Dies steht im Gegensatz zur Bildklassifizierung, bei der dem gesamten Bild ein einziges Label zugewiesen wird, und zur Objekterkennung, bei der zwar Bounding Boxes um die erkannten Objekte gezeichnet werden, ihre genaue Form aber nicht umrissen wird.

Semantische Segmentierungsmodelle werden in der Regel mit überwachten Lernverfahren trainiert und erfordern Datensätze mit detaillierten Anmerkungen auf Pixelebene. Das Ergebnis ist in der Regel eine Segmentierungskarte, d. h. ein Bild, in dem der Wert (oder die Farbe) eines jeden Pixels der vorhergesagten Klassenbezeichnung entspricht.

Hauptunterschiede zu anderen Segmentierungsaufgaben

Es ist wichtig, die semantische Segmentierung von verwandten Aufgaben zu unterscheiden:

  • Instanz-Segmentierung: Während die semantische Segmentierung alle Pixel, die zur Klasse "Auto" gehören, als gleich kennzeichnet, geht die Instanzsegmentierung einen Schritt weiter. Sie identifiziert und segmentiert jede einzelne Instanz eines Objekts separat. Drei verschiedene Autos in einem Bild würden also jeweils eine eigene Segmentierungsmaske erhalten, obwohl sie alle zur Klasse "Auto" gehören. Hier erfährst du, wie du Ultralytics YOLO für die Instanzsegmentierung verwenden kannst.
  • Panoptische Segmentierung: Diese Aufgabe kombiniert semantische und instanzielle Segmentierung. Sie weist jedem Pixel ein Klassenlabel zu (wie bei der semantischen Segmentierung) und identifiziert außerdem jedes Objekt eindeutig (wie bei der Instanzsegmentierung), um ein einheitliches Verständnis der Szene zu ermöglichen.

Anwendungen der semantischen Segmentierung

Das detaillierte Verständnis einer Szene, das durch semantische Segmentierung ermöglicht wird, ist für viele Anwendungen in der Praxis entscheidend:

  1. Autonomes Fahren: Selbstfahrende Autos verlassen sich stark auf die semantische Segmentierung, um ihre Umgebung zu verstehen. Durch die Einteilung von Pixeln in Kategorien wie "Straße", "Gehweg", "Fußgänger", "Fahrzeug" und "Hindernis" kann das autonome Fahrsystem fundierte Entscheidungen zur Navigation und Sicherheit treffen.
  2. Medizinische Bildanalyse: Im Gesundheitswesen hilft die semantische Segmentierung bei der Analyse medizinischer Scans wie MRTs oder CTs. Sie kann Organe, Gewebe oder Anomalien wie Tumore genau umreißen und hilft Ärzten bei der Diagnose, der Behandlungsplanung und der Überwachung des Krankheitsverlaufs. Die YOLO Ultralytics können zum Beispiel zur Tumorerkennung eingesetzt werden.
  3. Analyse von Satellitenbildern: Zur Klassifizierung von Landbedeckungstypen (z. B. Wald, Wasser, städtische Gebiete), zur Überwachung der Abholzung, zur Kartierung der Zersiedelung oder zur Beurteilung der Gesundheit von Pflanzen in der Präzisionslandwirtschaft. Vision AI bietet viele Vorteile für die Landwirtschaft.
  4. Robotik: Ermöglicht es Robotern, ihre Umgebung detaillierter wahrzunehmen, was für Aufgaben wie Objektmanipulation und Navigation in komplexen Umgebungen notwendig ist. Erfahre mehr über die Integration von Computer Vision in der Robotik.

Modelle und Werkzeuge

Bei der semantischen Segmentierung werden häufig Deep-Learning-Modelle eingesetzt, insbesondere Convolutional Neural Networks (CNNs). Architekturen wie Fully Convolutional Networks (FCN) und U-Net sind eine beliebte Wahl. Moderne Modelle wie Ultralytics YOLOv8 bieten ebenfalls leistungsstarke Funktionen für Segmentierungsaufgaben. Tools wie Ultralytics HUB bieten Plattformen für das Training, die Verwaltung von Datensätzen wie COCO und den effizienten Einsatz von Segmentierungsmodellen.

Alles lesen