Glossar

Semantische Segmentierung

Entdecken Sie die Leistungsfähigkeit der semantischen Segmentierung - klassifizieren Sie jedes Pixel in Bildern für ein präzises Verständnis der Szene. Erkunden Sie jetzt Anwendungen und Tools!

Die semantische Segmentierung ist eine grundlegende Aufgabe der Computer Vision, bei der jedem einzelnen Pixel eines Bildes ein bestimmtes Klassenetikett zugewiesen wird. Im Gegensatz zu anderen Methoden, die Objekte mit Kästchen identifizieren oder einem ganzen Bild ein einziges Etikett zuweisen, erstellt die semantische Segmentierung eine dichte, pixelgenaue Karte der verschiedenen vorhandenen semantischen Kategorien. Dies ermöglicht ein umfassendes, detailliertes Verständnis des Bildinhalts, das die genaue Form und Position jeder Kategorie, wie "Straße", "Himmel", "Gebäude" oder "Person", beschreibt. Dies ist eine zentrale Technik in Szenen, in denen das Verständnis des Kontexts und des Layouts ebenso wichtig ist wie die Identifizierung einzelner Objekte.

Modelle und Werkzeuge

Bei der semantischen Segmentierung werden häufig Deep-Learning-Modelle eingesetzt, insbesondere Architekturen, die von Convolutional Neural Networks (CNNs) abgeleitet sind.

Anwendungen in der realen Welt

Das detaillierte Verständnis einer Szene, das durch semantische Segmentierung ermöglicht wird, ist in vielen Bereichen entscheidend:

  • Autonome Fahrzeuge: Damit ein selbstfahrendes Auto sicher navigieren kann, muss es seine Umgebung vollständig verstehen. Semantische Segmentierung wird verwendet, um befahrbare Bereiche (Straßen), nicht befahrbare Bereiche (Gehwege, Gebäude) und die Position von Fußgängern, Radfahrern und anderen Fahrzeugen mit pixelgenauer Präzision zu identifizieren. Dies ermöglicht eine sicherere Wegplanung und Entscheidungsfindung. Lesen Sie mehr über die Rolle der KI in autonomen Fahrzeugen.
  • Medizinische Bildanalyse: In der Medizin ist Präzision das A und O. Die semantische Segmentierung hilft bei der automatischen Abgrenzung von Organen, Tumoren, Läsionen und anderen anatomischen Strukturen in Scans wie MRT- und CT-Scans. Dies unterstützt Radiologen bei der Diagnose, der Behandlungsplanung und der Überwachung des Krankheitsverlaufs. Erfahren Sie mehr darüber, wie KI in der medizinischen Bildgebung eingesetzt wird.
  • Analyse von Satellitenbildern: Bei raumbezogenen Anwendungen wird die semantische Segmentierung zur Klassifizierung der Bodenbedeckung anhand von Satellitenbildern verwendet. Dies kann für die Stadtplanung (Identifizierung von Gebäuden, Straßen und Grünflächen), die Umweltüberwachung (Verfolgung von Abholzung oder Gewässern) und die Präzisionslandwirtschaft genutzt werden.
  • Robotik: Roboter nutzen die semantische Segmentierung, um ihre Betriebsumgebung zu verstehen, so dass sie zwischen Böden, Wänden, Objekten, mit denen sie interagieren sollen, und Hindernissen, die sie vermeiden müssen, unterscheiden können. Dies ist für Navigations- und Manipulationsaufgaben in komplexen Umgebungen wie Lagerhäusern oder Wohnungen unerlässlich. Erfahren Sie mehr über die Integration von Computer Vision in der Robotik.

Wesentliche Unterscheidungsmerkmale zu anderen Aufgaben

Es ist wichtig, die semantische Segmentierung von verwandten Computer-Vision-Aufgaben zu unterscheiden:

  • Segmentierung von Instanzen: Dies ist die am stärksten verwandte Aufgabe. Während beide eine Klassifizierung auf Pixelebene durchführen, geht die Instanzsegmentierung einen Schritt weiter, indem sie zwischen einzelnen Instanzen der gleichen Objektklasse unterscheidet. In einem Bild mit drei Autos zum Beispiel würde die semantische Segmentierung alle Autopixel einfach als "Auto" bezeichnen. Im Gegensatz dazu würde die Instanzsegmentierung "Auto 1", "Auto 2" und "Auto 3" als separate Objekte identifizieren.
  • Objekt-Erkennung: Diese Aufgabe identifiziert das Vorhandensein und die Position von Objekten in einem Bild, indem ein Begrenzungsrahmen (Bounding Box) um jedes Objekt gezeichnet und eine Klassenbezeichnung zugewiesen wird. Sie liefert keine Informationen über die Form des Objekts oder darüber, welche Pixel zu ihm gehören.
  • Panoptische Segmentierung: Diese Aufgabe kann als Vereinheitlichung der semantischen und der Instanzsegmentierung angesehen werden. Sie zielt auf ein umfassendes Verständnis der Szene ab, indem jedem Pixel ein Klassenlabel zugewiesen wird (wie bei der semantischen Segmentierung), während gleichzeitig jede Objektinstanz eindeutig identifiziert wird (wie bei der Instanzsegmentierung).

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert