Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Datenbeschriftung

Lernen Sie die Grundlagen der Datenbeschriftung für maschinelles Lernen kennen. Entdecken Sie wichtige Typen wie die Objekterkennung und erfahren Sie, wie Sie Arbeitsabläufe mit Ultralytics beschleunigen können.

Datenbeschriftung ist der grundlegende Prozess der Identifizierung von Rohdaten – wie Bildern, Videobildern, Text oder Audio – und des Hinzufügens informativer Tags oder Metadaten, um Kontext zu liefern. Im Bereich des maschinellen Lernens (ML) können Algorithmen die physische Welt nicht von sich aus verstehen; sie benötigen einen „Lehrer“, der sie anleitet. Diese Anleitung erfolgt in Form von beschrifteten Datensätzen, die beim überwachten Lernen verwendet werden. Die Beschriftungen dienen als Grundwahrheit und stellen die richtigen Antworten dar, die das Modell vorhersagen möchte. Unabhängig davon, ob ein einfacher Klassifikator oder eine komplexe Architektur wie Ultralytics trainiert wird, sind die Genauigkeit, Konsistenz und Qualität dieser Beschriftungen die wichtigsten Faktoren für den Erfolg eines Modells.

Datenbeschriftung vs. Datenannotation

Obwohl die Begriffe in der Umgangssprache oft synonym verwendet werden, gibt es einen feinen Unterschied, der beachtet werden sollte. „Datenbeschriftung” bezieht sich im Allgemeinen auf den umfassenden Vorgang, einer Datenmenge eine Kategorie oder ein Tag zuzuweisen (z. B. das Markieren einer E-Mail als „Spam”). Im Gegensatz dazu ist die Datenannotation oft spezifischer für Computer Vision (CV) und beinhaltet die präzise Abgrenzung von Objekten mithilfe von Begrenzungsrahmen, Polygonen oder Schlüsselpunkten. In den meisten MLOps-Workflows (Machine Learning Operations) bezeichnen jedoch beide Begriffe die Erstellung hochwertiger Trainingsdaten.

Wichtige Typen in der Bildverarbeitung

Die Art der Kennzeichnung hängt von der Aufgabe ab, die das Modell ausführen muss. Zu den gängigen Arten gehören:

  • Bildklassifizierung: Zuweisung eines einzelnen Labels zu einem gesamten Bild, z. B. die Identifizierung einer Wetterlage als „bewölkt” oder „sonnig”.
  • Objekterkennung: Zeichnen von 2D- Begrenzungsrahmen um bestimmte Objekte, um dem Modell beizubringen, um welches Objekt es sich handelt und wo es sich befindet.
  • Instanzsegmentierung: Erstellen pixelgenauer Masken oder Polygone um Objekte herum, was für die Bestimmung präziser Formen und Grenzen unerlässlich ist.
  • Posen-Schätzung: Markierung bestimmter Schlüsselpunkte an einem Subjekt, wie z. B. Skelettgelenke , um Bewegung oder Haltung zu analysieren.

Anwendungsfälle in der Praxis

Der Nutzen der Datenkennzeichnung erstreckt sich auf praktisch alle Branchen, in denen KI zum Einsatz kommt.

  1. Autonome Fahrzeuge: Selbstfahrende Autos sind auf riesige Datensätze angewiesen, in denen jedes Fahrzeug, jeder Fußgänger, jedes Verkehrszeichen und jede Fahrbahnmarkierung sorgfältig gekennzeichnet ist. Diese gekennzeichneten Daten ermöglichen es dem Wahrnehmungssystem, sich sicher in komplexen Umgebungen zu bewegen. Unternehmen, die autonome Fahrzeuge herstellen, investieren viel in die Kennzeichnung auf Pixelebene, um die Einhaltung der Sicherheitsvorschriften zu gewährleisten.
  2. Präzisionslandwirtschaft: In der modernen Landwirtschaft wird KI eingesetzt, um Pflanzenkrankheiten detect oder Wachstumsstadien zu überwachen. Landwirte verwenden Modelle, die anhand von gekennzeichneten Bildern „gesunder“ und „kranker“ Blätter trainiert wurden, um die Behandlung zu automatisieren, den Einsatz von Chemikalien zu reduzieren und den Ertrag zu steigern.

Der Etikettierungs-Workflow

Die Erstellung eines beschrifteten Datensatzes ist oft der zeitaufwändigste Teil eines KI-Projekts. Der Prozess umfasst in der Regel einen „Human-in-the-Loop”-Ansatz (HITL), bei dem menschliche Annotatoren die Beschriftungen überprüfen, um eine hohe Genauigkeit zu gewährleisten. Moderne Workflows nutzen Tools wie die Ultralytics , die die Verwaltung von Datensätzen vereinfacht und Teams die Zusammenarbeit bei Annotationen ermöglicht. Es können auch fortschrittliche Techniken wie aktives Lernen eingesetzt werden, bei denen ein Modell die Daten vorab kennzeichnet und Menschen nur die Vorhersagen mit geringer Zuverlässigkeit korrigieren, was den Prozess erheblich beschleunigt.

Das folgende Beispiel zeigt, wie ein vortrainiertes YOLO26-Modell verwendet werden kann, um automatisch Labels (automatische Beschriftung) für ein neues Bild zu generieren, die dann von Menschen korrigiert werden können:

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten