Glossar

Erkennung von benannten Entitäten (NER)

Erhalte Einblicke mit Named Entity Recognition (NER). Entdecke, wie KI unstrukturierten Text in verwertbare Daten für verschiedene Anwendungen verwandelt.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Erkennung von benannten Entitäten (Named Entity Recognition, NER) ist eine grundlegende Aufgabe in der natürlichen Sprachverarbeitung (Natural Language Processing, NLP) und eine Schlüsselkomponente der modernen künstlichen Intelligenz (AI). Dabei geht es darum, bestimmte Informationen - sogenannte "benannte Entitäten" - in unstrukturierten Texten automatisch zu identifizieren und zu klassifizieren. Diese Entitäten repräsentieren in der Regel Objekte aus der realen Welt wie Personen, Organisationen, Orte, Daten, Produktnamen, Geldwerte und mehr. Das Hauptziel von NER ist es, Rohtext in strukturierte Daten umzuwandeln, damit Maschinen ihn leichter verstehen, verarbeiten und wertvolle Erkenntnisse gewinnen können.

Wie die Erkennung von benannten Entitäten funktioniert

NER-Systeme analysieren die sprachliche Struktur und den Kontext von Texten, um Entitäten zu finden und zu kategorisieren. Während sich frühere Systeme stark auf grammatikalische Regeln und Wörterbücher stützten, nutzen moderne Ansätze das maschinelle Lernen (ML), insbesondere Deep Learning (DL). Modelle wie Transformers zeichnen sich dadurch aus, dass sie den Kontext und subtile Sprachmuster verstehen, was zu einer höheren Genauigkeit führt. In der Regel werden dabei potenzielle Entitäten (Wörter oder Sätze) identifiziert und dann in vordefinierte Kategorien (z. B. PERSON, ORGANISATION, ORT) eingeordnet.

In dem Satz "Sundar Pichai kündigte Google neuestes KI-Modell auf der Veranstaltung in Mountain View an" würde ein NER-System beispielsweise "Sundar Pichai" als PERSON,Google" als ORGANISATION und "Mountain View" als ORT identifizieren. Diese strukturierte Ausgabe ist für nachgelagerte Aufgaben viel nützlicher als der Originaltext allein.

Relevanz und Anwendungen

NER ist eine Grundlagentechnologie, die zahlreiche Anwendungen in verschiedenen Bereichen ermöglicht, indem sie Textinformationen strukturiert:

  • Informationsextraktion: Systeme können große Mengen von Dokumenten (wie Nachrichtenartikel oder Forschungsarbeiten) durchsuchen, um wichtige Informationen zu extrahieren und so die Informationsbeschaffung und -analyse zu erleichtern. Finanzanalysten können zum Beispiel NER nutzen, um Firmennamen und Geldwerte aus Gewinnberichten zu extrahieren. Lies einen Überblick über NER-Techniken.
  • Automatisierung des Kundensupports: Chatbots und Supportsysteme nutzen NER, um wichtige Details wie Produktnamen, Benutzer-IDs oder Problemtypen, die in Kundenanfragen erwähnt werden, zu identifizieren und so ein effizientes Routing und die Erstellung von Antworten zu ermöglichen. Erkunde Google Cloud Natural Language AI für Beispiele.
  • Inhaltsempfehlungen: Durch die Identifizierung von Personen, die in Artikeln oder Videos erwähnt werden (z. B. Personen, Themen oder Orte), können Plattformen den Nutzern relevantere Inhalte vorschlagen.
  • Gesundheitsinformatik: NER ist wichtig, um Informationen wie Patientennamen, Krankheiten, Medikamente und Symptome aus klinischen Aufzeichnungen zu extrahieren und so die Verwaltung von Krankenakten und die Forschung zu unterstützen. Sie kann Aufgaben wie die Analyse medizinischer Bilder unterstützen, indem sie Befunde mit Textberichten korreliert.
  • Semantische Suche: Verbessert die Fähigkeiten von Suchmaschinen, indem sie die Entitäten innerhalb einer Anfrage versteht, was zu genaueren und kontextrelevanten Ergebnissen führt.

Hauptunterschiede zu verwandten Konzepten

NER wird oft neben anderen NLP-Aufgaben eingesetzt, hat aber einen eigenen Schwerpunkt:

  • Sentiment-Analyse: Bestimmt den emotionalen Ton (positiv, negativ, neutral), der in einem Text zum Ausdruck kommt, anstatt bestimmte Entitäten zu identifizieren. NER kann feststellen, worum es in der Stimmung geht (z. B. um ein Produkt), während die Stimmungsanalyse feststellt, wie der Nutzer darüber denkt.
  • Textzusammenfassung: Ziel ist es, eine kurze, prägnante Version eines längeren Textes zu erstellen, bei der die wichtigsten Informationen erhalten bleiben, die sich aber nicht unbedingt auf die Kategorisierung aller benannten Entitäten konzentriert.
  • Objekterkennung: Eine Computer Vision (CV) Aufgabe, die Objekte in Bildern oder Videos identifiziert und lokalisiert. NER befasst sich ausschließlich mit textuellen Daten. NER kann jedoch CV in multimodalen Anwendungen ergänzen, z. B. bei der Analyse von Text, der aus Bildern extrahiert wurde.
  • Natural Language Understanding (NLU): Ein breiteres Feld, das sich darauf konzentriert, Maschinen in die Lage zu versetzen, die Bedeutung von Texten zu verstehen. NER wird als eine grundlegende Teilaufgabe innerhalb von NLU betrachtet.

Technologien und Werkzeuge

Mehrere Bibliotheken und Plattformen erleichtern die Implementierung von NER:

  • Open-Source-Bibliotheken wie spaCy und NLTK bieten robuste NER-Funktionen.
  • Hugging Face bietet Zugang zu einer umfangreichen Sammlung von vortrainierten Transformer-Modellen, die auf NER-Aufgaben abgestimmt sind.
  • Plattformen wie Ultralytics HUB bieten Tools für die Verwaltung von KI-Projekten, einschließlich Training und Einsatz von Modellen. Obwohl sie sich in erster Linie auf Vision-Modelle wie Ultralytics YOLOkonzentriert, kann die Plattform Teil einer größeren Pipeline sein, die NLP-Aufgaben wie NER umfasst, insbesondere in Systemen, die sowohl visuelle als auch textuelle Daten analysieren. In der Ultralytics findest du weitere Informationen zur Modellverwaltung und -bereitstellung.
Alles lesen