Glossar

Erkennung von benannten Entitäten (NER)

Erhalte Einblicke mit Named Entity Recognition (NER). Entdecke, wie KI unstrukturierten Text in verwertbare Daten für verschiedene Anwendungen verwandelt.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Erkennung benannter Entitäten (Named Entity Recognition, NER) ist ein wichtiger Bestandteil moderner Systeme der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML), insbesondere im Bereich der Verarbeitung natürlicher Sprache (Natural Language Processing, NLP). Sie ermöglicht es Computern, Schlüsselinformationen in unstrukturierten Texten automatisch zu identifizieren und zu kategorisieren und sie in ein Format umzuwandeln, das Maschinen leicht verstehen und nutzen können. Bei diesem Prozess werden "benannte Entitäten" - Wörter oder Phrasen, die für bestimmte Informationen stehen - identifiziert und in vordefinierte Kategorien wie Personen, Organisationen, Orte, Daten und mehr eingeordnet. Durch die Extraktion dieser Entitäten erschließt die NER wertvolle Erkenntnisse aus Textdaten und ist damit für eine Vielzahl von Anwendungen unverzichtbar.

Wie die Erkennung von benannten Entitäten funktioniert

NER-Systeme analysieren die sprachliche Struktur von Texten, um Entitäten zu finden und zu klassifizieren. Dies umfasst in der Regel mehrere Schritte:

  • Tokenisierung: Zerlegen von Text in einzelne Wörter oder Token.
  • Part-of-Speech Tagging: Identifizierung der grammatikalischen Rolle jedes Wortes (z.B. Substantiv, Verb, Adjektiv).
  • Entity Detection: Das Erkennen von potenziellen Entitäten anhand von Kontext und Mustern. Zum Beispiel sind großgeschriebene Wörter oft ein Hinweis auf benannte Entitäten.
  • Klassifizierung der Entität: Kategorisierung erkannter Entitäten in vordefinierte Typen mithilfe von maschinellen Lernmodellen, die auf riesigen Mengen kommentierter Textdaten trainiert wurden. Zu den gängigen Kategorien gehören:
    • Person: Namen von Personen (z.B. "Glenn Jocher").
    • Organisation: Namen von Unternehmen, Institutionen oder Gruppen (z. B. "Ultralytics").
    • Ort: Geografische Orte (z.B. "Madrid").
    • Datum: Kalenderdaten (z.B. "29. November 2024").
    • Zeit: Punkte in der Zeit (z.B. "15 Uhr").
    • Numerische Werte: Zahlen mit bestimmten Bedeutungen (z. B. "20.000 Sterne").

In dem Satz "Ultralytics YOLO11 wurde auf der YOLO Vision 2024 vorgestellt" würde ein NER-System zum Beispiel "Ultralytics" als Organisation, "YOLO11" als Produkt und "YOLO Vision 2024" als Ereignis identifizieren. Moderne NER-Systeme nutzen oft Deep-Learning-Architekturen, insbesondere Transformatoren, die den Kontext und komplexe Muster in der Sprache besonders gut verstehen.

Relevanz und Anwendungen

NER ist eine Grundlagentechnologie für zahlreiche KI-gesteuerte Anwendungen in verschiedenen Branchen. Ihre Fähigkeit, automatisch strukturierte Informationen aus Text zu extrahieren, macht sie unschätzbar wertvoll für:

  • Informationsextraktion: NER ist von grundlegender Bedeutung für die automatische Extraktion von Schlüsseldetails aus Dokumenten, wie z. B. die Identifizierung von Vertragsklauseln in Rechtsdokumenten oder die Extraktion von Patienteninformationen aus medizinischen Bildanalyseberichten.
  • Suchmaschinen und Empfehlungssysteme: Suchmaschinen nutzen NER, um die Absicht hinter den Nutzeranfragen besser zu verstehen. Wenn ein Nutzer z. B. nach "Veranstaltungen in Madrid" sucht, kann NER "Veranstaltungen" als die Art der gesuchten Informationen und "Madrid" als den Ort identifizieren und so die Suchergebnisse verfeinern. Ähnlich können Empfehlungssysteme die NER nutzen, um die Bewertungen und Vorlieben der Nutzer/innen zu analysieren und ihnen relevantere Vorschläge zu machen.
  • Kundenbetreuung: Die Analyse von Kundenfeedback und Supporttickets mithilfe von NER kann Unternehmen dabei helfen, häufige Probleme zu erkennen, Erwähnungen bestimmter Produkte oder Dienstleistungen zu verfolgen und Anfragen an die entsprechenden Abteilungen weiterzuleiten, um die Kundenerfahrung zu verbessern.
  • Finanzanalyse: Im Finanzbereich kann die NER verwendet werden, um Firmennamen, Börsenkürzel und Transaktionsdetails aus Nachrichtenartikeln und Finanzberichten zu extrahieren, was bei der Marktforschung und dem Risikomanagement hilfreich ist.
  • Inhaltsempfehlungen: Nachrichtenaggregatoren und Content-Plattformen nutzen NER, um Artikel zu kategorisieren und den Nutzern auf der Grundlage identifizierter Entitäten verwandte Inhalte vorzuschlagen, um die Entdeckung von Inhalten und die Beteiligung der Nutzer zu verbessern, ähnlich wie bei semantischen Suchtechnologien.

Im Kontext des E-Commerce kann NER beispielsweise Produktbeschreibungen analysieren, um Produkte automatisch mit relevanten Kategorien und Attributen zu versehen. In der Landwirtschaft könnte NER zur Analyse von Berichten über den Gesundheitszustand von Nutzpflanzen eingesetzt werden, indem Entitäten wie Krankheitsnamen oder betroffene Regionen extrahiert werden, um die Datenanalyse und die Entscheidungsfindung zu optimieren.

Hauptunterschiede zu verwandten Konzepten

Obwohl die NER eng mit anderen NLP-Aufgaben verwandt ist, hat sie unterschiedliche Funktionen:

  • NER vs. Sentiment-Analyse: Während die NER Entitäten identifiziert und kategorisiert, konzentriert sich die Sentiment-Analyse auf die Bestimmung des emotionalen Tons oder der Meinung, die in einem Text ausgedrückt wird. NER könnte einen Produktnamen identifizieren, während die Sentiment-Analyse feststellt, ob der Text eine positive, negative oder neutrale Stimmung gegenüber diesem Produkt ausdrückt.
  • NER vs. Textzusammenfassung: Die Textzusammenfassung zielt darauf ab, große Textmengen in kürzere, kohärente Zusammenfassungen zu kondensieren. NER hingegen konzentriert sich darauf, bestimmte Informationen (Entitäten) aus einem Text zu extrahieren, ohne unbedingt den gesamten Inhalt zusammenzufassen.
  • NER und Natural Language Understanding (NLU): NER ist ein Bestandteil von Natural Language Understanding (NLU). NLU ist ein breiteres Feld, das darauf abzielt, Computer in die Lage zu versetzen, menschliche Sprache in ihrer Gesamtheit zu verstehen, einschließlich Absicht, Kontext und Nuancen. NER trägt zu NLU bei, indem es strukturierte Informationen auf Entitätsebene bereitstellt, die zum allgemeinen Sprachverständnis beitragen.

Technologien und Werkzeuge

Verschiedene Tools und Plattformen erleichtern die Entwicklung und den Einsatz von NER-Systemen. Hugging Face bietet eine breite Palette an vortrainierten Transformationsmodellen und Bibliotheken, die für NER-Aufgaben sehr effektiv sind. Plattformen wie Ultralytics HUB bieten Tools und eine Infrastruktur zum Trainieren, Bereitstellen und Verwalten von KI-Modellen, einschließlich derer, die für NER verwendet werden, und vereinfachen so die Integration von NER-Funktionen in umfassendere KI-Lösungen. Ultralytics YOLO KI-Modelle, die in erster Linie für die Objekterkennung bekannt sind, können in NLP-Pipelines integriert werden, um umfassende Systeme zu schaffen, die sowohl visuelle als auch textuelle Daten verstehen, was die Vielseitigkeit von NER in multimodalen Anwendungen weiter erhöht.

Alles lesen