Glossar

Natürliche Sprachverarbeitung (NLP)

Entdecke Konzepte, Techniken und Anwendungen der natürlichen Sprachverarbeitung (NLP) wie Chatbots, Stimmungsanalyse und maschinelle Übersetzung.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Natural Language Processing (NLP) ist ein dynamischer Bereich innerhalb der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML), der es Computern ermöglicht, menschliche Sprache - sowohl Text als auch Sprache - zu verstehen, zu verarbeiten, zu interpretieren und zu erzeugen. Es kombiniert Computerlinguistik mit statistischer Modellierung, ML und Deep Learning (DL) Modellen, um die Lücke zwischen menschlicher Kommunikation und Computerverständnis zu schließen. Das Ziel ist es, Maschinen die Interaktion mit Sprache so zu ermöglichen, dass sie sowohl sinnvoll als auch nützlich ist.

Schlüsselkonzepte im NLP

NLP umfasst mehrere Kernaufgaben, die Sprache in für Maschinen verständliche Bestandteile zerlegen:

  • Tokenisierung: Der Prozess der Aufteilung von Text in kleinere Einheiten wie Wörter oder Unterwörter (Token).
  • Part-of-Speech (POS) Tagging: Jedem Token werden grammatikalische Kategorien (Substantiv, Verb, Adjektiv) zugewiesen.
  • Erkennung von benannten Entitäten (Named Entity Recognition, NER): Identifizieren und kategorisieren von wichtigen Entitäten in Texten, wie Namen von Personen, Organisationen, Orten, Daten und mehr.
  • Stimmungsanalyse: Bestimmung der emotionalen Stimmung (positiv, negativ, neutral), die in einem Text zum Ausdruck kommt.
  • Maschinelle Übersetzung: Automatisches Übersetzen von Text oder Sprache von einer Sprache in eine andere. Ein Beispiel dafür sind Tools wie Google Translate.
  • Sprachmodellierung: Die Vorhersage der Wahrscheinlichkeit einer Wortfolge, grundlegend für Aufgaben wie die Texterstellung.

Wie NLP funktioniert

NLP-Systeme folgen in der Regel einem Pipeline-Ansatz. Rohe Textdaten werden einer Vorverarbeitung unterzogen (z. B. Tokenisierung und Bereinigung), bevor Merkmale extrahiert werden. Diese Merkmale werden dann in ML- oder DL-Modelle eingespeist. Modernes NLP stützt sich in hohem Maße auf neuronale Netze, insbesondere auf Architekturen wie rekurrente neuronale Netze (RNNs) und neuerdings auch Transformers. Transformers, die für ihre Aufmerksamkeitsmechanismen bekannt sind, eignen sich hervorragend für die Erfassung von Sprachkontext und bilden die Grundlage für moderne Modelle wie GPT-4. Auf Forschungsplattformen wie der ACL Anthology finden sich viele Beiträge, die diese Fortschritte im Detail beschreiben.

Anwendungen von NLP

NLP ermöglicht eine Vielzahl von Anwendungen, die Branchen und tägliche Interaktionen verändern:

  1. Virtuelle Assistenten und Chatbots: Systeme wie Amazon Alexa, Google Assistant und Chatbots für den Kundenservice nutzen NLP, um Nutzeranfragen zu verstehen und natürlich zu beantworten. Sie nutzen Techniken wie Spracherkennung und Natural Language Understanding (NLU).
  2. Stimmungsanalyse für die Marktforschung: Unternehmen analysieren Beiträge in sozialen Medien, Kundenrezensionen und Umfrageantworten mithilfe der Stimmungsanalyse, um die öffentliche Meinung über Produkte oder Marken zu ermitteln und so die Geschäftsstrategien zu unterstützen. Weitere Beispiele für KI-Anwendungsfälle findest du hier.

Weitere gängige Anwendungen sind das Filtern von Spam-E-Mails, Textzusammenfassungen, semantische Suchmaschinen und Grammatikkorrekturprogramme wie Grammarly.

NLP vs. Verwandte Konzepte

NLP ist zwar verwandt, unterscheidet sich aber von ähnlichen Begriffen:

  • Natural Language Understanding (NLU): Ein Teilbereich des NLP, der sich speziell auf das maschinelle Leseverstehen konzentriert - das Verstehen der Bedeutung hinter einem Text. NLP ist breiter angelegt und umfasst auch die Generierung und andere Aufgaben.
  • Textgenerierung: Eine spezielle Anwendung innerhalb des NLP, die sich darauf konzentriert, menschenähnlichen Text zu erzeugen.
  • Computer Vision (CV): Beschäftigt sich mit der Interpretation von visuellen Informationen aus Bildern oder Videos. NLP und CV sind zwar getrennt, werden aber oft in multimodalen Modellen für Aufgaben wie Bildunterschriften oder die Beantwortung visueller Fragen kombiniert. Erfahre mehr über die Verknüpfung von NLP und CV. DieYOLO Ultralytics , die hauptsächlich für CV-Aufgaben wie die Objekterkennung eingesetzt werden, können in Systeme integriert werden, die auch NLP nutzen.

Tools und Plattformen

Bei der Entwicklung von NLP-Anwendungen kommen häufig Bibliotheken und Frameworks wie spaCy oder NLTK sowie Plattformen wie Hugging Face die Zugang zu zahlreichen vortrainierten Modellen und Datensätzen bieten. Für den Einsatz und die Verwaltung von Modellen, einschließlich solcher, die in NLP- oder kombinierten CV-NLP-Pipelines verwendet werden, bieten Plattformen wie Ultralytics HUB robuste MLOps-Funktionen.

Alles lesen