Glossar

Maschinelle Übersetzung

Entdecke, wie maschinelle Übersetzung KI und Deep Learning nutzt, um Sprachbarrieren zu überwinden und nahtlose globale Kommunikation und Barrierefreiheit zu ermöglichen.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Maschinelle Übersetzung (MÜ) ist ein Teilbereich der Künstlichen Intelligenz (KI) und der Computerlinguistik, der sich mit der automatischen Umwandlung von Text oder Sprache von einer natürlichen Sprache (der Ausgangssprache) in eine andere (die Zielsprache) befasst. Sie nutzt Algorithmen des maschinellen Lernens (ML), insbesondere Deep Learning (DL) Modelle, die auf riesigen Mengen paralleler Textdaten trainiert werden, um die komplexen Muster und Nuancen der Sprachumwandlung zu lernen. Ziel ist es, Übersetzungen zu erstellen, die nicht nur bedeutungsgetreu sind, sondern sich auch in der Zielsprache flüssig und natürlich anhören.

Kernkonzepte und Entwicklung

Frühe maschinelle Übersetzungssysteme basierten auf regelbasierten Ansätzen, die Wörterbücher und grammatikalische Regeln nutzten, die von Linguisten in mühevoller Arbeit erstellt wurden. Später entwickelte sich die statistische maschinelle Übersetzung (SMT), die Übersetzungswahrscheinlichkeiten aus großen zweisprachigen Textkorpora wie dem Europarl Corpus lernte. Heute wird das Feld von der Neuronalen Maschinellen Übersetzung (NMT) beherrscht, die tiefe neuronale Netze (NN) verwendet, um den gesamten Übersetzungsprozess zu modellieren. NMT-Modelle, die oft auf Sequence-to-Sequence-Modellen mit Aufmerksamkeitsmechanismen oder der sehr einflussreichen Transformer-Architektur (die in der berühmten Arbeit"Attention Is All You Need" vorgestellt wurde) basieren, können weitreichende Abhängigkeiten und subtile linguistische Merkmale erfassen und so die Übersetzungsqualität erheblich verbessern. Diese Modelle erfordern große Mengen an Trainingsdaten und Rechenressourcen, die oft über Plattformen wie Ultralytics HUB verwaltet werden.

Maschinelle Übersetzung vs. verwandte NLP-Aufgaben

Die maschinelle Übersetzung ist eine spezielle Anwendung innerhalb des umfassenderen Bereichs der natürlichen Sprachverarbeitung (NLP). Obwohl sie damit verwandt ist, unterscheidet sie sich von anderen NLP-Aufgaben:

  • Natural Language Understanding (NLU): NLU konzentriert sich darauf, Maschinen in die Lage zu versetzen, die Bedeutung von Texten zu verstehen, einschließlich Absicht und Kontext. MT nutzt das Verstehen als Teil des Prozesses, aber sein Hauptziel ist die Sprachumwandlung.
  • Texterstellung: MÜ ist zwar eine Form der Texterstellung, aber sie wird durch die Notwendigkeit eingeschränkt, die Bedeutung des Ausgangstextes in einer anderen Sprache genau wiederzugeben. Bei der allgemeinen Texterstellung kann es darum gehen, einen völlig neuen Text auf der Grundlage einer Aufforderung zu erstellen.
  • Speech-to-Text & Text-to-Speech: Speech-to-Text wandelt gesprochenes Audio in Text um, und Text-to-Speech macht es umgekehrt. Sie behandeln Modalitätsänderungen, während sich MT hauptsächlich auf Sprachänderungen innerhalb der Textmodalität konzentriert (obwohl Sprachübersetzungssysteme diese Komponenten oft verketten).

Anwendungen in der realen Welt

Maschinelle Übersetzung ermöglicht zahlreiche Anwendungen, die die globale Kommunikation und den Zugang zu Informationen erleichtern:

  1. Online-Übersetzungstools: Dienste wie Google Translate und DeepL Translator bieten Milliarden von Nutzern auf der ganzen Welt sofortige Übersetzungen von Textabschnitten, Dokumenten und ganzen Websites und überwinden damit Kommunikationsbarrieren.
  2. Sprachübergreifende Kommunikationsplattformen: In Messaging-Apps (wie Skype Translator) oder Social-Media-Plattformen integrierte Echtzeitübersetzung ermöglicht es Nutzer/innen, die verschiedene Sprachen sprechen, nahtlos zu kommunizieren.
  3. Lokalisierung von Inhalten: Unternehmen nutzen MT (oft in Kombination mit menschlicher Nachbearbeitung), um Websites, Softwareoberflächen und Marketingmaterialien schnell und kostengünstig für internationale Zielgruppen anzupassen.
  4. Informationszugang: Suchmaschinen nutzen MÜ, um Informationen sprachübergreifend zu indizieren und abzurufen und erweitern so den Zugang zu globalen Wissensdatenbanken. Werkzeuge, die von Organisationen wie der Association for Computational Linguistics (ACL) entwickelt wurden, erweitern oft die Grenzen dieser Anwendungen.

Relevanz und Tools

MÜ ist ein wichtiger Bereich der KI-Forschung, der Fortschritte bei neuronalen Netzwerkarchitekturen wie dem Transformer hervorgebracht hat, die wiederum Modelle in anderen Bereichen wie dem Computersehen beeinflusst haben. Zur Bewertung der MÜ-Qualität werden oft Metriken wie der BLEU-Score herangezogen. Bei der Entwicklung werden häufig Frameworks wie PyTorch oder TensorFlowund Open-Source-Toolkits wie Hugging Face Transformers, OpenNMT oder Fairseq bieten vortrainierte Modelle und Werkzeuge für den Aufbau eigener Übersetzungssysteme.

Alles lesen