Glossar

Deepfakes

Entdecke die Technologie, Anwendungen und ethischen Bedenken von Deepfakes, von der Unterhaltung bis zur Fehlinformation. Lerne Lösungen zur Erkennung und KI kennen.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Deepfakes sind sehr realistische, synthetisch erzeugte oder manipulierte Videos, Bilder oder Audioaufnahmen, die mit fortschrittlichen Techniken der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML), insbesondere Deep Learning (DL), erstellt wurden. Der Begriff setzt sich aus den Wörtern "Deep Learning" und "Fake" zusammen. Diese Techniken ermöglichen es, Gesichter, Stimmen und Handlungen überzeugend zu ersetzen oder zu synthetisieren, sodass es so aussieht, als ob jemand etwas gesagt oder getan hätte, was er in Wirklichkeit nicht getan hat. Die Deepfake-Technologie, die ursprünglich aus Online-Communities stammt, hat sich schnell weiterentwickelt und bietet sowohl kreative Möglichkeiten als auch große ethische Herausforderungen.

Wie Deepfakes erstellt werden

Die Kerntechnologie hinter vielen Deepfakes sind Generative Adversarial Networks (GANs). Ein GAN besteht aus zwei konkurrierenden neuronalen Netzen: einem Generator, der den gefälschten Inhalt erzeugt (z. B. ein Bild mit einem vertauschten Gesicht), und einem Diskriminator, der versucht, zwischen echten und gefälschten Inhalten zu unterscheiden. Durch iteratives Training wird der Generator immer geschickter darin, realistische Fälschungen zu erzeugen, die den Diskriminator und schließlich auch die menschlichen Beobachter täuschen können. Eine weitere gängige Technik sind Autoencoder, die komprimierte Repräsentationen (Kodierungen) von Gesichtern aus großen Datensätzen lernen und diese Repräsentationen dann dekodieren, um Gesichter in Zielvideos zu rekonstruieren oder auszutauschen. Um überzeugende Deepfakes zu erstellen, sind oft umfangreiche Trainingsdaten (Bilder oder Videoclips der Zielpersonen) und erhebliche GPU Rechenressourcen, die oft über Plattformen wie Ultralytics HUB verwaltet werden.

Anwendungen und Beispiele

Die Deepfake-Technologie hat eine Reihe von Anwendungen, die von nützlichen bis zu bösartigen Aktivitäten reichen:

  • Unterhaltung und Medien: In der Filmproduktion werden sie eingesetzt, um das Alter von Schauspielern zu reduzieren, historische Figuren nachzustellen oder die Synchronisation zu verbessern, indem die Lippenbewegungen an den übersetzten Ton angepasst werden. Die Filmemacher haben Deepfake-Techniken zum Beispiel in Der Mandalorianer um eine jüngere Version eines Schauspielers digital nachzubilden. Ein weiteres Beispiel ist Synthesia, eine Plattform, die KI-Avatare für die Erstellung von Trainingsvideos und Präsentationen verwendet und so synthetische Videoinhalte erzeugt.
  • Bildung und Barrierefreiheit: Virtuelle Lehrkräfte schaffen oder historische Persönlichkeiten zu Bildungszwecken zum Leben erwecken. Das Klonen von Stimmen kann Menschen helfen, die ihre Stimme verloren haben.
  • Synthetische Daten erzeugen: Erstellung künstlicher Datensätze für das Training anderer ML-Modelle, insbesondere im Bereich Computer Vision, wo reale Daten knapp oder sensibel sein können. Dies kann dazu beitragen, die Robustheit von Modellen wie Ultralytics YOLO11 für Aufgaben wie die Gesichtserkennung.
  • Desinformation und Böswilligkeit: Die Verbreitung politischer Fehlinformationen, die Fälschung von Prominentenwerbung oder Skandalen, die Erstellung von Pornografie ohne Einwilligung und Betrug durch Nachahmung (z. B. Stimmfälschungen zur Autorisierung von Transaktionen). Dies wirft ernste Bedenken hinsichtlich der KI-Ethik und des Datenschutzes auf.

Deepfake-Erkennung

Das Aufkommen von Deepfakes hat die Forschung zu Erkennungsmethoden beflügelt. Dabei geht es oft darum, ML-Modelle zu trainieren, um subtile Unstimmigkeiten oder Artefakte zu erkennen, die für generierte Inhalte charakteristisch sind, wie z. B. ungewöhnliche Blinzelmuster, unnatürliche Gesichtsausdrücke oder Unstimmigkeiten bei Beleuchtung oder Schatten. Computer Vision (CV)-Techniken sind dabei von zentraler Bedeutung. Die Erkennung ist jedoch ein ständiges Wettrüsten, da die Techniken zur Erzeugung von Deepfakes ständig verbessert werden, um der Erkennung zu entgehen. Organisationen wie die Deepfake Detection Challenge (DFDC) von Meta AI und Initiativen von Unternehmen wie Microsoft zielen darauf ab, den Stand der Erkennungstechnologie zu verbessern. Standard-Benchmarks und -Datensätze sind für die Entwicklung und Evaluierung dieser Erkennungsmodelle von entscheidender Bedeutung.

Unterscheidung von anderen Medienmanipulationen

Deepfakes unterscheiden sich von der herkömmlichen Foto- oder Videobearbeitung (z. B. mit Adobe Photoshop oder After Effects) vor allem dadurch, dass sie Deep Learning einsetzen, um auf der Grundlage gelernter Muster völlig neue, realistische Bild- oder Tonelemente zu erzeugen, anstatt nur vorhandene Pixel manuell oder durch einfachere Algorithmen zu verändern. Während sich die Bilderkennung auf die Identifizierung von Objekten oder Merkmalen in einem Bild konzentriert, geht es bei der Deepfake-Technologie darum, plausible Bilder oder Videos zu synthetisieren. Sie stellt eine anspruchsvolle Anwendung der generativen KI im visuellen Bereich dar. Das Missbrauchspotenzial unterstreicht die Bedeutung einer verantwortungsvollen KI-Entwicklung und des öffentlichen Bewusstseins.

Alles lesen