Glossar

Generative KI

Entdecke, wie generative KI originelle Inhalte wie Texte, Bilder und Audiodateien erstellt und Branchen mit innovativen Anwendungen verändert.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Generative künstliche Intelligenz (KI) ist ein Teilbereich der künstlichen Intelligenz (KI ), der sich auf die Entwicklung von Systemen konzentriert, die neue Inhalte wie Text, Bilder, Audio, Code oder synthetische Daten erzeugen können. Im Gegensatz zu diskriminierenden KI-Modellen, die lernen, auf der Grundlage von Eingabedaten zu klassifizieren oder vorherzusagen (z. B. Objekte in einem Bild zu identifizieren), lernen generative Modelle die zugrundeliegenden Muster und Verteilungen innerhalb eines Datensatzes, um neue, originelle Ergebnisse zu erzeugen, die den Trainingsdaten ähneln. Jüngste Fortschritte, insbesondere bei Modellen wie Generative Pre-trained Transformers (GPT) und Diffusionsmodellen, haben die Erstellung äußerst realistischer und komplexer Inhalte ermöglicht.

Wie generative KI funktioniert

Generative KI-Modelle arbeiten in der Regel, indem sie eine Darstellung der Wahrscheinlichkeitsverteilung der Trainingsdaten lernen. Sie können dann aus dieser gelernten Verteilung Stichproben ziehen, um neue Datenpunkte zu erzeugen. Zu den gängigen Architekturen gehören:

  • Generative Adversarial Networks (GANs): Bei diesen Netzen konkurrieren zwei neuronale Netze, ein Generator und ein Diskriminator, miteinander, um die Qualität der erzeugten Ergebnisse zu verbessern.
  • Transformers: Diese in Large Language Models (LLMs) wie GPT-4 weit verbreiteten Modelle nutzen Aufmerksamkeitsmechanismen, um kohärente und kontextuell relevante Sequenzen, vor allem Text, zu erzeugen.
  • Variationale Autoencoder (VAEs): Diese lernen komprimierte Darstellungen von Daten und können neue Daten erzeugen, indem sie Punkte aus dem latenten Raum dekodieren.
  • Diffusionsmodelle: Diese Modelle fügen den Daten allmählich Rauschen hinzu und lernen dann, den Prozess umzukehren, was insbesondere bei Bildern eine sehr realitätsnahe Erzeugung ermöglicht (z. B. Stable Diffusion).

Generative KI vs. Computer Vision

Obwohl beides Teilgebiete der KI sind, dienen generative KI und Computer Vision (CV) grundlegend unterschiedlichen Zwecken.

  • Schwerpunkt Generative KI: Erstellen neuer Inhalte (z. B. Bilder aus Textbeschreibungen generieren, Artikel schreiben, Musik komponieren).
  • Schwerpunkt Computer Vision: Analysieren und Verstehen vorhandener visueller Daten (z. B. Objekterkennung, Bildklassifizierung, Instanzsegmentierung mit Modellen wie Ultralytics YOLO).

Wie auf der YOLO Vision 2024 erörtert, sind generative KI-Modelle oft deutlich größer (Milliarden von Parametern) als effiziente CV-Modelle, die für Echtzeitanalysen entwickelt wurden (wie Ultralytics YOLOv8mit Modellen ab ein paar Millionen Parametern). Generative KI erfordert erhebliche Rechenressourcen für Training und Inferenz, während viele CV-Modelle für den Einsatz auf Standardhardware oder Edge-Geräten optimiert sind.

Allerdings überschneiden sich diese Bereiche zunehmend. Generative KI kann den Lebenslauf unterstützen, indem sie synthetische Daten für das Training von Erkennungs- oder Segmentierungsmodellen erstellt, insbesondere für seltene Szenarien, und so die Robustheit und Leistung der Modelle verbessern kann.

Anwendungen und Beispiele aus der realen Welt

Generative KI hat zahlreiche Anwendungen in verschiedenen Bereichen:

  1. Erstellung von Inhalten: Erstellen von Artikeln, Marketingtexten, Skripten(Texterstellung), Erstellen von Originalbildern oder Kunst(Text-zu-Bild), Komponieren von Musik oder Erstellen von Videos(Text-zu-Video). Tools wie ChatGPT für Text und Midjourney für Bilder sind beliebte Beispiele.
  2. Datenerweiterung: Die Erstellung künstlicher Datenmuster, um begrenzte Datensätze zu erweitern. So können z. B. synthetische Bilder von seltenen Krankheiten erstellt werden, um die Genauigkeit von KI-Diagnosesystemen für die medizinische Bildanalyse zu verbessern. Dies hilft, Datenknappheit zu überwinden und verbessert die Modellgeneralisierung.
  3. Entdeckung und Entwicklung von Medikamenten: Die Simulation von Molekülstrukturen und die Vorhersage ihrer Eigenschaften, um die Suche nach neuen Medikamenten zu beschleunigen, wie sie von Unternehmen wie DeepMind erforscht wird.
  4. Personalisierung: Du kannst ausgefeilte Chatbots und virtuelle Assistenten einsetzen, personalisierte Lernmaterialien erstellen oder maßgeschneiderte Produktempfehlungen geben.

Ethische Erwägungen

Die Macht der generativen KI bringt auch erhebliche ethische Herausforderungen mit sich. Dazu gehören das Potenzial, Fehlinformationen oder schädliche Inhalte zu generieren, die Erstellung überzeugender Deepfakes, Fragen des Urheberrechts und des geistigen Eigentums an generierten Inhalten sowie inhärente Verzerrungen, die aus Trainingsdaten gelernt werden. Der Umgang mit diesen Problemen erfordert eine sorgfältige Abwägung von KI-Ethik, Transparenz und robusten rechtlichen Rahmenbedingungen. Es ist wichtig, diese Technologien verantwortungsvoll zu entwickeln und einzusetzen. Um deine eigenen KI-Modelle zu verwalten und zu trainieren, kannst du Plattformen wie Ultralytics HUB nutzen.

Alles lesen