Glossar

Generative KI

Entdecke, wie generative KI originelle Inhalte wie Texte, Bilder und Audiodateien erstellt und Branchen mit innovativen Anwendungen verändert.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Generative Künstliche Intelligenz (KI) ist ein wichtiger Zweig innerhalb des breiteren Feldes der Künstlichen Intelligenz (KI), der sich speziell auf die Entwicklung von Systemen konzentriert, die in der Lage sind, völlig neue, originelle Inhalte zu erzeugen. Diese Inhalte können verschiedene Modalitäten umfassen, darunter Text, Bilder, Audio, Code und sogar synthetische Daten. Im Gegensatz zu diskriminierenden KI-Modellen, die darauf trainiert sind, auf der Grundlage von Eingabedaten zu klassifizieren oder Vorhersagen zu treffen (z. B. Objekte in einem Bild durch Objekterkennung zu identifizieren), lernen generative Modelle die zugrunde liegenden Muster, Strukturen und Wahrscheinlichkeitsverteilungen in einem Trainingsdatensatz. Anschließend nutzen sie dieses Wissen, um neue Ergebnisse zu erzeugen, die die Eigenschaften der ursprünglichen Daten nachahmen. Jüngste Durchbrüche, insbesondere durch Architekturen wie Generative Pre-trained Transformers (GPT) und Diffusionsmodelle, haben die Erstellung bemerkenswert realistischer und komplexer Inhalte ermöglicht und die Grenzen der maschinellen Kreativität erweitert.

Wie generative KI funktioniert

Der Kerngedanke der meisten generativen Modelle besteht darin, eine Darstellung der Datenverteilung zu lernen. Sobald diese Verteilung erlernt ist, kann das Modell daraus Stichproben ziehen, um neue Datenpunkte zu erzeugen, die statistisch gesehen den Daten ähnlich sind, auf denen es trainiert wurde. Dazu werden komplexe neuronale Netzwerkarchitekturen (NN) und ausgefeilte Trainingstechniken eingesetzt. Einige bekannte Architekturen sind:

Generative KI vs. Computer Vision

Generative KI und Computer Vision (CV) sind zwar beides Teilgebiete der KI, haben aber grundlegend unterschiedliche Ziele. CV konzentriert sich darauf, Maschinen in die Lage zu versetzen, visuelle Informationen aus der Welt zu interpretieren und zu verstehen, indem sie Aufgaben wie Bildklassifizierung, Objekterkennung und Instanzsegmentierung durchführen. Generative KI hingegen konzentriert sich darauf, neue visuelle (oder andere) Inhalte zu erstellen.

Zu den wichtigsten Unterschieden, die bei Diskussionen wie der YOLO Vision 2024 deutlich werden, gehören:

  1. Modellgröße: Generative Modelle, insbesondere LLMs und große Bildmodelle, enthalten oft Milliarden oder sogar Billionen von Parametern. CV-Modelle, die für die Echtzeitanalyse entwickelt wurden, wie z. B. Ultralytics YOLO11sind in der Regel viel kleiner und effizienter. Einige Varianten haben nur ein paar Millionen Parameter(vergleiche YOLO ).
  2. Rechnerische Ressourcen: Das Trainieren und Ausführen großer generativer Modelle erfordert eine erhebliche Rechenleistung, die oft verteilte Cluster von Grafikprozessoren (GPUs) umfasst. Viele CV-Modelle, darunter auch die von Ultralytics, sind auf Effizienz optimiert und können auf Standardhardware oder speziellen Edge-Geräten mit Frameworks wie ONNX oder TensorRT.
  3. Ziel: CV analysiert vorhandene Daten; generative KI synthetisiert neue Daten.

Trotz dieser Unterschiede sind die Bereiche zunehmend miteinander verbunden. Generative KI erweist sich als wertvoll für die Lebenslaufforschung, da sie hochwertige synthetische Daten erzeugt. Diese synthetischen Daten können reale Datensätze ergänzen und dabei helfen, robustere und genauere Lebenslaufmodelle zu trainieren, vor allem in Szenarien, in denen reale Daten knapp oder schwer zu beschaffen sind, wie z. B. bei Simulationen des autonomen Fahrens oder der Darstellung seltener Krankheiten(KI im Gesundheitswesen).

Anwendungen in der realen Welt

Generative KI verändert zahlreiche Branchen:

  • Erstellung von Inhalten: Automatisierte Erstellung von Artikeln, Marketingtexten und Skripten(GPT-3), Erstellung einzigartiger Bilder und Grafiken(Midjourney, DALL-E 3), Komposition von Musik und Erstellung von Videoinhalten(OpenAI Sora).
  • Synthetische Daten erzeugen: Erstellung realistischer Datensätze für das Training von ML-Modellen in Bereichen wie Robotik, Finanzen(Computer-Vision-Modelle im Finanzwesen) und Gesundheitswesen, Verbesserung der Modellleistung und Berücksichtigung von Datenschutzfragen. So können zum Beispiel synthetische medizinische Bilder erzeugt werden, um Diagnosetools zu trainieren, ohne echte Patientendaten zu verwenden.
  • Arzneimittelentdeckung und Materialwissenschaft: Das Entwerfen neuer Molekularstrukturen und die Vorhersage ihrer Eigenschaften beschleunigen Forschung und Entwicklung, wie Organisationen wie Google DeepMind zeigen.
  • Personalisierung: Ermöglicht hochgradig individuelle Nutzererfahrungen durch die dynamische Generierung von Inhalten in Chatbots, virtuellen Assistenten und Empfehlungsmaschinen.
  • Software-Entwicklung: Unterstützung von Entwicklern durch das Generieren von Codeschnipseln, das Vorschlagen von Fehlerbehebungen und sogar das Erstellen ganzer Funktionen auf der Grundlage von Beschreibungen in natürlicher Sprache(GitHub Copilot).

Herausforderungen und ethische Erwägungen

Der schnelle Fortschritt der generativen KI bringt auch Herausforderungen mit sich. Die Gewährleistung der ethischen Nutzung dieser leistungsstarken Werkzeuge ist von größter Bedeutung, insbesondere im Hinblick auf Deepfakes, Fehlinformationen, geistige Eigentumsrechte und inhärente Verzerrungen, die aus den Trainingsdaten gelernt werden. Dies erfordert eine sorgfältige Modellentwicklung, robuste Erkennungsmethoden und klare Richtlinien, die in den Grundsätzen der KI-Ethik festgelegt sind. Darüber hinaus stellen die benötigten Rechenressourcen ein großes Problem für die Umwelt und die Zugänglichkeit dar. Plattformen wie Ultralytics HUB zielen darauf ab, Arbeitsabläufe zu rationalisieren und potenziell die Einstiegshürden für bestimmte KI-Aufgaben zu senken.

Alles lesen