Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Foundation Model

Entdecken Sie die Leistungsfähigkeit von Fundamentmodellen in der KI. Erfahren Sie, wie Sie mit der Ultralytics groß angelegte Modelle wie Ultralytics für benutzerdefinierte Aufgaben anpassen können.

Ein Fundamentmodell stellt einen bedeutenden Paradigmenwechsel im Bereich der Künstlichen Intelligenz (KI) dar. Es handelt sich um ein groß angelegtes maschinelles Lernmodell, das auf einer riesigen Datenmenge trainiert wurde – oft mit Milliarden von Parametern – und an eine Vielzahl von nachgelagerten Aufgaben angepasst werden kann. Im Gegensatz zu herkömmlichen Modellen des maschinellen Lernens (ML), die in der Regel für einen bestimmten, singulären Zweck wie die Klassifizierung einer bestimmten Blumenart entwickelt werden, lernt ein Grundlagenmodell während einer ressourcenintensiven Vor-Trainingsphase allgemeine Muster, Strukturen und Beziehungen. Diese breite Wissensbasis ermöglicht es Entwicklern, das Modell durch Transferlernen auf neue Probleme anzuwenden, wodurch der Zeit- und Datenaufwand für die Erzielung modernster Ergebnisse erheblich reduziert wird.

Kernmechanismen: Vortraining und Anpassung

Die Stärke eines Fundamentmodells liegt in seinem zweistufigen Entwicklungsprozess: Vorabtraining und Feinabstimmung. Während des Vorabtrainings wird das Modell mit riesigen Datensätzen konfrontiert, wie z. B. großen Teilen des Internets, vielfältigen Bildbibliotheken oder umfangreichen Code-Repositorys. In dieser Phase wird häufig selbstüberwachtes Lernen eingesetzt, eine Technik , bei der das Modell seine eigenen Labels aus der Datenstruktur selbst generiert, wodurch der Engpass der manuellen Datenannotation beseitigt wird. Ein Sprachmodell könnte beispielsweise lernen, das nächste Wort in einem Satz vorherzusagen, während ein Bildverarbeitungsmodell lernt, Kanten, Texturen und die Objektpermanenz zu verstehen.

Nach dem Vortraining dient das Modell als vielseitiger Ausgangspunkt. Durch einen Prozess namens Fine-Tuning können Entwickler die Gewichte des Modells anhand eines kleineren, domänenspezifischen Datensatzes optimieren. Diese Fähigkeit ist von zentraler Bedeutung für die Demokratisierung der KI, da sie es Unternehmen mit begrenzten Rechenressourcen ermöglicht, leistungsstarke Architekturen zu nutzen. Moderne Workflows nutzen häufig Tools wie die Ultralytics , um diesen Anpassungsprozess zu optimieren und ein effizientes Training mit benutzerdefinierten Datensätzen zu ermöglichen, ohne dass ein neuronales Netzwerk von Grund auf neu aufgebaut werden muss.

Anwendungsfälle in der Praxis

Foundation-Modelle dienen als Rückgrat für Innovationen in verschiedenen Branchen. Aufgrund ihrer Fähigkeit zur Verallgemeinerung können sie für Aufgaben eingesetzt werden, die von der Verarbeitung natürlicher Sprache bis hin zu fortgeschrittener Computervision reichen.

  • Computer Vision im Gesundheitswesen: Spezielle Vision-Foundation-Modelle können feinabgestimmt werden, um bei der medizinischen Bildanalyse zu helfen. Ein ursprünglich auf allgemeine Bilder trainiertes Modell kann angepasst werden, um detect in MRT-Scans detect oder Buckelfrakturen in Röntgenbildern detect . Diese Anwendung zeigt, wie allgemeines visuelles Verständnis zu lebensrettenden Diagnosewerkzeugen führt .
  • Industrielle Automatisierung: In der Fertigung dienen Bildverarbeitungsmodelle wie Ultralytics als grundlegende Architekturen für die Objekterkennung. Fabriken nutzen diese Modelle zur Automatisierung der Qualitätsprüfung, um Fehler in Fertigungsstraßen mit hoher Geschwindigkeit und Genauigkeit zu erkennen. Das bereits vorhandene Wissen des Modells über Objektgrenzen beschleunigt den Einsatz dieser intelligenten Fertigungslösungen.

Beispiel für die technische Umsetzung

Entwickler können Foundation-Modelle nutzen, um komplexe Aufgaben mit minimalem Codeaufwand auszuführen. Das folgende Beispiel zeigt, wie ein vortrainiertes YOLO26-Modell– ein für Echtzeitanwendungen optimiertes Vision-Foundation-Modell – geladen und eine Objekterkennung in einem Bild durchgeführt wird.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")

# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Differenzierte Schlüsselbegriffe

Es ist hilfreich, das „Foundation Model“ von verwandten Konzepten in der KI-Landschaft zu unterscheiden, um ihre spezifischen Rollen zu verstehen:

  • Großes Sprachmodell (LLM): Ein LLM ist eine Art von Basismodell, das speziell für die Verarbeitung und Generierung von Text entwickelt wurde. Während alle LLMs Basismodelle sind, sind nicht alle Basismodelle LLMs; zu dieser Kategorie gehören auch Bildverarbeitungsmodelle wie SAM Segment Anything Model) und multimodale Systeme.
  • Transferlernen: Hierbei handelt es sich um die Technik, mit der ein Basismodell auf eine neue Aufgabe angewendet wird. Das Basismodell ist das Artefakt (das gespeicherte neuronale Netzwerk), während Transferlernen der Prozess der Aktualisierung des Wissens dieses Artefakts für einen bestimmten Anwendungsfall ist , wie beispielsweise die Schädlingsbekämpfung in der Landwirtschaft.
  • Generative KI: Dies bezieht sich auf Systeme, die neue Inhalte (Text, Bilder, Code) erstellen können. Viele Basismodelle unterstützen generative KI-Anwendungen, können aber auch für diskriminierende Aufgaben wie Klassifizierung oder Objektverfolgung verwendet werden, die nicht streng genommen „generativ” sind.

Zukünftige Ausrichtung und Auswirkungen

Die Entwicklung von Grundlagenmodellen geht in Richtung multimodaler KI, bei der ein einziges System Informationen aus Text, Bildern, Audio und Sensordaten gleichzeitig verarbeiten und in Beziehung setzen kann. Forschungen von Institutionen wie dem Stanford Institute for Human-Centered AI (HAI) unterstreichen das Potenzial dieser Systeme, die Welt ähnlich wie Menschen zu verstehen. Da diese Modelle immer effizienter werden, wird der Einsatz auf Edge-Computing-Geräten immer praktikabler, wodurch leistungsstarke KI-Funktionen direkt auf Smartphones, Drohnen und IoT-Sensoren verfügbar werden.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten