Entdecken Sie PyTorch, die Kernbibliothek hinter Ultralytics . Erfahren Sie mehr über dynamische Graphen, GPU und den Aufbau effizienter Deep-Learning-Modelle.
PyTorch eine Open-Source-Bibliothek für maschinelles Lernen, die in erster Linie von Meta AI entwickelt wurde und sich zu einem Eckpfeiler für Forscher und Entwickler im Bereich Deep Learning entwickelt hat. Sie ist bekannt für ihre Flexibilität und Benutzerfreundlichkeit und ermöglicht es Anwendern, komplexe neuronale Netze mithilfe eines dynamischen Berechnungsgraphen aufzubauen und zu trainieren. Diese Funktion, die oft als „eager execution” bezeichnet wird, ermöglicht die sofortige Auswertung von Code, wodurch Debugging und Prototyping deutlich intuitiver werden als bei Frameworks, die auf statischen Graphdefinitionen basieren. Sie lässt sich nahtlos in die Python integrieren und wirkt wie eine natürliche Erweiterung der gängigen wissenschaftlichen Computing-Tools.
Das Herzstück dieses Frameworks sind Tensoren, bei denen es sich um mehrdimensionale Arrays handelt, ähnlich denen, die in der NumPy zu finden sind. Im Gegensatz zu Standard-Arrays sind PyTorch jedoch so konzipiert, dass sie GPU von NVIDIA CUDA bereitgestellte GPU nutzen. Diese Hardwarebeschleunigung ist entscheidend für die massive Parallelverarbeitung, die erforderlich ist, um moderne Modelle der künstlichen Intelligenz (KI) effizient zu trainieren.
Die Bibliothek unterstützt ein umfangreiches Ökosystem von Tools für Computer Vision (CV) und natürliche Sprachverarbeitung . Durch die Bereitstellung einer Vielzahl vorgefertigter Schichten, Optimierer und Verlustfunktionen vereinfacht sie den Prozess der Erstellung von Algorithmen für Aufgaben wie Bildklassifizierung und Sequenzmodellierung.
Die Vielseitigkeit dieses Frameworks hat dazu geführt, dass es in verschiedenen Branchen für hochwirksame KI-Lösungen eingesetzt wird:
Um seine Rolle besser zu verstehen, ist es hilfreich, PyTorch anderen gängigen Tools im KI-Stack zu unterscheiden:
Die gesamte Ultralytics , einschließlich des hochmodernen YOLO26 und des weit verbreiteten YOLO11, basiert nativ auf PyTorch. Diese Grundlage stellt sicher, dass Anwender von der Geschwindigkeit, Stabilität und dem umfangreichen Community-Support des Frameworks profitieren. Ob beim Transfer-Lernen mit benutzerdefinierten Trainingsdaten oder beim Exportieren von Modellen für Edge-Geräte – die zugrundeliegende Architektur basiert auf PyTorch und -Gradienten.
Die kommende Ultralytics vereinfacht diese Erfahrung weiter und bietet eine einheitliche Schnittstelle zur Verwaltung der Beschaffung, Schulung und Bereitstellung von Datensätzen, ohne dass umfangreicher Boilerplate-Code geschrieben werden muss.
Das folgende Beispiel zeigt, wie man GPU überprüft und eine Inferenz mit einem YOLO durchführt, und veranschaulicht, wie das Framework die Hardwarebeschleunigung im Hintergrund handhabt:
import torch
from ultralytics import YOLO
# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")
# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")
# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)