Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

PyTorch

Entdecken Sie PyTorch, die Kernbibliothek hinter Ultralytics . Erfahren Sie mehr über dynamische Graphen, GPU und den Aufbau effizienter Deep-Learning-Modelle.

PyTorch eine Open-Source-Bibliothek für maschinelles Lernen, die in erster Linie von Meta AI entwickelt wurde und sich zu einem Eckpfeiler für Forscher und Entwickler im Bereich Deep Learning entwickelt hat. Sie ist bekannt für ihre Flexibilität und Benutzerfreundlichkeit und ermöglicht es Anwendern, komplexe neuronale Netze mithilfe eines dynamischen Berechnungsgraphen aufzubauen und zu trainieren. Diese Funktion, die oft als „eager execution” bezeichnet wird, ermöglicht die sofortige Auswertung von Code, wodurch Debugging und Prototyping deutlich intuitiver werden als bei Frameworks, die auf statischen Graphdefinitionen basieren. Sie lässt sich nahtlos in die Python integrieren und wirkt wie eine natürliche Erweiterung der gängigen wissenschaftlichen Computing-Tools.

Kernmechanismen und Bedeutung

Das Herzstück dieses Frameworks sind Tensoren, bei denen es sich um mehrdimensionale Arrays handelt, ähnlich denen, die in der NumPy zu finden sind. Im Gegensatz zu Standard-Arrays sind PyTorch jedoch so konzipiert, dass sie GPU von NVIDIA CUDA bereitgestellte GPU nutzen. Diese Hardwarebeschleunigung ist entscheidend für die massive Parallelverarbeitung, die erforderlich ist, um moderne Modelle der künstlichen Intelligenz (KI) effizient zu trainieren.

Die Bibliothek unterstützt ein umfangreiches Ökosystem von Tools für Computer Vision (CV) und natürliche Sprachverarbeitung . Durch die Bereitstellung einer Vielzahl vorgefertigter Schichten, Optimierer und Verlustfunktionen vereinfacht sie den Prozess der Erstellung von Algorithmen für Aufgaben wie Bildklassifizierung und Sequenzmodellierung.

Anwendungsfälle in der Praxis

Die Vielseitigkeit dieses Frameworks hat dazu geführt, dass es in verschiedenen Branchen für hochwirksame KI-Lösungen eingesetzt wird:

  1. Autonome Fahrzeuge: Branchenführer nutzen PyTorch Deep-Learning-Modelle zu entwickeln, die Videofeeds von Autokameras verarbeiten. Diese Modelle führen eine Echtzeit-Objekterkennung durch, um Fahrspuren, Verkehrszeichen und Fußgänger zu identifizieren und so eine sicherere Navigation zu ermöglichen.
  2. Medizinische Diagnostik: Forscher nutzen das Framework, um fortschrittliche Anwendungen für das Gesundheitswesen zu entwickeln. So unterstützt es beispielsweise Systeme, die MRT- oder Röntgenbilder analysieren, um Ärzten durch präzise Bildsegmentierung bei der Erkennung von Tumoren zu helfen .

Vergleich mit verwandten Tools

Um seine Rolle besser zu verstehen, ist es hilfreich, PyTorch anderen gängigen Tools im KI-Stack zu unterscheiden:

  • Im Vergleich zu TensorFlow: Das von Google entwickelte TensorFlow stützte sich TensorFlow auf statische Berechnungsgraphen, was die Fehlersuche erschwerte, aber die Bereitstellung optimierte. Obwohl sich beide Frameworks in ihren Funktionen angeglichen haben, PyTorch aufgrund seiner intuitiven Benutzeroberfläche häufig für Rapid Prototyping und Forschung bevorzugt .
  • Im Vergleich zu OpenCV: OpenCV eine Bibliothek, die sich auf traditionelle Bildverarbeitungsfunktionen (wie Größenänderung, Filterung und Farbkonvertierung) konzentriert und nicht auf das Training neuronaler Netze. In einem typischen Arbeitsablauf verwenden Entwickler OpenCV die Datenvorverarbeitung, bevor sie die Bilder zur Analyse in ein PyTorch einspeisen.

Integration mit Ultralytics

Die gesamte Ultralytics , einschließlich des hochmodernen YOLO26 und des weit verbreiteten YOLO11, basiert nativ auf PyTorch. Diese Grundlage stellt sicher, dass Anwender von der Geschwindigkeit, Stabilität und dem umfangreichen Community-Support des Frameworks profitieren. Ob beim Transfer-Lernen mit benutzerdefinierten Trainingsdaten oder beim Exportieren von Modellen für Edge-Geräte – die zugrundeliegende Architektur basiert auf PyTorch und -Gradienten.

Die kommende Ultralytics vereinfacht diese Erfahrung weiter und bietet eine einheitliche Schnittstelle zur Verwaltung der Beschaffung, Schulung und Bereitstellung von Datensätzen, ohne dass umfangreicher Boilerplate-Code geschrieben werden muss.

Das folgende Beispiel zeigt, wie man GPU überprüft und eine Inferenz mit einem YOLO durchführt, und veranschaulicht, wie das Framework die Hardwarebeschleunigung im Hintergrund handhabt:

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")

# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten