Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

PyTorch

Explora PyTorch, la biblioteca central que impulsa Ultralytics . Descubre sus gráficos dinámicos, GPU y cómo crear modelos eficientes de aprendizaje profundo.

PyTorch una biblioteca de aprendizaje automático de código abierto desarrollada principalmente por Meta AI que se ha convertido en una piedra angular para los investigadores y desarrolladores en el campo del aprendizaje profundo. Conocida por su flexibilidad y facilidad de uso, permite a los usuarios crear y entrenar redes neuronales complejas utilizando un gráfico computacional dinámico . Esta característica, a menudo denominada «ejecución entusiasta», permite evaluar el código de forma inmediata, lo que hace que la depuración y la creación de prototipos sean mucho más intuitivas en comparación con los marcos que se basan en definiciones de gráficos estáticos. Se integra a la perfección con el lenguaje Python , lo que la convierte en una extensión natural de las herramientas informáticas científicas estándar.

Mecánica básica y significado

En el centro de este marco se encuentran los tensores, que son matrices multidimensionales similares a las que se encuentran en la NumPy . Sin embargo, a diferencia de las matrices estándar , PyTorch están diseñados para aprovechar GPU proporcionada por NVIDIA CUDA. Esta aceleración de hardware es fundamental para el procesamiento paralelo masivo necesario para entrenar de manera eficiente los modelos modernos de inteligencia artificial (IA) .

La biblioteca admite un amplio ecosistema de herramientas para la visión artificial (CV) y el procesamiento del lenguaje natural . Al proporcionar un amplio conjunto de capas, optimizadores y funciones de pérdida predefinidos, simplifica el proceso de creación de algoritmos para tareas como la clasificación de imágenes y el modelado de secuencias.

Aplicaciones en el mundo real

La versatilidad de este marco ha llevado a su adopción en diversos sectores para soluciones de IA de gran impacto:

  1. Vehículos autónomos: Los líderes del sector aprovechan PyTorch crear modelos de aprendizaje profundo que procesan las señales de vídeo de las cámaras de los coches. Estos modelos realizan la detección de objetos en tiempo real para identificar carriles, señales y peatones, lo que permite una navegación más segura.
  2. Diagnóstico médico: Los investigadores utilizan el marco para desarrollar aplicaciones sanitarias avanzadas. Por ejemplo, potencia sistemas que analizan resonancias magnéticas o rayos X para ayudar a los médicos a detectar tumores mediante una segmentación precisa de las imágenes.

Comparación con herramientas relacionadas

Para comprender mejor su función, resulta útil distinguir PyTorch otras herramientas comunes en la pila de IA:

  • Vs. TensorFlow: Desarrollado por Google, TensorFlow se basaba TensorFlow en gráficos computacionales estáticos, lo que dificultaba la depuración, pero optimizaba la implementación. Aunque ambos marcos han convergido en cuanto a características, PyTorch suele PyTorch el preferido para la creación rápida de prototipos y la investigación debido a su interfaz intuitiva.
  • Vs. OpenCV: OpenCV una biblioteca centrada en funciones tradicionales de procesamiento de imágenes (como el cambio de tamaño, el filtrado y la conversión de color) más que en el entrenamiento de redes neuronales. En un flujo de trabajo típico, los desarrolladores utilizan OpenCV el preprocesamiento de datos antes de introducir las imágenes en un PyTorch para su análisis.

Integración con Ultralytics

Toda la familia Ultralytics , incluidos el innovador YOLO26 y el ampliamente utilizado YOLO11, está construida de forma nativa en PyTorch. Esta base garantiza que los usuarios se beneficien de la velocidad, la estabilidad y el amplio soporte de la comunidad del marco. Ya sea realizando aprendizaje por transferencia en datos de entrenamiento personalizados o exportando modelos para dispositivos periféricos, la arquitectura subyacente se basa en PyTorch y gradientes PyTorch .

La próxima Ultralytics simplifica aún más esta experiencia, proporcionando una interfaz unificada para gestionar el abastecimiento, el entrenamiento y la implementación de conjuntos de datos sin necesidad de escribir un extenso código repetitivo.

El siguiente ejemplo muestra cómo verificar GPU y ejecutar la inferencia utilizando un YOLO , mostrando cómo el marco maneja la aceleración del hardware en segundo plano:

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")

# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora