Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

PyTorch

Explore PyTorch, a biblioteca central que alimenta Ultralytics . Saiba mais sobre os seus gráficos dinâmicos, GPU e como construir modelos eficientes de aprendizagem profunda.

PyTorch uma biblioteca de aprendizagem automática de código aberto desenvolvida principalmente pela Meta AI que se tornou uma pedra angular para investigadores e programadores na área da aprendizagem profunda. Conhecida pela sua flexibilidade e facilidade de utilização, permite aos utilizadores construir e treinar redes neurais complexas utilizando um gráfico computacional dinâmico . Esse recurso, frequentemente chamado de "execução ansiosa", permite que o código seja avaliado imediatamente, tornando a depuração e a prototipagem significativamente mais intuitivas em comparação com frameworks que dependem de definições gráficas estáticas. Ela se integra perfeitamente à linguagem Python , parecendo uma extensão natural das ferramentas padrão de computação científica.

Mecânica central e significado

No centro dessa estrutura estão os tensores, que são matrizes multidimensionais semelhantes às encontradas na NumPy . No entanto, ao contrário das matrizes padrão, PyTorch são projetados para aproveitar GPU fornecida pela NVIDIA CUDA. Essa aceleração de hardware é fundamental para o processamento paralelo massivo necessário para treinar modelos modernos de inteligência artificial (IA) de maneira eficiente.

A biblioteca suporta um vasto ecossistema de ferramentas para visão computacional (CV) e processamento de linguagem natural . Ao fornecer um rico conjunto de camadas pré-construídas, otimizadores e funções de perda, ela simplifica o processo de criação de algoritmos para tarefas como classificação de imagens e modelagem de sequências.

Aplicações no Mundo Real

A versatilidade desta estrutura levou à sua adoção em diversos setores para soluções de IA de alto impacto:

  1. Veículos autónomos: Os líderes do setor utilizam PyTorch criar modelos de aprendizagem profunda que processam imagens de vídeo das câmaras dos carros. Esses modelos realizam a deteção de objetos em tempo real para identificar faixas, sinais e peões, permitindo uma navegação mais segura.
  2. Diagnóstico médico: Os investigadores utilizam a estrutura para desenvolver aplicações avançadas de cuidados de saúde. Por exemplo, ela alimenta sistemas que analisam exames de ressonância magnética ou raios-X para ajudar os médicos a detetar tumores através da segmentação precisa de imagens.

Comparação com ferramentas relacionadas

Para entender melhor o seu papel, é útil distinguir PyTorch outras ferramentas comuns na pilha de IA:

  • Vs. TensorFlow: Desenvolvido pela Google, TensorFlow dependia TensorFlow de gráficos computacionais estáticos, o que tornava a depuração mais difícil, mas otimizava a implementação. Embora ambas as estruturas tenham convergido em termos de funcionalidades, PyTorch frequentemente preferido para prototipagem rápida e investigação devido à sua interface intuitiva.
  • Vs. OpenCV: OpenCV uma biblioteca focada em funções tradicionais de processamento de imagens (como redimensionamento, filtragem e conversão de cores), em vez de treinar redes neurais. Em um fluxo de trabalho típico, os desenvolvedores usam OpenCV o pré-processamento de dados antes de alimentar as imagens em um PyTorch para análise.

Integração com o Ultralytics

Toda a família Ultralytics , incluindo o inovador YOLO26 e o amplamente utilizado YOLO11, é construída nativamente no PyTorch. Essa base garante que os utilizadores se beneficiem da velocidade, estabilidade e amplo suporte da comunidade do framework. Seja realizando aprendizado de transferência em dados de treinamento personalizados ou exportando modelos para dispositivos de ponta, a arquitetura subjacente depende de PyTorch e gradientes PyTorch .

A próxima Ultralytics simplifica ainda mais essa experiência, fornecendo uma interface unificada para gerenciar a obtenção, o treinamento e a implementação de conjuntos de dados sem a necessidade de escrever um código boilerplate extenso.

O exemplo a seguir demonstra como verificar GPU e executar a inferência usando um YOLO , mostrando como a estrutura lida com a aceleração de hardware nos bastidores:

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available for PyTorch acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"PyTorch is using device: {device}")

# Load a YOLO26n model (built on PyTorch)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
# PyTorch handles tensor operations and moves data to the GPU automatically
results = model("https://ultralytics.com/images/bus.jpg", device=device)

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora