Glossário

Cabeçalho de Detecção

Saiba como um cabeçote de detecção permite a detecção de objetos em tempo real. Explore o seu papel no Ultralytics para prever caixas delimitadoras e rótulos com alta precisão.

Um cabeçote de detecção atua como a camada final de tomada de decisão em uma arquitetura de rede neural de detecção de objetos. Enquanto as camadas anteriores do modelo são responsáveis por compreender as formas, texturas e características dentro de uma imagem, o cabeçote de detecção é o componente específico que interpreta essas informações para prever exatamente quais objetos estão presentes e onde estão localizados. Ele transforma os dados abstratos e de alto nível produzidos pelo extrator de características em resultados acionáveis, normalmente produzindo um conjunto de caixas delimitadoras que envolvem os objetos identificados, juntamente com os seus rótulos de classe correspondentes e pontuações de confiança.

Distinguindo a cabeça da coluna vertebral e do pescoço

Para compreender totalmente a função de um cabeçote de detecção, é útil visualizar os detectores modernos como sendo compostos por três estágios principais, cada um servindo a um propósito distinto no fluxo de visão computacional (CV):

Backbone: Esta é a parte inicial da rede, geralmente uma Rede Neural Convolucional (CNN) como ResNet ou CSPNet. Ela processa a imagem bruta de entrada para criar mapas de características que representam padrões visuais.
Pescoço: Situado entre a coluna vertebral e a cabeça, o pescoço refina e combina características de diferentes escalas. Arquiteturas como a Feature Pyramid Network (FPN) garantem que o modelo possa detect de tamanhos variados, agregando contexto.
Cabeça: O componente final que consome as características refinadas do pescoço. Ela executa a tarefa real de classificação (o que é?) e regressão (onde está?).

Evolução: Baseada em âncora vs. Sem âncora

O design dos cabeçotes de detecção evoluiu significativamente para melhorar a velocidade e a precisão, particularmente com a transição dos métodos tradicionais para os modernos modelos de inferência em tempo real.

Cabeças baseadas em âncoras: Os detectores de objetos tradicionais de um estágio dependiam de caixas de âncorapredefinidas — formas de referência fixas de vários tamanhos. A cabeça previa o quanto esticar ou deslocar essas âncoras para se ajustar ao objeto. Essa abordagem é detalhada na pesquisa fundamental sobre Faster R-CNN.
Cabeças sem âncora: Modelos de última geração, incluindo o mais recente YOLO26, utilizam detectores sem âncora. Essas cabeças prevêem os centros e as dimensões dos objetos diretamente a partir dos pixels nos mapas de recursos, eliminando a necessidade de ajuste manual da âncora . Isso simplifica a arquitetura e aprimora a capacidade do modelo de generalizar para novas formas de objetos, uma técnica frequentemente associada ao Detecção de Objetos em Uma Etapa Totalmente Convolucional (FCOS).

Aplicações no Mundo Real

A precisão do cabeçote de detecção é fundamental para a implantação da inteligência artificial (IA) em ambientes industriais e críticos para a segurança. Os utilizadores podem facilmente anotar dados e treinar esses cabeçotes especializados usando a Ultralytics .

Condução autónoma: Na IA para automóveis, o cabeçote de detecção é responsável por distinguir entre pedestres, semáforos e outros veículos em tempo real. Um cabeçote altamente otimizado garante que a latência de inferência permaneça baixa o suficiente para que o veículo reaja instantaneamente.
Diagnósticos médicos: Na análise de imagens médicas, os sensores de detecção são ajustados com precisão para localizar anomalias, como tumores em exames de ressonância magnética. O ramo de regressão deve ser extremamente preciso para delinear os limites exatos de uma lesão, auxiliando os médicos em soluções de saúde.

Exemplo de código

O exemplo a seguir demonstra como carregar um YOLO26 modelo e inspecionar a saída da sua cabeça de deteção. Quando a inferência é executada, a cabeça processa a imagem e retorna o resultado final. boxes contendo coordenadas e IDs de classe.

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")

# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
    # Print the bounding box coordinates and the predicted class
    print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")

Essa interação destaca como o cabeçote de detecção traduz ativações complexas da rede neural em dados legíveis que os desenvolvedores podem usar para tarefas posteriores, como rastreamento ou contagem de objetos.

Cabeçalho de Detecção

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Distinguindo a cabeça da coluna vertebral e do pescoço

Evolução: Baseada em âncora vs. Sem âncora

Aplicações no Mundo Real

Exemplo de código

Leia mais nesta categoria

12 casos de uso de imagens aéreas com tecnologia de visão computacional

O que é a estimativa de profundidade monocular? Uma visão geral

Uma análise sobre o usoYOLO Ultralytics para deteção de ameaças por IA

Junte-se à comunidade Ultralytics