Glossário

Deteção de objectos

Descobre o poder da deteção de objectos - identifica e localiza objectos em imagens ou vídeos com modelos de ponta como YOLO. Explora aplicações do mundo real!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A deteção de objectos é uma tarefa fundamental na visão computacional (CV) que envolve a identificação da presença, localização e tipo de um ou mais objectos numa imagem ou vídeo. Ao contrário da classificação de imagens, que atribui uma única etiqueta a uma imagem inteira, a deteção de objectos delineia com precisão cada instância de objeto utilizando uma caixa delimitadora e atribui-lhe uma etiqueta de classe. Esta capacidade permite que as máquinas compreendam as cenas visuais com maior granularidade, espelhando mais de perto a perceção visual humana.

Como funciona a deteção de objectos

A deteção de objectos combina normalmente duas tarefas principais: classificação de objectos (determinar "que" objeto está presente) e localização de objectos (determinar "onde" o objeto está localizado). Os sistemas modernos de deteção de objectos dependem fortemente da aprendizagem profunda (DL), em particular das Redes Neuronais Convolucionais (CNN). Estas redes são treinadas em grandes conjuntos de dados, como o popular conjunto de dados COCO, para aprender caraterísticas e padrões associados a diferentes classes de objectos. O modelo processa uma imagem de entrada e produz uma lista de caixas delimitadoras, cada uma com uma etiqueta de classe associada (por exemplo, "carro", "pessoa") e uma pontuação de confiança. O desempenho destes modelos é frequentemente medido utilizando métricas como a intersecção sobre a união (IoU) e a precisão média (mAP).

Deteção de Objectos vs. Tarefas Relacionadas

É importante distinguir a deteção de objectos de outras tarefas relacionadas com a visão computacional:

  • Classificação de imagens: Atribui uma única etiqueta a uma imagem inteira (por exemplo, "Esta imagem contém um gato"). Não fornece informações de localização para o(s) objeto(s).
  • Segmentação de imagens: Classifica cada pixel de uma imagem. A segmentação semântica atribui uma etiqueta de classe a cada pixel (por exemplo, todos os pixéis pertencentes a carros são etiquetados como 'carro'), enquanto a segmentação de instância distingue entre diferentes instâncias da mesma classe (por exemplo, etiquetar 'carro 1', 'carro 2'). A segmentação fornece informações espaciais mais detalhadas do que as caixas delimitadoras da deteção de objectos.

Tipos de modelos de deteção de objectos

Os modelos de deteção de objectos dividem-se geralmente em duas categorias:

  • Detectores de duas fases: Estes modelos propõem primeiro regiões de interesse (RoIs) onde os objectos podem estar localizados e depois classificam os objectos dentro dessas regiões. Exemplos incluem a família R-CNN(Region-based CNN). Atingem frequentemente uma elevada precisão, mas podem ser mais lentos.
  • Detectores de uma fase: Estes modelos realizam a localização e a classificação numa única passagem diretamente na grelha da imagem. Os exemplos incluem Ultralytics YOLO modelos como o YOLOv8 e YOLOv11. São normalmente mais rápidos, o que os torna adequados para inferência em tempo real. As abordagens mais recentes, como os detectores sem âncoras, simplificam ainda mais o processo de deteção. Podes explorar comparações entre diferentes modelos YOLO para compreender as suas vantagens e desvantagens.

Aplicações no mundo real

A deteção de objectos é crucial para inúmeras aplicações em várias indústrias:

  • Sistemas autónomos: Capacitar os veículos para que a IA em carros autónomos detecte peões, outros veículos, sinais de trânsito e obstáculos para uma navegação segura. A tecnologia da Waymo baseia-se fortemente na deteção sofisticada de objectos.
  • Vigilância e segurança: Monitorização de áreas para detetar acessos não autorizados, detetar actividades suspeitas ou implementar sistemas de alarme de segurança automatizados.
  • Análise de retalho: Seguimento de produtos nas prateleiras para gestão de inventário orientada por IA, análise do tráfego de clientes e melhoria dos processos de checkout.
  • Cuidados de saúde: Ajuda na análise de imagens médicas, identificando tumores, lesões ou outras anomalias em exames como raios X ou ressonâncias magnéticas. Investigação publicada em revistas como Radiology: Artificial Intelligence, apresenta frequentemente este tipo de aplicações.
  • Agricultura: Monitoriza a saúde das culturas, detecta pragas e automatiza os processos de colheita utilizando soluções de IA na agricultura.

Ferramentas e formação

O desenvolvimento de modelos de deteção de objectos implica a utilização de ferramentas e plataformas especializadas. Frameworks como PyTorch e TensorFlow fornecem os blocos de construção. Bibliotecas como a OpenCV oferecem funções essenciais de visão computacional. Ultralytics fornece-te o estado da arte Ultralytics YOLO e a plataforma Ultralytics HUB, simplificando o processo de treinamento de modelos personalizados, gerenciando conjuntos de dados e implantando soluções de forma eficiente. O treinamento eficaz de modelos geralmente requer um ajuste cuidadoso dos hiperparâmetros e estratégias de aumento de dados.

Lê tudo