Glossário

Caixa delimitadora

Aprende como as caixas delimitadoras permitem a deteção de objectos, a IA e os sistemas de aprendizagem automática. Explora o seu papel nas aplicações de visão por computador!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Uma caixa delimitadora é uma moldura retangular utilizada na visão por computador (CV) para indicar a localização e a extensão de um objeto numa imagem ou num quadro de vídeo. Estas caixas são normalmente definidas pelas coordenadas dos seus cantos superior esquerdo e inferior direito, proporcionando uma forma simples mas eficaz de especificar onde se encontra um objeto e o espaço que ocupa. As caixas delimitadoras são componentes fundamentais em várias tarefas de CV, incluindo a deteção de objectos, o seguimento de objectos e a anotação de imagens, constituindo uma pedra angular de muitos sistemas modernos de Inteligência Artificial (IA) e de aprendizagem automática (ML).

Importância na deteção de objectos

As caixas delimitadoras são essenciais para treinar e avaliar modelos de deteção de objectos. Em tarefas abordadas por modelos como o Ultralytics YOLOdo Ultralytics, as caixas delimitadoras servem como verdade terrestre durante o treino, ensinando o modelo a localizar objectos com precisão. Durante a inferência, o modelo prevê caixas delimitadoras em torno dos objectos detectados. Esta capacidade de localização é crucial para aplicações que requerem não só a identificação de objectos, mas também a sua posição exacta, como em veículos autónomos ou sistemas robóticos. O processo começa frequentemente com uma anotação cuidadosa dos dados, em que os humanos ou as ferramentas automatizadas desenham caixas delimitadoras à volta dos objectos nas imagens de treino, utilizando frequentemente ferramentas como o CVAT.

Conceitos-chave relacionados com as caixas delimitadoras

Várias métricas e técnicas estão intimamente associadas à utilização e avaliação de caixas delimitadoras em modelos de ML:

  • Intersecção sobre União (IoU): Uma métrica utilizada para medir a sobreposição entre a caixa delimitadora prevista e a caixa delimitadora da verdade terrestre.
  • Supressão não máxima (NMS): Uma técnica utilizada para eliminar caixas delimitadoras redundantes que detectam o mesmo objeto, mantendo apenas a que tem a pontuação de confiança mais elevada.
  • Precisão média média (mAP): Uma métrica comum para avaliar o desempenho de modelos de deteção de objectos, que se baseia fortemente em cálculos de IoU.
  • Caixas de ancoragem: Caixas predefinidas de vários tamanhos e proporções utilizadas por alguns detectores para ajudar a prever as caixas delimitadoras de forma mais eficaz. Conjuntos de dados de referência como o COCO são frequentemente utilizados para avaliar modelos baseados nestes conceitos.

Caixas delimitadoras vs. termos relacionados

Enquanto as caixas delimitadoras localizam objectos com rectângulos, outras técnicas de visão por computador oferecem diferentes níveis de detalhe:

  • Segmentação de imagens: Ao contrário das caixas delimitadoras que fornecem uma localização retangular, segmentação de imagens tem como objetivo classificar cada pixel de uma imagem.
  • Caixas delimitadoras orientadas (OBB): As caixas delimitadoras padrão são alinhadas ao eixo. Para objectos que são rodados, as caixas delimitadoras orientadas (OBB) proporcionam um ajuste mais apertado rodando a caixa juntamente com o objeto. Isto é particularmente útil em aplicações como a análise de imagens aéreas ou a deteção de objectos em cenas desordenadas, frequentemente avaliadas em conjuntos de dados como o DOTA.

Aplicações em cenários do mundo real

As caixas delimitadoras são parte integrante de inúmeras aplicações práticas de IA:

Veículos autónomos

No desenvolvimento de IA em carros autónomos, as caixas delimitadoras são essenciais para detetar e seguir peões, ciclistas, outros veículos e obstáculos na estrada. A deteção precisa e em tempo real de objectos utilizando caixas delimitadoras permite que o sistema do veículo tome decisões informadas para uma navegação segura e para evitar colisões, cumprindo as diretrizes de segurança definidas por organizações como a National Highway Traffic Safety Administration (NHTSA). Explora mais sobre o papel da IA nos automóveis autónomos.

Gestão de inventário de retalho

Os retalhistas utilizam a deteção de objectos com caixas delimitadoras para monitorizar automaticamente as prateleiras e gerir o inventário. As câmaras equipadas com modelos de IA podem detetar produtos, contar os níveis de stock, identificar artigos mal colocados e acompanhar as interações dos clientes com a mercadoria. Isto melhora a eficiência, reduz o esforço manual e fornece dados valiosos para otimizar a disposição das lojas e a reposição de stocks. Os conhecimentos sobre estas tendências tecnológicas de retalho realçam a importância crescente da IA no sector. Podes encontrar várias soluçõesUltralytics para diferentes indústrias.

Lê tudo