Caixa delimitadora
Saiba como as caixas delimitadoras permitem a deteção de objectos, a IA e os sistemas de aprendizagem automática. Explore o seu papel nas aplicações de visão por computador!
Uma caixa delimitadora é uma anotação retangular utilizada na visão por computador para indicar a localização de um objeto numa imagem ou num quadro de vídeo. É um componente fundamental da deteção de objectos, proporcionando uma forma simples mas eficaz de definir a posição e a escala de um objeto. Na aprendizagem automática, os modelos são treinados em grandes conjuntos de dados de imagens com caixas delimitadoras marcadas para aprenderem a identificar e localizar objectos por si próprios. A saída destes modelos inclui as coordenadas da caixa, uma etiqueta de classe (por exemplo, "carro", "pessoa") e uma pontuação de confiança que indica a certeza do modelo na sua previsão.
Como funcionam as caixas delimitadoras
Uma caixa delimitadora é normalmente definida por um conjunto de coordenadas que especificam a sua posição e tamanho. As representações mais comuns são:
- Coordenadas do canto superior esquerdo com largura e altura (x, y, w, h): Este formato especifica as coordenadas x e y do canto superior esquerdo, juntamente com a largura e a altura da caixa.
- Pontos de canto (x_min, y_min, x_max, y_max): Este formato define as coordenadas dos cantos superior esquerdo e inferior direito do retângulo.
Estas coordenadas são utilizadas para treinar modelos de aprendizagem profunda, que aprendem a prever estes valores para imagens novas e não vistas. A precisão de uma caixa delimitadora prevista é frequentemente avaliada usando uma métrica chamada Intersecção sobre União (IoU), que mede a sobreposição entre a caixa prevista e a caixa de verdade. Os modelos modernos de deteção de objectos, como o Ultralytics YOLO11, são altamente optimizados para gerar caixas delimitadoras precisas em tempo real.
Tipos de caixas delimitadoras
Existem dois tipos principais de caixas delimitadoras:
- Caixa delimitadora alinhada com o eixo: Este é o tipo mais comum, em que os lados do retângulo estão alinhados com os eixos horizontal e vertical da imagem. São simples de representar e processar, mas podem ser ineficientes para objectos rodados ou com formas irregulares, uma vez que a caixa pode incluir uma área de fundo significativa.
- Caixa delimitadora orientada (OBB): Este tipo de caixa inclui um parâmetro adicional para a rotação, permitindo-lhe ajustar-se melhor a objectos inclinados. Os OBBs são particularmente úteis em aplicações especializadas como a análise de imagens de satélite ou imagens aéreas de drones, onde os objectos são frequentemente vistos de vários ângulos. Modelos como o YOLO11 suportam a deteção orientada de objectos para lidar com estes cenários de forma mais eficaz.
Aplicações em cenários do mundo real
As caixas delimitadoras são parte integrante de inúmeras aplicações práticas de IA:
- Veículos autónomos: Os veículos autónomos dependem fortemente da deteção de objectos para identificar e localizar peões, outros veículos e semáforos utilizando caixas delimitadoras. Esta consciência espacial, frequentemente conseguida através de modelos de aprendizagem profunda, é fundamental para uma navegação segura. Empresas como a Waymo apresentam esta tecnologia de forma extensiva. A Ultralytics oferece informações sobre a IA nos automóveis autónomos.
- Análise de retalho: No retalho, as caixas delimitadoras ajudam na gestão de inventário orientada por IA, detectando produtos nas prateleiras, monitorizando os níveis de stock e analisando o comportamento dos clientes através de padrões de tráfego pedonal(contagem de objectos).
- Segurança e vigilância: As caixas delimitadoras permitem que os sistemas de monitorização automatizados detectem e rastreiem indivíduos ou objectos em tempo real, accionando alertas para actividades suspeitas. Isto é fundamental para a construção de aplicações como sistemas de alarme de segurança.
- Análise de imagens médicas: No sector dos cuidados de saúde, as caixas delimitadoras ajudam os médicos ao realçarem potenciais anomalias, como tumores em exames, ajudando a um diagnóstico mais rápido. Pode ver exemplos disto em Radiologia: Investigação sobre Inteligência Artificial e na nossa página de análise de imagens médicas.
- Agricultura: As caixas delimitadoras são utilizadas na agricultura de precisão para tarefas como a identificação de frutos para colheita, a monitorização da saúde das culturas ou a deteção de pragas, conforme descrito no nosso blogue sobre visão computacional na agricultura.