Descobre o poder da deteção de objectos - identifica e localiza objectos em imagens ou vídeos com modelos de ponta como YOLO. Explora aplicações do mundo real!
A deteção de objectos é uma tarefa fundamental na visão computacional (CV) que envolve a identificação da presença, localização e tipo de um ou mais objectos numa imagem ou vídeo. Ao contrário da classificação de imagens, que atribui uma única etiqueta a uma imagem inteira, a deteção de objectos delineia com precisão cada instância de objeto utilizando uma caixa delimitadora e atribui-lhe uma etiqueta de classe. Esta capacidade permite que as máquinas compreendam as cenas visuais com maior granularidade, espelhando mais de perto a perceção visual humana.
A deteção de objectos combina normalmente duas tarefas principais: classificação de objectos (determinar "que" objeto está presente) e localização de objectos (determinar "onde" o objeto está localizado). Os sistemas modernos de deteção de objectos dependem fortemente da aprendizagem profunda (DL), em particular das Redes Neuronais Convolucionais (CNN). Estas redes são treinadas em grandes conjuntos de dados, como o popular conjunto de dados COCO, para aprender caraterísticas e padrões associados a diferentes classes de objectos. O modelo processa uma imagem de entrada e produz uma lista de caixas delimitadoras, cada uma com uma etiqueta de classe associada (por exemplo, "carro", "pessoa") e uma pontuação de confiança. O desempenho destes modelos é frequentemente medido utilizando métricas como a intersecção sobre a união (IoU) e a precisão média (mAP).
É importante distinguir a deteção de objectos de outras tarefas relacionadas com a visão computacional:
Os modelos de deteção de objectos dividem-se geralmente em duas categorias:
A deteção de objectos é crucial para inúmeras aplicações em várias indústrias:
O desenvolvimento de modelos de deteção de objectos implica a utilização de ferramentas e plataformas especializadas. Frameworks como PyTorch e TensorFlow fornecem os blocos de construção. Bibliotecas como a OpenCV oferecem funções essenciais de visão computacional. Ultralytics fornece-te o estado da arte Ultralytics YOLO e a plataforma Ultralytics HUB, simplificando o processo de treinamento de modelos personalizados, gerenciando conjuntos de dados e implantando soluções de forma eficiente. O treinamento eficaz de modelos geralmente requer um ajuste cuidadoso dos hiperparâmetros e estratégias de aumento de dados.