Descubra como a segmentação de instâncias refina a deteção de objectos com precisão ao nível do pixel, permitindo máscaras de objectos detalhadas para aplicações de IA.
A segmentação de instâncias é uma tarefa avançada de visão por computador (CV) que identifica e delineia objectos individuais numa imagem ao nível do pixel. Ao contrário de outras tarefas de visão, não se limita a classificar uma imagem ou a desenhar uma caixa delimitadora à volta dos objectos; em vez disso, gera uma máscara precisa ao nível do pixel para cada instância de objeto distinta. Esta técnica proporciona uma compreensão muito mais profunda de uma cena, uma vez que pode diferenciar entre objectos sobrepostos da mesma classe.
É importante distinguir a segmentação de instâncias de outras tarefas relacionadas com a visão computacional.
Os modelos de segmentação de instâncias executam normalmente duas funções principais: primeiro, detectam todas as instâncias de objectos numa imagem e, segundo, geram uma máscara de segmentação para cada instância detectada. Este processo foi popularizado por arquitecturas como a Mask R-CNN, que estende os detectores de objectos como a Faster R-CNN, adicionando um ramo paralelo que prevê uma máscara binária para cada região de interesse. Os modelos modernos refinaram ainda mais este processo para melhorar a velocidade e a precisão, permitindo a inferência em tempo real em muitas aplicações. O desenvolvimento baseia-se frequentemente em poderosas estruturas de aprendizagem profunda, como o PyTorch e o TensorFlow.
Os contornos detalhados dos objectos fornecidos pela segmentação de instâncias são valiosos em vários campos.
A Ultralytics fornece modelos topo de gama capazes de efetuar uma segmentação eficiente de instâncias. Modelos como o YOLOv8 e o mais recente YOLO11 foram concebidos para proporcionar um elevado desempenho em várias tarefas de visão, incluindo a segmentação de instâncias. Pode encontrar mais detalhes na nossa documentação para a tarefa de segmentação. Os utilizadores podem tirar partido de modelos pré-treinados ou efetuar um ajuste fino em conjuntos de dados personalizados, como o COCO, utilizando ferramentas como a plataforma Ultralytics HUB, que simplifica o fluxo de trabalho de aprendizagem automática (ML), desde a gestão de dados até à implementação do modelo. Para uma implementação prática, estão disponíveis recursos como o nosso tutorial sobre segmentação com modelos pré-treinados do Ultralytics YOLOv8 ou o nosso guia sobre o isolamento de objectos de segmentação. Também pode aprender a utilizar o Ultralytics YOLO11 para segmentação de instâncias.