Glossário

Segmentação de imagens

Descobre o poder da segmentação de imagens com Ultralytics YOLO . Explora a precisão ao nível do pixel, os tipos, as aplicações e os casos de utilização de IA do mundo real.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A segmentação de imagens é uma técnica fundamental da visão computacional que divide uma imagem digital em vários segmentos ou regiões, muitas vezes com base nas caraterísticas dos pixéis. O objetivo é simplificar ou alterar a representação de uma imagem para algo mais significativo e mais fácil de analisar. Em vez de apenas identificar objectos com caixas delimitadoras, como na deteção de objectos, a segmentação de imagens atribui uma etiqueta de classe específica a cada pixel, proporcionando uma compreensão muito mais granular do conteúdo da imagem. Esta compreensão ao nível do pixel é crucial para tarefas que requerem detalhes espaciais precisos.

Como funciona a segmentação de imagens

Os algoritmos de segmentação de imagens analisam uma imagem píxel a píxel, agrupando píxeis que partilham determinadas propriedades (como cor, intensidade ou textura) em segmentos. As abordagens modernas utilizam frequentemente a aprendizagem profunda, em particular as Redes Neuronais Convolucionais (CNN), que aprendem a identificar padrões complexos e a atribuir etiquetas adequadas a cada pixel. O resultado é normalmente uma máscara de segmentação, que é uma imagem em que o valor de cada pixel corresponde à classe a que pertence. Esta máscara destaca a forma e a localização exactas dos diferentes objectos ou regiões da imagem. Existem várias técnicas de segmentação de imagens, desde métodos tradicionais como a limiarização e o agrupamento até modelos avançados de aprendizagem profunda.

Tipos de segmentação de imagens

A segmentação de imagens pode ser classificada em termos gerais com base no nível de detalhe e distinção necessário:

  • Segmentação semântica: Atribui cada pixel da imagem a uma categoria predefinida (por exemplo, "carro", "estrada", "céu", "edifício"). Não distingue entre diferentes instâncias da mesma classe de objectos. Por exemplo, a todos os carros de uma imagem seria atribuída a mesma etiqueta e cor 'carro' na máscara de segmentação.
  • Segmentação de instâncias: Vai um passo além da segmentação semântica. Identifica cada instância de objeto individual dentro de uma imagem e atribui uma etiqueta ou máscara única a cada uma, mesmo que pertençam à mesma classe. Por exemplo, cada carro distinto numa imagem receberia o seu próprio identificador e máscara únicos.
  • Segmentação panóptica: Combina segmentação semântica e de instância. Atribui uma etiqueta de classe a cada pixel (como a semântica) e identifica de forma única cada instância de objeto (como a instância). Isto proporciona uma compreensão abrangente e unificada da cena.

Aplicações da segmentação de imagens

A análise detalhada ao nível dos píxeis fornecida pela segmentação de imagens permite uma vasta gama de aplicações em várias indústrias:

  • Análise de imagens médicas: A segmentação é vital para a análise de exames médicos como TC ou MRI. Ajuda a identificar e a delinear órgãos, tecidos ou anomalias, como tumores, com elevada precisão, auxiliando no diagnóstico e no planeamento do tratamento. Por exemplo, os modelosYOLO Ultralytics podem ser utilizados para a deteção de tumores, segmentando com precisão a região do tumor do tecido saudável circundante, fornecendo informações críticas sobre o seu tamanho e forma. As técnicas comuns de imagiologia médica beneficiam significativamente da segmentação.
  • Veículos autónomos: Os carros autónomos dependem muito da segmentação de imagens para compreenderem o que os rodeia. Ao segmentar a estrada, as marcações da faixa de rodagem, os peões, os outros veículos e os obstáculos ao nível do pixel, o automóvel pode navegar em segurança e tomar decisões de condução informadas. Compreender os limites exactos das áreas de condução e das áreas não conduzíveis é fundamental para alcançar níveis mais elevados de automatização da condução.
  • Imagens de satélite: Utilizadas na análise de imagens de satélite para cartografia da ocupação do solo, monitorização da desflorestação, planeamento urbano e avaliação de catástrofes.
  • Agricultura: Permite técnicas de agricultura de precisão, como a identificação de áreas de cultivo, a deteção de ervas daninhas ou a avaliação do estado das plantas com base em regiões segmentadas. Isto suporta aplicações de IA na agricultura.
  • Retalho: Analisar a disposição das prateleiras, monitorizar os níveis de stock ou compreender o comportamento dos clientes através de dados visuais segmentados.

Segmentação de imagens e Ultralytics YOLO

Ultralytics YOLO da Ultralytics oferecem capacidades de ponta para várias tarefas de visão por computador, incluindo a segmentação de imagens. Modelos como o YOLOv8 foram concebidos para efetuar a segmentação de instâncias de forma eficiente e precisa, tornando-os adequados para aplicações em tempo real. Podes saber mais sobre as capacidades específicas das tarefas de segmentação na documentação Ultralytics . O treinamento de modelos de segmentação personalizados em conjuntos de dados como o popular conjunto de dados COCO ou seus próprios dados é simplificado usando ferramentas como o Ultralytics HUB, que simplifica o processo de treinamento, implantação e gerenciamento de modelos. Para obter orientação sobre implementação, consulte recursos como o tutorial sobre segmentação com modelos pré-treinados Ultralytics YOLOv8 em Python.

Lê tudo