Segmentação de imagens
Descubra o poder da segmentação de imagens com o Ultralytics YOLO. Explore a precisão ao nível do pixel, os tipos, as aplicações e os casos de utilização de IA no mundo real.
A segmentação de imagens é uma tarefa fundamental da visão computacional (CV) que envolve a partição de uma imagem digital em várias regiões ou segmentos distintos. O objetivo é atribuir uma etiqueta específica a cada pixel de uma imagem, criando efetivamente um mapa dos objectos e do fundo ao nível do pixel. Ao contrário de outras tarefas de CV que podem identificar a localização de um objeto com uma simples caixa, a segmentação de imagens proporciona uma compreensão muito mais detalhada, delineando a forma precisa de cada objeto. Este pormenor granular é crucial para aplicações que requerem uma compreensão profunda da geometria e composição da cena. O processo é fundamental para muitas aplicações avançadas de IA.
Tipos de segmentação de imagens
A segmentação de imagens pode ser classificada em três tipos principais, cada um oferecendo um nível diferente de detalhe e servindo objectivos distintos:
- Segmentação semântica: Esta técnica classifica cada pixel de uma imagem numa categoria predefinida, como "carro", "estrada" ou "céu". Todas as instâncias da mesma classe de objeto são agrupadas sob uma única etiqueta. Por exemplo, numa imagem com vários carros, a segmentação semântica rotularia todos os pixels pertencentes a qualquer carro como simplesmente "carro", sem distinguir um carro de outro.
- Segmentação de instâncias: Este método leva a segmentação um passo adiante, não só classificando cada pixel, mas também diferenciando entre instâncias individuais da mesma classe. Na mesma cena de rua, a segmentação de instâncias identificaria cada carro como um objeto único, atribuindo uma máscara separada ao "carro 1", "carro 2" e assim por diante. Isto é particularmente útil quando é necessário contar ou seguir objectos individuais.
- Segmentação panóptica: Como uma abordagem híbrida, a segmentação panóptica combina os pontos fortes da segmentação semântica e da segmentação de instância. O seu objetivo é criar uma compreensão completa e unificada de uma cena, atribuindo uma etiqueta de classe a cada pixel (como a segmentação semântica), ao mesmo tempo que identifica de forma única cada instância de objeto (como a segmentação de instâncias). Isto proporciona a análise de cena mais abrangente disponível.
Como é que a segmentação de imagens difere de outras tarefas de CV
É importante distinguir a segmentação de imagens de outras tarefas comuns de visão computacional:
- Classificação de imagens: Concentra-se na atribuição de um único rótulo a uma imagem inteira (por exemplo, "esta é uma fotografia de uma praia"). Compreende o que está na imagem, mas não onde.
- Deteção de objectos: Identifica e localiza objectos dentro de uma imagem, normalmente desenhando uma caixa delimitadora à sua volta. Indica que objectos estão presentes e a sua localização aproximada, mas não a sua forma exacta.
- Segmentação de imagens: Fornece o máximo de detalhe ao delinear o limite exato de cada objeto ao nível do pixel, oferecendo uma compreensão precisa da forma e localização do objeto.
Aplicações e casos de utilização
O resultado detalhado da segmentação de imagens torna-a inestimável em vários domínios.
- Veículos autónomos: Para que os veículos autónomos possam navegar em segurança, necessitam de uma compreensão precisa do seu ambiente. Os modelos de segmentação identificam os limites exactos da estrada, faixas de rodagem, peões, outros veículos e obstáculos, permitindo um melhor planeamento do caminho e tomada de decisões. Pode ler mais sobre o papel da IA na indústria automóvel.
- Análise de imagens médicas: Nos cuidados de saúde, a segmentação é utilizada para analisar exames médicos como a ressonância magnética ou a tomografia computorizada. Pode delinear com precisão tumores, órgãos ou anomalias, ajudando os médicos com um diagnóstico preciso, planeamento cirúrgico e monitorização da progressão da doença. Esta tem sido uma aplicação chave para arquitecturas como a U-Net, que se destaca em contextos biomédicos.
- Análise de imagens de satélite: Os modelos de segmentação processam imagens de satélite para monitorizar alterações ambientais, como a desflorestação ou a urbanização. Podem classificar a cobertura do solo (por exemplo, floresta, água, áreas urbanas) e detetar objectos individuais como edifícios ou navios para cartografia e recolha de informações.
- Fabrico e robótica: Nas fábricas automatizadas, a segmentação ajuda os robôs a identificar peças específicas numa correia transportadora para montagem ou a efetuar o controlo de qualidade através da deteção de defeitos com elevada precisão. Pode saber mais sobre a sua utilização na segmentação de fendas.