Glossário

Convolução

Aprende como a convolução potencia a IA na visão por computador, permitindo tarefas como a deteção de objectos, o reconhecimento de imagens e a imagiologia médica com precisão.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A convolução é uma operação fundamental em muitas aplicações de visão computacional e é um elemento-chave das redes neurais convolucionais (CNN). Envolve a aplicação de um filtro, também conhecido como kernel, a uma entrada, como uma imagem, para extrair caraterísticas específicas. Este processo cria um mapa de caraterísticas que realça a presença dessas caraterísticas na entrada original. A convolução ajuda os modelos a identificar padrões como arestas, texturas e formas, que são essenciais para tarefas como a deteção de objectos, o reconhecimento de imagens e a análise de imagens médicas.

Como funciona a convolução

O processo de convolução envolve o deslizamento de um filtro sobre os dados de entrada. Em cada posição, o filtro efectua uma multiplicação por elementos com a secção correspondente da entrada. Os resultados destas multiplicações são depois somados para produzir um único valor no mapa de caraterísticas de saída. Ao repetir este processo em toda a entrada, é criada uma nova representação que enfatiza caraterísticas específicas com base na conceção do filtro. Por exemplo, um filtro concebido para detetar arestas verticais produzirá um mapa de caraterísticas em que as arestas verticais são realçadas. Os filtros podem ser concebidos para detetar uma variedade de caraterísticas, desde simples arestas a padrões complexos.

Componentes principais da convolução

Vários componentes-chave definem a operação de convolução:

  • Filtro (Kernel): Uma pequena matriz utilizada para extrair caraterísticas dos dados de entrada. Cada filtro é concebido para detetar um tipo específico de caraterística.
  • Mapa de caraterísticas: A saída da operação de convolução, destacando a presença de caraterísticas detectadas pelo filtro. Os mapas de caraterísticas são essenciais para as tarefas a jusante da rede neural.
  • Avança: O número de pixéis que o filtro move em cada passo. Um passo maior resulta num mapa de caraterísticas mais pequeno.
  • Preenchimento: Adiciona pixels extra à volta da entrada para controlar o tamanho do mapa de caraterísticas. O preenchimento garante que o filtro pode ser aplicado às extremidades da entrada sem reduzir o tamanho da saída.

Aplicações da convolução

A convolução é amplamente utilizada em várias aplicações de IA e de aprendizagem automática, especialmente na visão computacional. Eis dois exemplos notáveis:

1. Deteção de objectos

Na deteção de objectos, a convolução ajuda a identificar e localizar objectos numa imagem. Modelos como Ultralytics YOLO utilizam camadas convolucionais para extrair caraterísticas hierárquicas das imagens. Estas caraterísticas são depois utilizadas para detetar vários objectos e determinar as suas localizações utilizando caixas delimitadoras. Por exemplo, em carros autónomos, a convolução permite a deteção de peões, sinais de trânsito e outros veículos, o que é crucial para uma navegação segura. Podes saber mais sobre o papel da IA de visão na tecnologia de condução autónoma.

2. Imagiologia médica

A convolução desempenha um papel fundamental na análise de imagens médicas, como os raios X e as ressonâncias magnéticas. Ao aplicar camadas convolucionais, os modelos de IA podem detetar anomalias como tumores ou fracturas com elevada precisão. Estas técnicas são utilizadas na análise de imagens médicas para ajudar os radiologistas a diagnosticar doenças com maior rapidez e precisão.

Convolução versus conceitos relacionados

A convolução é frequentemente discutida juntamente com conceitos relacionados, como o agrupamento e a extração de caraterísticas. Enquanto a convolução extrai caraterísticas através da aplicação de filtros, o agrupamento reduz a dimensionalidade dos mapas de caraterísticas através da redução da amostragem, normalmente tomando o valor máximo ou médio numa região. A extração de caraterísticas é um termo mais amplo que engloba a convolução e o agrupamento, juntamente com outras técnicas para obter informações significativas a partir de dados brutos.

Benefícios no mundo real

A convolução tornou-se indispensável nas aplicações modernas de IA devido à sua eficiência e flexibilidade. Plataformas como o Ultralytics HUB permitem aos utilizadores treinar e implementar modelos que aproveitam a convolução para tarefas como o reconhecimento de objectos em tempo real e a vigilância por vídeo. Além disso, optimizações como a utilização de GPUs permitem um processamento mais rápido e escalabilidade para grandes conjuntos de dados, tornando a convolução prática para aplicações do mundo real.

Lê tudo