Aprende como a convolução potencia a IA na visão por computador, permitindo tarefas como a deteção de objectos, o reconhecimento de imagens e a imagiologia médica com precisão.
A convolução é uma operação matemática fundamental amplamente utilizada na inteligência artificial, nomeadamente no domínio da visão computacional (CV). Constitui o elemento central das redes neurais convolucionais (CNN), permitindo que estas redes aprendam eficazmente padrões hierárquicos a partir de dados em grelha, como as imagens. O processo envolve a aplicação de um pequeno filtro, frequentemente designado por kernel, a um sinal ou imagem de entrada para produzir um resultado conhecido como mapa de caraterísticas. Estes mapas de caraterísticas realçam padrões específicos como arestas, texturas ou formas detectadas pelo kernel.
Imagina que deslizas uma pequena lupa (o núcleo) sobre uma imagem maior (a entrada). Em cada posição, a lupa foca uma pequena parte da imagem. A operação de convolução calcula uma soma ponderada dos valores de pixel dentro dessa área, utilizando os pesos definidos pelo núcleo. Este valor calculado único torna-se um pixel no mapa de caraterísticas de saída. O núcleo desliza sistematicamente por toda a imagem de entrada, passo a passo (definido por um parâmetro chamado 'stride'), criando um mapa de caraterísticas completo. Os diferentes kernels são concebidos para detetar caraterísticas diferentes; por exemplo, um kernel pode detetar arestas horizontais, enquanto outro detecta cantos. Ao utilizar vários kernels numa única camada, uma CNN pode extrair um conjunto rico de caraterísticas da entrada. Podes explorar explicações visuais deste processo em recursos como as notas do curso Stanford CS231n sobre CNNs.
As camadas convolucionais são essenciais em muitas aplicações modernas de IA:
Na deteção de objectos, as CNNs utilizam convoluções para identificar objectos e a sua localização numa imagem utilizando caixas delimitadoras. Modelos como Ultralytics YOLO dependem fortemente de camadas convolucionais para extrair caraterísticas em diferentes escalas, permitindo a deteção de vários objectos de forma eficiente. Isto é fundamental para aplicações como veículos autónomos, onde a deteção de peões, carros e sinais de trânsito em tempo real é vital para a segurança. Saiba mais sobre as soluções de IA no setor automotivo.
A convolução é fundamental na análise de imagens médicas, ajudando os radiologistas a analisar exames como raios X, TAC e ressonâncias magnéticas. Os modelos de IA que utilizam CNNs podem detetar anomalias subtis, como tumores ou fracturas, muitas vezes mais rapidamente e, por vezes, com maior precisão do que os especialistas humanos. Por exemplo, a utilização do YOLOv11 para a deteção de tumores demonstra esta capacidade. Explora mais sobre as soluções de IA nos cuidados de saúde.
A convolução é frequentemente utilizada juntamente com outras operações e conceitos nas redes neuronais:
Compreender a convolução é fundamental para perceber como muitos modelos de IA de última geração, incluindo os disponíveis no Ultralytics HUB, interpretam a informação visual. Frameworks como PyTorch e TensorFlow fornecem implementações eficientes de operações de convolução. Bibliotecas como a OpenCV também utilizam a convolução para tarefas tradicionais de processamento de imagem, como a desfocagem e a nitidez.