Glossário

Rede Neural Convolucional (CNN)

Descobre como as Redes Neuronais Convolucionais (CNNs) revolucionam a visão computacional, potenciando a IA nos cuidados de saúde, carros autónomos e muito mais.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Uma rede neural convolucional (CNN) é um tipo especializado de rede neural (NN) concebido principalmente para o processamento de dados em grelha, como imagens e vídeos. Ao contrário das redes neurais tradicionais, as CNNs utilizam o princípio da convolução para aprender automaticamente hierarquias espaciais de caraterísticas a partir dos dados de entrada. Isto torna-as excecionalmente eficazes para tarefas no âmbito da visão computacional (CV), conduzindo a avanços significativos na forma como as máquinas interpretam a informação visual e alimentando muitas aplicações modernas de Inteligência Artificial (IA).

Componentes principais e funcionalidade

As CNNs são normalmente compostas por várias camadas distintas que trabalham em conjunto para extrair e processar informações de entradas visuais:

  • Camadas convolucionais: Estes são os blocos de construção principais. Aplica filtros (kernels) na imagem de entrada para criar mapas de caraterísticas que realçam padrões específicos como arestas, cantos ou texturas. A operação de convolução permite que a rede aprenda caraterísticas relevantes para a tarefa.
  • Funções de ativação: Aplicadas após as camadas convolucionais, funções como ReLU (Unidade Linear Retificada) ou Leaky ReLU introduzem não linearidade, permitindo que a rede aprenda relações mais complexas nos dados. Saiba mais sobre as diferentes funções de ativação.
  • Camadas de agrupamento: Estas camadas reduzem as dimensões espaciais (largura e altura) dos mapas de caraterísticas, diminuindo a carga computacional e ajudando a tornar as caraterísticas aprendidas mais resistentes a variações de posição. As técnicas comuns de agrupamento incluem o agrupamento máximo e o agrupamento médio, detalhados em recursos como esta visão geral dos métodos de agrupamento.
  • Camadas totalmente conectadas: Normalmente encontradas no final da rede, essas camadas pegam os recursos de alto nível extraídos pelas camadas convolucionais e de pooling e os usam para tarefas de classificação ou regressão, semelhantes às camadas de uma rede neural feedforward padrão.

Principais diferenças em relação a outras redes neurais

Embora partilhem conceitos fundamentais com outras redes neuronais, as CNN possuem caraterísticas únicas:

  • Aprendizagem de hierarquias espaciais: As CNNs são excelentes no reconhecimento de padrões e hierarquias espaciais em dados como imagens, graças às suas camadas convolucionais e campos receptivos locais. As NNs padrão tratam frequentemente as caraterísticas de entrada de forma independente, perdendo o contexto espacial.
  • Partilha de parâmetros: Os filtros são partilhados por toda a imagem de entrada nas camadas convolucionais, reduzindo significativamente o número de parâmetros em comparação com as redes totalmente ligadas e melhorando a eficiência.
  • Foco no caso de utilização: As CNNs são a arquitetura ideal para tarefas de análise de imagem e vídeo. Em contrapartida, as Redes Neurais Recorrentes (RNNs) são mais adequadas para dados sequenciais, como texto para Processamento de Linguagem Natural (PLN) ou análise de séries temporais.

Aplicações no mundo real

As CNNs têm demonstrado um sucesso notável em vários domínios. Eis dois exemplos proeminentes:

  1. Análise de imagens médicas: As CNNs ajudam os profissionais de saúde a analisar radiografias, tomografias computorizadas e ressonâncias magnéticas para detetar anomalias subtis, como tumores ou fracturas. Isto contribui significativamente para a IA nos cuidados de saúde, permitindo diagnósticos mais rápidos e potencialmente mais precisos. A investigação continua a alargar os limites, como se pode ver nos estudos disponíveis em plataformas como a PubMed Central.
  2. Veículos autónomos: Os veículos autónomos dependem fortemente das CNNs para a deteção de objectos em tempo real (identificação de peões, carros, sinais de trânsito) e segmentação de imagens (compreensão das faixas de rodagem, obstáculos). Esta perceção visual é crucial para uma navegação segura em ambientes complexos, constituindo o núcleo da IA em veículos autónomos.

Ferramentas e estruturas

O desenvolvimento e a implementação de CNNs são facilitados por várias ferramentas e estruturas poderosas de aprendizagem profunda:

  • Estruturas: As escolhas mais populares incluem PyTorch, TensorFlowe Keras, que fornecem camadas pré-construídas, optimizadores e suporte para aceleração de hardware como GPUs. Podes encontrar entradas no glossário para PyTorch, TensorFlowe Keras.
  • EcossistemaUltralytics : Ferramentas como Ultralytics YOLO fornecem modelos de última geração baseados em CNN otimizados para deteção de objetos e outras tarefas de CV. A plataforma Ultralytics HUB simplifica o processo de treinamento, implantação e gerenciamento desses modelos sem necessidade de codificação extensiva. Explora as dicas de formação de modelos para otimizar os seus CNNs.
Lê tudo