Glossário

Redes residuais (ResNet)

Descobre o poder da ResNet, uma arquitetura pioneira de aprendizagem profunda que resolve gradientes que desaparecem. Perfeito para tarefas de IA como visão, deteção e muito mais!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

As redes residuais (ResNet) são uma arquitetura inovadora de aprendizagem profunda concebida para resolver o problema do gradiente de desaparecimento, que frequentemente dificulta a formação de redes neurais muito profundas. Introduzida por Kaiming He e a sua equipa em Microsoft Research em 2015, a ResNet utiliza "ligações de salto" ou "ligações residuais" para permitir que a informação contorne uma ou mais camadas, permitindo que os modelos sejam treinados eficazmente mesmo com centenas ou milhares de camadas. Esta inovação fez da ResNet uma arquitetura fundamental na aprendizagem profunda moderna, particularmente em tarefas de visão computacional.

Principais caraterísticas do ResNet

  1. Ignora as conexões: Estas conexões permitem que o gradiente flua diretamente através da rede, atenuando o problema do gradiente que desaparece. Elas funcionam introduzindo um atalho que pula uma ou mais camadas e conecta diretamente a entrada à saída de um bloco. Saiba mais sobre o papel da retropropagação no treinamento de redes profundas.

  2. Blocos residuais: O principal bloco de construção da ResNet, um bloco residual adiciona a entrada do bloco à sua saída, aprendendo efetivamente o mapeamento residual em vez da transformação completa. Isso simplifica a otimização, pois a rede se concentra em aprender o que é diferente da entrada.

  3. Escalabilidade: As arquitecturas ResNet podem ser escaladas para redes muito profundas, como a ResNet-50, a ResNet-101 e a ResNet-152, sem sofrerem uma degradação do desempenho.

  4. Generalização aprimorada: As conexões residuais melhoram a capacidade de generalização das redes profundas, tornando a ResNet robusta em uma variedade de tarefas e conjuntos de dados, como o ImageNet.

Aplicações da ResNet

Classificação de imagens

A ResNet tem estado na vanguarda das tarefas de classificação de imagens. Modelos como o ResNet-50 e o ResNet-101 são frequentemente usados como base para pipelines de classificação. Por exemplo, a ResNet foi fundamental para vencer o ImageNet Large Scale Visual Recognition Challenge (ILSVRC) em 2015. Descobre mais sobre a classificação de imagens e as suas aplicações.

Deteção de objectos

A ResNet é normalmente utilizada como espinha dorsal em estruturas de deteção de objectos como a Faster R-CNN e Ultralytics YOLO . A sua capacidade de extrair caraterísticas hierárquicas torna-a ideal para localizar e classificar objectos em imagens. Explora como a deteção de objectos transforma indústrias como os cuidados de saúde e os veículos autónomos.

Imagiologia médica

Na área da saúde, os modelos ResNet são utilizados para analisar imagens médicas complexas, como radiografias, ressonâncias magnéticas e tomografias computorizadas. Ajudam a detetar anomalias como tumores ou irregularidades em órgãos com elevada precisão. Sabe como a IA nos cuidados de saúde está a revolucionar o diagnóstico e o planeamento de tratamentos.

Veículos autónomos

A ResNet é um componente crucial em sistemas de visão para carros autónomos, permitindo o reconhecimento preciso de objectos de peões, veículos e sinais de trânsito. As capacidades robustas de extração de caraterísticas da ResNet garantem uma navegação segura em ambientes dinâmicos. Lê mais sobre o papel da IA na condução autónoma.

Exemplos do mundo real

  1. Sistemas de reconhecimento facial: A ResNet é utilizada em modelos de reconhecimento facial para identificar e autenticar indivíduos. Por exemplo, o DeepFace do Facebook utiliza arquitecturas inspiradas na ResNet para obter uma precisão de nível humano na verificação facial.

  2. Controlo de qualidade no fabrico: Os modelos ResNet são aplicados no fabrico para detetar defeitos nos produtos através da análise de imagens de artigos nas linhas de produção. Esta automatização aumenta a eficiência e reduz o erro humano. Explora como a IA de visão no fabrico está a transformar os processos industriais.

Informações técnicas

O sucesso da ResNet reside na sua capacidade de treinar redes muito profundas sem degradação do desempenho. As redes profundas tradicionais geralmente sofrem uma queda na precisão à medida que as camadas aumentam, devido ao problema do gradiente de desaparecimento. A ResNet contorna esse problema usando conexões residuais que permitem que os gradientes se propaguem sem impedimentos pela rede.

Para mais detalhes técnicos, consulta a página do glossário Redes Neuronais Convolucionais (CNNs), que explica como as CNNs sustentam arquitecturas como a ResNet.

Caraterísticas distintivas em comparação com modelos semelhantes

  • U-Net: Embora tanto a ResNet como a U-Net suportem arquitecturas profundas, a U-Net foi especificamente concebida para tarefas de segmentação de imagens, fornecendo classificações ao nível do pixel. Saiba mais sobre a U-Net.

  • Transformadores de visão (ViT): Ao contrário da ResNet, que se baseia em camadas convolucionais, os Transformadores de Visão utilizam mecanismos de auto-atenção para modelar dependências globais em imagens. Explora os Transformadores de Visão para uma comparação.

Direcções futuras

A ResNet continua a inspirar arquitecturas mais recentes, como a DenseNet, que alarga o conceito de ligações de salto, ligando cada camada a todas as outras camadas. À medida que a aprendizagem profunda evolui, a ResNet continua a ser uma pedra angular para o desenvolvimento de modelos eficientes e escaláveis.

Para uma experiência prática, explora o Ultralytics HUB para treinar e implementar modelos de IA, tirando partido do ResNet como uma espinha dorsal para tarefas como a classificação e a deteção.

Lê tudo