Desbloqueia o poder da aprendizagem por transferência para poupar tempo, aumentar o desempenho da IA e lidar com novas tarefas com dados limitados utilizando modelos pré-treinados.
A aprendizagem por transferência é uma técnica de aprendizagem automática (ML) em que um modelo desenvolvido para uma tarefa específica é reutilizado como ponto de partida para um modelo numa segunda tarefa relacionada. Em vez de construir um modelo a partir do zero, o que requer dados e recursos computacionais significativos, a aprendizagem por transferência aproveita o conhecimento (caraterísticas, padrões e pesos) adquirido numa tarefa de origem para melhorar a aprendizagem numa tarefa de destino. Esta abordagem é particularmente vantajosa quando a tarefa alvo tem dados rotulados limitados, acelerando significativamente o processo de formação e conduzindo frequentemente a um melhor desempenho em comparação com a formação apenas no conjunto de dados alvo.
A ideia central subjacente à aprendizagem por transferência é que um modelo treinado num conjunto de dados grande e geral, como o ImageNet para tarefas de imagem ou um corpus de texto maciço para o Processamento de Linguagem Natural (PLN), aprende caraterísticas gerais que são úteis para muitas outras tarefas relacionadas. Por exemplo, na visão computacional (CV), as camadas iniciais de uma rede neural convolucional (CNN) podem aprender a detetar arestas, texturas e formas simples, que são elementos visuais fundamentais aplicáveis a vários problemas de reconhecimento de imagens.
Ao aplicar a aprendizagem por transferência, começa normalmente com um modelo pré-treinado. Dependendo da semelhança entre as tarefas de origem e de destino e do tamanho do conjunto de dados de destino, podes:
A aprendizagem por transferência é amplamente aplicada em vários domínios:
Plataformas como o Ultralytics HUB simplificam o processo de aplicação da aprendizagem por transferência, fornecendo modelos pré-treinados (como o Ultralytics YOLOv8 e YOLO11) e ferramentas para facilitar a formação personalizada em conjuntos de dados específicos do utilizador. Estruturas como PyTorch e TensorFlow também oferecem um vasto apoio e tutoriais para a implementação de fluxos de trabalho de aprendizagem por transferência. Para uma compreensão teórica mais profunda, recursos como a visão geral do Stanford CS231n sobre a aprendizagem por transferência ou inquéritos académicos como"A Survey on Deep Transfer Learning" fornecem informações valiosas.