Glossário

Aprendizagem por transferência

Descobre como a aprendizagem por transferência aumenta a eficiência da IA através da reutilização de modelos pré-treinados. Poupa tempo, melhora a precisão e destaca-se com dados limitados.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A aprendizagem por transferência é uma técnica poderosa na aprendizagem automática (ML) em que um modelo desenvolvido para uma tarefa é reutilizado como ponto de partida para um modelo numa segunda tarefa relacionada. Esta abordagem aproveita o conhecimento adquirido com a tarefa inicial para melhorar a eficiência da aprendizagem e o desempenho na nova tarefa, especialmente quando a nova tarefa tem dados limitados disponíveis. Em vez de treinar um modelo de raiz, a aprendizagem por transferência permite-lhe tirar partido de modelos pré-treinados que foram desenvolvidos em grandes conjuntos de dados, poupando tempo e recursos computacionais significativos.

Como funciona a aprendizagem por transferência

A ideia central da aprendizagem por transferência é que um modelo que tenha aprendido a identificar padrões num grande conjunto de dados pode transferir esse conhecimento para uma tarefa diferente, mas relacionada. Por exemplo, um modelo treinado para reconhecer objectos em milhões de imagens pode ser adaptado para identificar tipos específicos de objectos com um conjunto de dados mais pequeno. Isto é particularmente útil na visão computacional (CV) e no processamento de linguagem natural (PNL), em que a criação de grandes conjuntos de dados rotulados pode ser morosa e dispendiosa.

Tipos de aprendizagem por transferência

Existem várias abordagens à aprendizagem por transferência, incluindo:

  • Extração de caraterísticas: Nesta abordagem, o modelo pré-treinado é utilizado como um extrator de caraterísticas fixo. As camadas finais do modelo, que são normalmente específicas da tarefa, são removidas e a saída das camadas restantes é utilizada como entrada para um novo classificador.
  • Afinação: Isto implica descongelar algumas ou todas as camadas do modelo pré-treinado e continuar o processo de treino no novo conjunto de dados. Isto permite que o modelo adapte as suas caraterísticas aprendidas às especificidades da nova tarefa, mantendo o conhecimento geral adquirido com a tarefa original. Explora o ajuste fino em pormenor para compreender como aumenta a precisão do modelo.

Benefícios da aprendizagem por transferência

A aprendizagem por transferência oferece várias vantagens:

  • Tempo de formação reduzido: Ao começar com um modelo pré-treinado, o tempo de formação para a nova tarefa é significativamente reduzido.
  • Melhora o desempenho: Aproveitar o conhecimento de uma tarefa relacionada conduz frequentemente a um melhor desempenho, especialmente quando a nova tarefa tem dados limitados.
  • Necessita de menos dados: A aprendizagem por transferência pode ser particularmente eficaz quando se tem um pequeno conjunto de dados para a nova tarefa, uma vez que o modelo pré-treinado já tem uma boa compreensão dos padrões subjacentes.

Aprendizagem por transferência vs. outras técnicas de aprendizagem

É importante distinguir a aprendizagem por transferência de outras técnicas de aprendizagem relacionadas:

  • Aprendizagem por transferência vs. Aprendizagem supervisionada: Na aprendizagem supervisionada tradicional, um modelo é treinado a partir do zero num conjunto de dados rotulado específico para a tarefa em questão. A aprendizagem por transferência, por outro lado, utiliza um modelo pré-treinado como ponto de partida, o que pode reduzir significativamente a quantidade de dados rotulados e o tempo de treino necessário.
  • Aprendizagem por transferência vs. Afinação: Embora o ajuste fino seja um tipo específico de aprendizagem por transferência, nem toda a aprendizagem por transferência envolve o ajuste fino. Por exemplo, a utilização de um modelo pré-treinado como um extrator de caraterísticas fixo é uma forma de aprendizagem por transferência que não envolve afinação.

Aplicações no mundo real

A aprendizagem por transferência tem inúmeras aplicações no mundo real em vários domínios:

  1. Imagiologia médica: No sector da saúde, a aprendizagem por transferência pode ser utilizada para adaptar modelos treinados em grandes conjuntos de dados de imagens gerais a tarefas específicas de imagiologia médica, como a deteção de tumores ou outras anomalias em radiografias, ressonâncias magnéticas ou tomografias computorizadas. Isto é particularmente valioso porque os conjuntos de dados de imagens médicas são muitas vezes mais pequenos e mais difíceis de adquirir devido a preocupações com a privacidade e à necessidade de rotulagem especializada. Explora a IA nos cuidados de saúde para obteres mais informações.
  2. Deteção de objectos em veículos autónomos: A aprendizagem por transferência desempenha um papel crucial no treino de modelos para a deteção de objectos em veículos autónomos. Um modelo pré-treinado num vasto conjunto de dados de imagens gerais pode ser aperfeiçoado para reconhecer objectos específicos relevantes para a condução, tais como peões, veículos e sinais de trânsito, utilizando um conjunto de dados mais pequeno e especializado. Sabe mais sobre a IA nos automóveis autónomos.

Ferramentas e estruturas

Várias estruturas populares de aprendizagem profunda suportam a aprendizagem por transferência, incluindo PyTorch e TensorFlow. Essas estruturas fornecem acesso a uma ampla gama de modelos pré-treinados, como os disponíveis na bibliotecaHugging Face Transformers, que podem ser facilmente adaptados para novas tarefas. Além disso, plataformas como Ultralytics HUB facilitam o uso de modelos pré-treinados Ultralytics YOLO , simplificando o processo de implementação da aprendizagem por transferência para aplicações de visão computacional.

Ao tirar partido do poder da aprendizagem por transferência, os programadores e investigadores podem criar modelos de elevado desempenho de forma mais eficiente, mesmo com dados limitados, acelerando o desenvolvimento e a implementação de soluções de IA em vários sectores.

Lê tudo