Verificação verde
Link copiado para a área de transferência

Compreender a aprendizagem de poucos disparos, disparos zero e transferência

Explora as diferenças entre a aprendizagem de poucos disparos, a aprendizagem de zero disparos e a aprendizagem por transferência na visão por computador e a forma como estes paradigmas moldam a formação de modelos de IA.

Os sistemas de inteligência artificial (IA) podem realizar tarefas complexas como reconhecer rostos, classificar imagens e conduzir automóveis com o mínimo de intervenção humana. Fazem-no estudando dados, reconhecendo padrões e utilizando esses padrões para fazer previsões ou tomar decisões. À medida que a IA avança, estamos a assistir a formas cada vez mais sofisticadas de os modelos de IA aprenderem, se adaptarem e executarem tarefas com uma eficiência notável.

Por exemplo, a visão computacional é um ramo da IA que se centra na capacidade de as máquinas interpretarem e compreenderem a informação visual do mundo. O desenvolvimento tradicional de modelos de visão computacional depende fortemente de grandes conjuntos de dados anotados para treino. A recolha e rotulagem desses dados pode ser morosa e dispendiosa. 

Para lidar com estes desafios, os investigadores introduziram abordagens inovadoras como a aprendizagem com poucos exemplos (FSL), que aprende a partir de exemplos limitados; a aprendizagem com zero exemplos (ZSL), que identifica objectos não vistos; e a aprendizagem por transferência (TL), que aplica o conhecimento de modelos pré-treinados a novas tarefas.

Neste artigo, vamos explorar como funcionam estes paradigmas de aprendizagem, destacar as suas principais diferenças e analisar as aplicações do mundo real. Toca a começar!

Uma visão geral dos paradigmas de aprendizagem

Vamos explorar o que são a aprendizagem de poucos disparos, a aprendizagem de zero disparos e a aprendizagem por transferência no que diz respeito à visão computacional e como funcionam. 

Aprendizagem com poucos disparos

A aprendizagem com poucos exemplos é um método em que os sistemas aprendem a reconhecer novos objectos utilizando apenas um pequeno número de exemplos. Por exemplo, se mostrares a um modelo algumas fotografias de um pinguim, de um pelicano e de um papagaio-do-mar (este pequeno grupo é designado por "conjunto de apoio"), ele aprende a reconhecer o aspeto destas aves. 

Mais tarde, se mostrares ao modelo uma nova imagem, como um pinguim, ele compara essa nova imagem com as que estão no seu conjunto de suporte e escolhe a que mais se aproxima. Quando é difícil reunir uma grande quantidade de dados, este método é vantajoso porque o sistema pode aprender e adaptar-se com apenas alguns exemplos.

Figura 1. Uma visão geral de como funciona a aprendizagem de poucos disparos.

Aprendizagem zero

A aprendizagem zero é uma forma de as máquinas reconhecerem coisas que nunca viram antes sem precisarem de exemplos dessas coisas. Utiliza informações semânticas, como descrições, para ajudar a estabelecer ligações.

Por exemplo, se uma máquina tiver aprendido sobre animais como gatos, leões e cavalos, compreendendo caraterísticas como "pequeno e fofo", "grande gato selvagem" ou "cara comprida", pode utilizar este conhecimento para identificar um novo animal, como um tigre. Mesmo que nunca tenha visto um tigre, pode utilizar uma descrição como "um animal semelhante a um leão com riscas escuras" para o identificar corretamente. Isto torna mais fácil para as máquinas aprenderem e adaptarem-se sem precisarem de muitos exemplos.

Figura 2. A aprendizagem zero-shot identifica novos objectos utilizando descrições.

Aprendizagem por transferência

A aprendizagem por transferência é um paradigma de aprendizagem em que um modelo utiliza o que aprendeu com uma tarefa para ajudar a resolver uma nova tarefa semelhante. Esta técnica é especialmente útil quando se trata de tarefas de visão computacional, como deteção de objectos, classificação de imagens e reconhecimento de padrões. 

Por exemplo, na visão por computador, um modelo pré-treinado pode reconhecer objectos gerais, como animais, e depois ser aperfeiçoado através da aprendizagem por transferência para identificar objectos específicos, como diferentes raças de cães. Ao reutilizar o conhecimento de tarefas anteriores, a aprendizagem por transferência facilita o treino de modelos de visão por computador em conjuntos de dados mais pequenos, poupando tempo e esforço.

Figura 3. Uma visão geral do funcionamento da aprendizagem por transferência.

Deves estar a perguntar-te que tipo de modelos suportam a aprendizagem por transferência. Ultralytics YOLO11 da Ultralytics é um excelente exemplo de um modelo de visão computacional que pode fazer isso. É um modelo de deteção de objectos de última geração que é primeiro pré-treinado num conjunto de dados grande e geral. Depois disso, pode ser ajustado e treinado de forma personalizada num conjunto de dados mais pequeno e especializado para tarefas específicas.

Compara os paradigmas de aprendizagem

Agora que já falámos sobre a aprendizagem de poucos disparos, a aprendizagem de zero disparos e a aprendizagem por transferência, vamos compará-las para ver como diferem.

Fig. 4. Principais diferenças entre a aprendizagem de poucas tentativas, de zero tentativas e de transferência Imagem do autor.

A aprendizagem de poucos exemplos é útil quando se tem apenas uma pequena quantidade de dados rotulados. Torna possível que um modelo de IA aprenda com apenas alguns exemplos. A aprendizagem zero-shot, por outro lado, não requer quaisquer dados rotulados. Em vez disso, utiliza descrições ou contexto para ajudar o sistema a lidar com novas tarefas. Entretanto, a aprendizagem por transferência adopta uma abordagem diferente, utilizando o conhecimento de modelos pré-treinados, permitindo-lhes adaptar-se rapidamente a novas tarefas com um mínimo de dados adicionais. Cada método tem os seus próprios pontos fortes, dependendo do tipo de dados e da tarefa em que estás a trabalhar.

Aplicações no mundo real de vários paradigmas de aprendizagem

Estes paradigmas de aprendizagem já estão a fazer a diferença em muitos sectores, resolvendo problemas complexos com soluções inovadoras. Vamos ver mais de perto como podem ser aplicados no mundo real.

Diagnosticar doenças raras com aprendizagem de poucos disparos

A aprendizagem de poucos exemplos é um fator de mudança para o sector da saúde, especialmente na imagiologia médica. Pode ajudar os médicos a diagnosticar doenças raras utilizando apenas alguns exemplos ou mesmo descrições, sem necessitar de grandes quantidades de dados. Isto é especialmente útil quando os dados são limitados, o que acontece frequentemente porque a recolha de grandes conjuntos de dados para doenças raras pode ser um desafio.

Por exemplo, o SHEPHERD utiliza a aprendizagem de poucos disparos e gráficos de conhecimentos biomédicos para diagnosticar doenças genéticas raras. Mapeia a informação do paciente, como os sintomas e os resultados dos testes, numa rede de genes e doenças conhecidos. Isto ajuda a identificar a causa genética provável e a encontrar casos semelhantes, mesmo quando os dados são limitados. 

Fig. 5. O modelo de Shepherd diagnostica doenças raras utilizando um mínimo de dados.

Melhorar a deteção de doenças das plantas com a aprendizagem de zero-shot

Na agricultura, a identificação rápida de doenças das plantas é essencial porque os atrasos na deteção podem levar a danos generalizados nas culturas, a uma redução dos rendimentos e a perdas financeiras significativas. Os métodos tradicionais dependem frequentemente de grandes conjuntos de dados e de conhecimentos especializados, que podem nem sempre estar acessíveis, especialmente em áreas remotas ou com recursos limitados. É aqui que entram em jogo os avanços da IA, como a aprendizagem de tiro zero.

Digamos que um agricultor está a cultivar tomates e batatas e repara em sintomas como folhas amareladas ou manchas castanhas. A aprendizagem zero pode ajudar a identificar doenças como a requeima sem necessitar de grandes conjuntos de dados. Ao utilizar as descrições dos sintomas, o modelo pode classificar doenças que nunca viu antes. Esta abordagem é rápida, escalável e permite aos agricultores detetar uma variedade de problemas nas plantas. Ajuda-os a monitorizar a saúde das culturas de forma mais eficiente, a tomar medidas atempadas e a reduzir as perdas.

Fig. 6. Utiliza a aprendizagem de zero-shot para identificar doenças de plantas.

Veículos autónomos e aprendizagem por transferência

Os veículos autónomos precisam frequentemente de se adaptar a diferentes ambientes para navegar em segurança. A aprendizagem por transferência ajuda-os a utilizar conhecimentos prévios para se ajustarem rapidamente a novas condições sem terem de começar o seu treino do zero. Combinadas com a visão por computador, que ajuda os veículos a interpretar a informação visual, estas tecnologias permitem uma navegação mais suave em diferentes terrenos e condições meteorológicas, tornando a condução autónoma mais eficiente e fiável.

Um bom exemplo disto em ação é um sistema de gestão de estacionamento que utilizaYOLO11 Ultralytics YOLO11 para monitorizar os lugares de estacionamento. YOLO11, um modelo de deteção de objectos pré-treinado, pode ser afinado utilizando a aprendizagem por transferência para identificar lugares de estacionamento vazios e ocupados em tempo real. Ao treinar o modelo num conjunto de dados mais pequeno de imagens de parques de estacionamento, aprende a detetar com precisão lugares abertos, lugares cheios e até áreas reservadas.

Fig. 7. Gestão de estacionamento utilizando o Ultralytics YOLO11.

Integrado com outras tecnologias, este sistema pode orientar os condutores para o lugar disponível mais próximo, ajudando a reduzir o tempo de procura e o congestionamento do trânsito. A aprendizagem por transferência torna isto possível ao basear-se nas capacidades existentes de deteção de objectos do YOLO11, permitindo-lhe adaptar-se às necessidades específicas da gestão de estacionamento sem começar do zero. Esta abordagem poupa tempo e recursos, ao mesmo tempo que cria uma solução altamente eficiente e escalável que melhora as operações de estacionamento e melhora a experiência geral do utilizador.

Tendências emergentes nos paradigmas de aprendizagem

O futuro dos paradigmas de aprendizagem na visão computacional está a inclinar-se para o desenvolvimento de sistemas de visão de IA mais inteligentes e sustentáveis. Em particular, uma tendência crescente é a utilização de abordagens híbridas que combinam a aprendizagem de poucos disparos, a aprendizagem de zero disparos e a aprendizagem por transferência. Ao combinar os pontos fortes destes métodos, os modelos podem aprender novas tarefas com um mínimo de dados e aplicar os seus conhecimentos em diferentes áreas.

Um exemplo interessante é a utilização de deep embeddings adaptados para afinar modelos utilizando conhecimentos de tarefas anteriores e uma pequena quantidade de novos dados, facilitando o trabalho com conjuntos de dados limitados. 

Da mesma forma, a aprendizagem X-shot foi concebida para lidar com tarefas com diferentes quantidades de dados. Utiliza uma supervisão fraca, em que os modelos aprendem com rótulos limitados ou ruidosos, e instruções claras para os ajudar a adaptarem-se rapidamente, mesmo com poucos ou nenhuns exemplos anteriores disponíveis. Estas abordagens híbridas mostram como a integração de diferentes métodos de aprendizagem pode ajudar os sistemas de IA a enfrentar os desafios de forma mais eficaz.

Principais conclusões

A aprendizagem de poucos disparos, a aprendizagem de zero disparos e a aprendizagem por transferência abordam desafios específicos na visão computacional, tornando-as adequadas para diferentes tarefas. A abordagem correta depende da aplicação específica e da quantidade de dados disponíveis. Por exemplo, a aprendizagem de poucos disparos funciona bem com dados limitados, enquanto a aprendizagem de zero disparos é óptima para lidar com classes não vistas ou desconhecidas.

Olhando para o futuro, é provável que a combinação destes métodos para criar modelos híbridos que integrem a visão, a linguagem e o áudio seja um ponto fulcral. Estes avanços visam tornar os sistemas de IA mais flexíveis, eficientes e capazes de resolver problemas complexos, abrindo novas possibilidades de inovação neste domínio.

Explora mais sobre a IA juntando-te à nossa comunidade e consultando o nosso repositório GitHub. Aprende como a IA em carros autónomos e a visão computacional na agricultura estão a remodelar o futuro. Vê as opções disponíveis da licençaYOLO para começares!

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática