Glossário

Modelo de fundação

Descobre como os modelos de fundação revolucionam a IA com arquitecturas escaláveis, pré-treino alargado e adaptabilidade a diversas aplicações.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Os modelos de base representam uma mudança significativa no panorama da Inteligência Artificial (IA). Estes modelos poderosos, treinados em grandes quantidades de dados, foram concebidos para serem adaptáveis a uma vasta gama de tarefas a jusante. Ao contrário dos modelos tradicionais de aprendizagem automática que são normalmente criados para um objetivo específico, os modelos de base são pré-treinados em grandes conjuntos de dados e podem ser ajustados ou adaptados para executar várias tarefas com o mínimo de dados de formação específicos da tarefa. Esta capacidade reduz drasticamente a necessidade de recolha de dados extensiva e de formação de raiz para cada nova aplicação, tornando a IA mais eficiente e acessível.

Caraterísticas principais dos modelos de fundação

Os modelos de fundação são caracterizados pela sua escala, generalidade e adaptabilidade.

  • Escala: Estes modelos são treinados em conjuntos de dados excecionalmente grandes, muitas vezes abrangendo diversos tipos de dados, como texto, imagens e áudio. Esta escala maciça permite que o modelo aprenda representações ricas do mundo.
  • Generalidade: Uma caraterística fundamental dos modelos de fundação é a sua ampla aplicabilidade. Não foram concebidos para uma única tarefa, mas são capazes de compreender e gerar diversos tipos de dados, o que os torna ferramentas versáteis para várias aplicações.
  • Adaptabilidade: Os modelos de base podem ser adaptados ou aperfeiçoados de forma eficiente para tarefas específicas a jusante. Isto é frequentemente conseguido através de técnicas como a aprendizagem por transferência, em que o conhecimento do modelo pré-treinado é aproveitado para resolver problemas novos e relacionados com muito menos dados e esforço computacional. Isto é semelhante à forma como os modelos Ultralytics YOLO podem ser ajustados em conjuntos de dados personalizados para tarefas específicas de deteção de objectos.

Os modelos de base utilizam frequentemente arquitecturas de aprendizagem profunda, em especial transformadores, conhecidos pela sua capacidade de processar dados sequenciais e captar dependências de longo alcance. Estes modelos aprendem padrões e relações complexas dentro dos dados, permitindo-lhes realizar tarefas que vão desde o processamento de linguagem natural (PNL) à visão por computador (CV) e muito mais.

Aplicações dos modelos de fundações

A versatilidade dos modelos de fundações levou à sua rápida adoção em vários domínios. Eis alguns exemplos:

  • Geração de texto e Chatbots: Os modelos de linguagem de grande dimensão (LLM), como o GPT-4, são exemplos de modelos de base em PNL. São treinados em conjuntos de dados de texto maciços e podem gerar texto de qualidade humana, traduzir idiomas e alimentar chatbots sofisticados. Estes modelos estão na base de aplicações que vão desde a criação de conteúdos e o serviço de apoio ao cliente até às ferramentas avançadas de geração de texto.
  • Compreensão e geração de imagens: Na visão por computador, os modelos de base podem ser utilizados para uma variedade de tarefas, incluindo a classificação de imagens, a deteção de objectos e a segmentação de imagens. Modelos como o Segment Anything Model (SAM ) da Meta AI, que pode efetuar a segmentação de imagens, demonstram o poder dos modelos de base na compreensão e manipulação de dados visuais. Do mesmo modo, os modelos de difusão são modelos de base capazes de gerar imagens de alta qualidade a partir de mensagens de texto, abrindo novas possibilidades nas indústrias criativas e não só.

Além disso, os modelos de base estão a ser explorados em áreas como a automatização de processos robóticos (RPA) para automatizar fluxos de trabalho complexos, a análise de imagens médicas para melhorar a precisão dos diagnósticos e até na investigação científica para tarefas como a descoberta de medicamentos e a ciência dos materiais.

Modelos de fundação vs. modelos tradicionais

A principal distinção entre os modelos de base e os modelos tradicionais de aprendizagem automática reside no seu âmbito e reutilização. Os modelos tradicionais são normalmente treinados para uma tarefa e um conjunto de dados específicos, limitando a sua aplicabilidade a outros problemas. Em contrapartida, os modelos de base são concebidos para serem amplamente aplicáveis e adaptáveis. Esta mudança de paradigma oferece várias vantagens:

  • Redução do tempo e do custo de desenvolvimento: Ao utilizar modelos de base pré-treinados, os programadores podem reduzir significativamente o tempo e os recursos necessários para criar aplicações de IA. O ajuste fino de um modelo de base é geralmente mais rápido e mais barato do que treinar um modelo a partir do zero.
  • Desempenho melhorado com dados limitados: Os modelos de base apresentam frequentemente um forte desempenho, mesmo quando afinados em pequenos conjuntos de dados, o que os torna inestimáveis em cenários onde os dados são escassos.
  • Capacidades emergentes: Devido à sua escala e formação, os modelos de fundação podem apresentar capacidades emergentes, o que significa que podem executar tarefas para as quais não foram explicitamente treinados, surpreendendo os investigadores e alargando o âmbito das aplicações de IA.

No entanto, também é importante reconhecer os desafios associados aos modelos de base. Estes incluem as suas exigências computacionais para formação e implementação, potenciais enviesamentos aprendidos com os vastos conjuntos de dados e considerações éticas em torno das suas amplas capacidades e potencial utilização indevida. À medida que o campo evolui, a investigação em curso centra-se na resolução destes desafios e na revelação do potencial dos modelos de base para democratizar a IA e impulsionar a inovação em diversos domínios. Plataformas como o Ultralytics HUB foram concebidas para tornar estes modelos avançados mais acessíveis, permitindo aos utilizadores tirar partido do poder da IA nos seus projectos e fluxos de trabalho.

Lê tudo