Glossário

IA generativa

Descobre como a IA generativa cria conteúdos originais como texto, imagens e áudio, transformando as indústrias com aplicações inovadoras.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Inteligência Artificial (IA) generativa é um subconjunto da inteligência artificial (IA) centrado na criação de sistemas que podem gerar novos conteúdos, como texto, imagens, áudio, código ou dados sintéticos. Ao contrário dos modelos de IA discriminativos que aprendem a classificar ou a prever com base nos dados de entrada (por exemplo, identificar objectos numa imagem), os modelos generativos aprendem os padrões e as distribuições subjacentes num conjunto de dados para produzir resultados novos e originais que se assemelham aos dados de treino. Avanços recentes, em particular com modelos como o Generative Pre-trained Transformers (GPT) e modelos de difusão, permitiram a criação de conteúdos altamente realistas e complexos.

Como funciona a IA generativa

Os modelos de IA generativa funcionam normalmente através da aprendizagem de uma representação da distribuição de probabilidades dos dados de treino. Em seguida, pode recolher amostras desta distribuição aprendida para gerar novos pontos de dados. As arquitecturas comuns incluem:

  • Redes Adversariais Generativas (GANs): Envolve duas redes neuronais, um gerador e um discriminador, que competem entre si para melhorar a qualidade dos resultados gerados.
  • Transformadores: Amplamente utilizados em grandes modelos linguísticos (LLMs) como o GPT-4, estes modelos utilizam mecanismos de atenção para gerar sequências coerentes e contextualmente relevantes, principalmente texto.
  • Autoencodificadores variacionais (VAEs): Estes aprendem representações comprimidas de dados e podem gerar novos dados descodificando pontos amostrados do espaço latente.
  • Modelos de difusão: Estes modelos funcionam adicionando gradualmente ruído aos dados e depois aprendem a inverter o processo, permitindo a geração de alta fidelidade, especialmente para imagens (por exemplo, Stable Diffusion).

IA generativa vs. visão por computador

Embora ambos sejam ramos da IA, a IA generativa e a visão por computador (CV) têm objectivos fundamentalmente diferentes.

Conforme discutido durante o YOLO Vision 2024, os modelos de IA generativa são muitas vezes significativamente maiores (milhares de milhões de parâmetros) em comparação com modelos CV eficientes concebidos para análise em tempo real (como Ultralytics YOLOv8com modelos que começam com alguns milhões de parâmetros). A IA generativa requer recursos computacionais substanciais para formação e inferência, ao passo que muitos modelos CV são optimizados para implementação em hardware padrão ou dispositivos de ponta.

No entanto, estes domínios estão a cruzar-se cada vez mais. A IA generativa pode ajudar a CV através da criação de dados sintéticos para treinar modelos de deteção ou segmentação, especialmente para cenários raros, melhorando potencialmente a robustez e o desempenho do modelo.

Aplicações e exemplos do mundo real

A IA generativa tem inúmeras aplicações em vários domínios:

  1. Criação de conteúdos: Gerar artigos, textos de marketing, guiões(geração de texto), criar imagens ou arte originais(texto para imagem), compor música ou gerar vídeo(texto para vídeo). Ferramentas como ChatGPT para texto e Midjourney para imagens são exemplos populares.
  2. Aumento de dados: Cria amostras de dados artificiais para expandir conjuntos de dados limitados. Por exemplo, gerar imagens sintéticas de condições médicas raras para melhorar a precisão dos sistemas de IA de diagnóstico utilizados na análise de imagens médicas. Isto ajuda a ultrapassar a escassez de dados e melhora a generalização do modelo.
  3. Descoberta e desenvolvimento de medicamentos: Simular estruturas moleculares e prever as suas propriedades para acelerar a procura de novos medicamentos, tal como explorado por empresas como a DeepMind.
  4. Personalização: Potencia chatbots e assistentes virtuais sofisticados, cria materiais de aprendizagem personalizados ou gera recomendações de produtos personalizadas.

Considerações éticas

O poder da IA generativa também traz desafios éticos significativos. Estes incluem o potencial para gerar desinformação ou conteúdos nocivos, a criação de deepfakes convincentes, questões relacionadas com os direitos de autor e a propriedade intelectual dos conteúdos gerados, e preconceitos inerentes aprendidos com os dados de treino. Para resolver estes problemas, é necessário considerar cuidadosamente a ética da IA, a transparência e quadros regulamentares sólidos. Desenvolver e implementar estas tecnologias de forma responsável é crucial. Para gerir e treinar os teus próprios modelos de IA, considera plataformas como o Ultralytics HUB.

Lê tudo