Glossário

Aumento de dados

Aumenta o desempenho do modelo com o aumento de dados. Melhora a generalização, reduz o sobreajuste e expande os conjuntos de dados sem esforço. Descobre técnicas poderosas!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

O aumento de dados é uma técnica utilizada na aprendizagem automática para aumentar a diversidade dos dados de treino sem recolher novos dados. Envolve a criação de versões modificadas de pontos de dados existentes, o que ajuda a melhorar o desempenho do modelo, reduzindo o sobreajuste e melhorando a generalização. Estas modificações podem incluir transformações como a rotação, o escalonamento, a tradução, a inversão e a alteração da cor, aplicáveis a imagens, texto ou outras formas de dados.

Importância e benefícios

O aumento de dados desempenha um papel crucial no desenvolvimento de modelos robustos de aprendizagem automática. Ajuda-o a:

  • Melhora a generalização do modelo: Ao expor os modelos a versões variadas de dados de treino, o aumento de dados ajuda-os a aprender caraterísticas mais generalizadas, melhorando o seu desempenho em dados não vistos.
  • Reduzir o sobreajuste: A diversidade de dados adicionais reduz a tendência dos modelos para memorizar os dados de treino, minimizando assim o sobreajuste.
  • Expansão de dados limitados: Para aplicações com dados originais limitados, o aumento é uma forma eficiente de expandir o tamanho do conjunto de dados sem esforços adicionais de recolha de dados.

Técnicas de aumento de dados

Podem ser utilizadas várias técnicas para aumentar os dados, incluindo:

  • Transformações geométricas: Ajustes como rotação, inversão, corte e dimensionamento alteram a orientação ou o tamanho das imagens, preservando o seu conteúdo.
  • Transformações do espaço de cores: Modificar o brilho, o contraste, a saturação e a tonalidade pode ajudar os modelos a tornarem-se invariáveis às condições de iluminação.
  • Apagamento aleatório: Oculta parcialmente as imagens ao mascarar aleatoriamente secções, encorajando os modelos a concentrarem-se em todo o contexto da imagem.
  • MixUp: Combina duas imagens e as suas etiquetas no conjunto de dados, encorajando o modelo a aprender a partir de caraterísticas combinadas, explorando técnicas de aumento de imagem.

Aplicações em IA/ML no mundo real

O aumento de dados é amplamente utilizado em vários domínios, incluindo:

  • Cuidados de saúde: As aplicações de imagiologia médica, tais como o diagnóstico de doenças a partir de exames de ressonância magnética, beneficiam significativamente do aumento de dados, lidando com a disponibilidade limitada de dados rotulados IA nos cuidados de saúde.
  • Carros autónomos: Os veículos autónomos requerem dados de formação diversificados para lidar com a miríade de condições encontradas na estrada. O aumento dos dados ajuda a simular diferentes condições de iluminação e perspectivas da IA na condução autónoma.

Distinguir o aumento de dados de conceitos relacionados

  • Aumento de dados vs. Geração de dados sintéticos: O aumento de dados gera novas instâncias de dados aplicando transformações aos dados existentes, enquanto a geração de dados sintéticos cria instâncias de dados inteiramente novas utilizando modelos como as GAN (Generative Adversarial Networks) descobre as GAN na IA.
  • Aumento de dados vs. Aprendizagem por transferência: A aprendizagem por transferência centra-se na utilização de modelos pré-treinados para aproveitar o conhecimento prévio para novas tarefas, enquanto o aumento de dados enriquece a diversidade dos próprios dados de treino .

Ferramentas e tecnologia

As bibliotecas e estruturas populares apoiam o aumento de dados em projectos de IA/ML, tais como:

  • TensorFlow e PyTorch: Ambas fornecem várias técnicas de aumento prontamente acessíveis nas suas respectivas bibliotecas . Sabe mais sobre TensorFlow e explora PyTorch.
  • OpenCV: Uma ferramenta poderosa que suporta o aumento de imagens, útil em tarefas de visão computacional OpenCV em IA.

Implementar a ampliação de dados

A implementação do aumento de dados pode ser feita utilizando plataformas como o Ultralytics HUB, que simplifica o processo através de ferramentas intuitivas para gerar conjuntos de dados enriquecidos sem esforços intensivos de codificação manual.

Em conclusão, o aumento de dados é uma técnica essencial nos fluxos de trabalho modernos de IA/ML, contribuindo para modelos mais precisos e eficazes. É particularmente vital em cenários em que a recolha de dados é escassa ou dispendiosa, permitindo o desenvolvimento de soluções de IA em diferentes sectores, melhorando a sua fiabilidade e desempenho.

Lê tudo