Glossário

Aumento de dados

Melhore os seus modelos de aprendizagem automática com o aumento de dados. Descubra técnicas para aumentar a precisão, reduzir o sobreajuste e melhorar a robustez.

O aumento de dados é uma técnica fundamental na aprendizagem automática (ML) utilizada para aumentar artificialmente a dimensão e a diversidade de um conjunto de dados de treino. Isto é conseguido através da criação de versões modificadas, mas realistas, de amostras de dados existentes. O principal objetivo é melhorar o desempenho e a robustez dos modelos de IA, em particular na visão computacional (CV), expondo-os a uma maior variedade de condições durante o treino. Isto ajuda a evitar o sobreajuste, em que um modelo aprende demasiado bem os dados de treino mas não consegue generalizar para dados novos e não vistos, o que acaba por conduzir a uma maior precisão do modelo.

Como funciona a ampliação de dados

Na visão por computador, o aumento de dados envolve a aplicação de uma série de transformações às imagens. Estas transformações são concebidas para simular as variações do mundo real que um modelo pode encontrar após a sua implementação. As técnicas mais comuns incluem:

  • Transformações geométricas: Estas alteram a orientação espacial de uma imagem. Os exemplos incluem rotações aleatórias, escalas, translações (deslocamentos), cortes e inversões (horizontais ou verticais). Estas ensinam o modelo a ser invariante à posição e orientação do objeto.
  • Transformações de espaço de cor: Estas modificam as propriedades de cor de uma imagem. Os ajustes ao brilho, contraste, saturação e matiz tornam o modelo mais resistente a alterações nas condições de iluminação.
  • Técnicas avançadas: Os métodos mais complexos envolvem a alteração do conteúdo da imagem de forma mais significativa. Estes podem incluir a adição de ruído aleatório (como o ruído Gaussiano), a aplicação de efeitos de desfocagem ou a utilização de métodos como o Mixup, que cria novas imagens através da combinação linear de duas imagens existentes, e o Cutout, que remove aleatoriamente regiões de uma imagem. Pode saber mais sobre estes métodos em O guia definitivo para o aumento de dados.

Muitas estruturas de aprendizagem profunda, como PyTorch e TensorFlow, fornecem ferramentas para o aumento de dados. Bibliotecas especializadas como a Albumentations oferecem uma vasta coleção de técnicas de aumento de alto desempenho e estão integradas em modelos como o Ultralytics YOLO11 para diversificar os dados de formação sem problemas.

Aplicações no mundo real

O aumento dos dados é uma prática corrente em muitos domínios para construir sistemas de IA mais fiáveis.

  1. IA nos cuidados de saúde: Na análise de imagens médicas, os conjuntos de dados são frequentemente pequenos devido aos regulamentos relativos à privacidade dos pacientes e à raridade de certas doenças. Para treinar um modelo de deteção de tumores em exames, as técnicas de aumento, como a rotação, o escalonamento e as alterações de brilho, criam um conjunto mais diversificado de exemplos de treino. Isto ajuda o modelo a identificar com precisão as anomalias, independentemente das variações do equipamento de imagiologia ou do posicionamento do doente, melhorando a fiabilidade do diagnóstico.
  2. IA para o sector automóvel: O desenvolvimento de sistemas robustos de deteção de objectos para veículos autónomos requer dados de inúmeros cenários de condução. Em vez de recolher dados para todas as condições possíveis, o aumento pode simular diferentes condições meteorológicas (por exemplo, adicionando chuva ou neve sintéticas), iluminação (dia, crepúsculo, noite) e oclusões (por exemplo, um peão parcialmente escondido por outro carro). Isto torna o sistema de perceção do veículo mais fiável em ambientes imprevisíveis do mundo real.

Outras aplicações importantes incluem a IA na indústria transformadora para controlo da qualidade e a IA na agricultura para detetar doenças das culturas em condições de campo variáveis.

Aumento de dados vs. conceitos relacionados

É importante distinguir o aumento de dados de outras técnicas relacionadas com os dados.

  • Dados sintéticos: Embora ambos os métodos melhorem os conjuntos de dados, funcionam de forma diferente. O aumento de dados modifica os dados reais existentes. Em contrapartida, a geração de dados sintéticos cria dados artificiais inteiramente novos a partir do zero, utilizando simulações ou modelos generativos como os GAN. Enquanto o aumento expande a variância em torno dos dados observados, os dados sintéticos podem criar novos cenários não presentes no conjunto de dados original, um conceito explorado nesta visão geral dos dados sintéticos na visão computacional.
  • Limpeza de dados: A limpeza de dados é uma parte do pipeline de pré-processamento de dados mais amplo que se concentra na identificação e correção de erros, inconsistências e imprecisões num conjunto de dados. O seu objetivo é melhorar a qualidade dos dados. O aumento dos dados, por outro lado, consiste em aumentar a quantidade e a variedade dos dados. Um conjunto de dados limpo é o ponto de partida ideal antes de aplicar o aumento de dados.
  • Aprendizagem por transferência: Esta técnica envolve a utilização de um modelo pré-treinado num grande conjunto de dados de referência como o ImageNet e, em seguida, o seu ajuste fino num conjunto de dados mais pequeno e específico da tarefa. O aumento de dados é frequentemente utilizado durante a fase de aperfeiçoamento para melhorar o desempenho e evitar o sobreajuste nos novos dados.

Plataformas como o Ultralytics HUB simplificam todo o processo de formação de modelos, incorporando o aumento de dados como um passo fundamental para ajudar os utilizadores a criar modelos de IA de visão poderosos e de última geração.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência