Glossário

Aumento de Dados

Explore como o aumento de dados melhora a robustez do modelo e reduz o sobreajuste. Aprenda técnicas essenciais para melhorar o desempenho Ultralytics para visão computacional.

O aumento de dados é uma técnica crítica em aprendizagem automática e visão computacional usada para aumentar artificialmente o tamanho e a diversidade de um conjunto de dados de treino, criando versões modificadas dos dados existentes. Em vez de recolher e rotular dados totalmente novos — o que pode ser demorado e caro —, o aumento aplica várias transformações às amostras originais. Essas modificações ajudam os modelos de aprendizagem automática a aprender a reconhecer padrões de forma mais robusta, garantindo um bom desempenho mesmo quando encontram variações em ambientes do mundo real. Ao expor os modelos a uma gama mais ampla de cenários durante o treinamento, os desenvolvedores podem reduzir efetivamente o sobreajuste e melhorar a generalização.

Relevância na IA moderna

No campo da visão computacional, os modelos muitas vezes têm dificuldade quando apresentados a imagens que diferem ligeiramente dos seus dados de treino. Variações na iluminação, orientação ou desordem no fundo podem confundir um modelo que não tenha visto diversidade suficiente. O aumento de dados resolve isso simulando essas variações programaticamente. Por exemplo, uma imagem de um gato pode ser rodada, invertida ou ligeiramente desfocada para ensinar ao modelo que o objeto continua a ser um «gato», independentemente dessas alterações.

Este processo é essencial para o sucesso de arquiteturas modernas como o Ultralytics , que depende de conjuntos de dados ricos e variados para alcançar alta precisão em tarefas como detecção de objetos e segmentação de imagens. Ao sintetizar novos exemplos de treino, o aumento permite que os modelos aprendam características invariáveis — características que não mudam apesar das alterações na entrada.

Técnicas e métodos comuns

O aumento de dados abrange uma ampla gama de técnicas de transformação, que vão desde ajustes geométricos simples até abordagens generativas complexas:

Transformações geométricas: incluem operações como rotação, dimensionamento, inversão, recorte e translação (deslocamento) de imagens. Representam alterações no ponto de vista da câmara ou na posição do objeto.
Ajustes do espaço de cor: modificar o brilho, o contraste, a saturação e a tonalidade ajuda os modelos a lidar com diferentes condições de iluminação ou sensores de câmara.
Injeção de ruído: adicionar ruído aleatório (como ruído gaussiano) pode tornar os modelos mais resilientes a dados de entrada granulados ou de baixa qualidade.
Mistura de imagens: técnicas como MixUp Mosaic (populares no YOLO ) combinam várias imagens em uma única amostra de treinamento, forçando o modelo a aprender o contexto e as relações entre objetos de forma mais eficaz.
Abordagens generativas: métodos avançados utilizam IA generativa ou modelos de difusão para criar amostras de treino sintéticas totalmente novas, que imitam as características do conjunto de dados original.

Aplicações no Mundo Real

O impacto prático do aumento de dados abrange vários setores onde a escassez ou a alta variabilidade de dados são um desafio.

Condução autónoma

No desenvolvimento de veículos autónomos, é quase impossível recolher dados para todas as condições meteorológicas ou cenários de iluminação possíveis. Os engenheiros utilizam o aumento de dados para simular chuva, nevoeiro, neve ou brilho em imagens de tempo claro. Isto garante que o sistema de perceção consiga detect de forma fiável detect , sinais de trânsito e outros veículos, independentemente dos fatores ambientais, aumentando a segurança e a fiabilidade.

Imagiologia Médica

A análise de imagens médicas muitas vezes sofre com conjuntos de dados limitados devido a questões de privacidade e à raridade de certas condições. O aumento permite que os investigadores expandam pequenos conjuntos de dados de raios-X ou ressonâncias magnéticas aplicando deformações elásticas, rotações ou mudanças de intensidade. Isso ajuda a treinar modelos de diagnóstico robustos, capazes de identificar tumores ou fraturas com alta sensibilidade, mesmo quando o posicionamento do paciente ou a qualidade da imagem variam.

Distinguir conceitos relacionados

É importante diferenciar o aumento de dados dos dados sintéticos. Embora ambos tenham como objetivo aumentar o tamanho do conjunto de dados, os dados sintéticos são gerados artificialmente a partir do zero (geralmente usando renderização 3D ou motores de simulação), enquanto o aumento de dados modifica os dados reais existentes. Além disso, o pré-processamento de dados envolve a limpeza e formatação dos dados (por exemplo, redimensionamento, normalização) para torná-los adequados para um modelo, mas, ao contrário do aumento, não aumenta necessariamente o número de amostras de treino.

Implementando o aumento com Ultralytics

As estruturas modernas integram o aumento diretamente no pipeline de treino. O exemplo abaixo demonstra como aplicar aumentos como inversão e dimensionamento durante o treino de um modelo YOLO26 usando o ultralytics pacote.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)

Ao ajustar esses hiperparâmetros, os programadores podem adaptar a estratégia de aumento às necessidades específicas do seu conjunto de dados e aplicação, aproveitando a flexibilidade da Ultralytics para o desenvolvimento eficiente de modelos.

Aumento de Dados

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Relevância na IA moderna

Técnicas e métodos comuns

Aplicações no Mundo Real

Condução autónoma

Imagiologia Médica

Distinguir conceitos relacionados

Implementando o aumento com Ultralytics

Leia mais nesta categoria

12 casos de uso de imagens aéreas com tecnologia de visão computacional

O que é a estimativa de profundidade monocular? Uma visão geral

Uma análise sobre o usoYOLO Ultralytics para deteção de ameaças por IA

Junte-se à comunidade Ultralytics