Glossário

Compensação do desvio e da variância

Domina o compromisso entre desvio e variância na aprendizagem automática. Aprende técnicas para equilibrar a precisão e a generalização para um desempenho ótimo do modelo!

O compromisso entre enviesamento e variância é um conceito central na aprendizagem automática supervisionada (ML) que lida com o desafio de criar modelos que tenham um bom desempenho não só nos dados em que foram treinados, mas também em dados novos e não vistos. Descreve uma tensão inerente entre dois tipos de erros que um modelo pode cometer: erros devidos a pressupostos demasiado simplistas (enviesamento) e erros devidos a uma sensibilidade excessiva aos dados de treino (variância). Para se conseguir uma boa generalização, é necessário encontrar um equilíbrio cuidadoso entre estas duas fontes de erro.

Compreender o preconceito

O enviesamento refere-se ao erro introduzido pela aproximação de um problema complexo do mundo real com um modelo potencialmente mais simples. Um modelo com um viés elevado faz suposições fortes sobre os dados, ignorando padrões potencialmente complexos. Isto pode levar a um subajuste, em que o modelo não consegue captar as tendências subjacentes nos dados, resultando num fraco desempenho tanto nos dados de treino como nos dados de teste. Por exemplo, tentar modelar uma relação altamente curvilínea utilizando uma regressão linear simples resultaria provavelmente num viés elevado. A redução do enviesamento envolve frequentemente o aumento da complexidade do modelo, como a utilização de algoritmos mais sofisticados encontrados na aprendizagem profunda (DL) ou a adição de caraterísticas mais relevantes através da engenharia de caraterísticas.

Compreender o desvio

A variância refere-se ao erro introduzido porque o modelo é demasiado sensível às flutuações específicas, incluindo o ruído, presentes nos dados de treino. Um modelo com variância elevada aprende demasiado bem os dados de treino, essencialmente memorizando-os em vez de aprender os padrões gerais. Isto leva a um sobreajuste, em que o modelo tem um desempenho excecionalmente bom nos dados de treino, mas fraco em dados novos e não vistos, porque não aprendeu a generalizar. Os modelos complexos, como as redes neurais profundas (NN) com muitos parâmetros ou a regressão polinomial de alto grau, são mais propensos a uma variância elevada. As técnicas para reduzir a variação incluem a simplificação do modelo, a coleta de dados de treinamento mais diversificados (consulte o guia Coleta de dados e anotação) ou o uso de métodos como a regularização.

A troca

O cerne do tradeoff viés-variância é a relação inversa entre viés e variância no que diz respeito à complexidade do modelo. Ao diminuir o viés tornando um modelo mais complexo (por exemplo, adicionando camadas a uma rede neural), normalmente aumenta a sua variância. Por outro lado, se simplificares um modelo para diminuir a variância, muitas vezes aumentas o seu enviesamento. O modelo ideal encontra o ponto ideal que minimiza o erro total (uma combinação de viés, variância e erro irredutível) em dados não vistos. Este conceito é fundamental na aprendizagem estatística, tal como detalhado em textos como "The Elements of Statistical Learning".

Gerir o compromisso

A gestão bem sucedida do compromisso entre o desvio e a variância é fundamental para o desenvolvimento de modelos de ML eficazes. Várias técnicas podem ajudar-te:

Validação cruzada: Técnicas como K-Fold Cross-Validation ajudam a estimar o desempenho do modelo em dados não vistos e a avaliar o impacto da complexidade do modelo.
Regularização: Métodos como a regularização L1 e L2 adicionam penalizações à função de perda para desencorajar modelos demasiado complexos, reduzindo assim a variância.
Métodos de conjunto: A combinação de previsões de vários modelos (por exemplo, Random Forests, Gradient Boosting) pode muitas vezes obter uma tendência e uma variância inferiores às dos modelos individuais. Vê os conceitos de conjunto de modelos.
Seleção/Engenharia de caraterísticas: Escolher cuidadosamente as caraterísticas relevantes ou criar novas caraterísticas pode ajudar a simplificar a tarefa de aprendizagem do modelo, reduzindo potencialmente tanto o enviesamento como a variância. Explora a extração de caraterísticas.
Aumento de dados: Aumentar artificialmente o tamanho e a diversidade do conjunto de dados de treino pode ajudar os modelos a generalizar melhor e a reduzir a variância. Saiba mais sobre o uso de aumentos de Albumentations.
Afinação de hiperparâmetros: Otimizar os hiperparâmetros, como a taxa de aprendizagem ou a complexidade da arquitetura do modelo, ajuda a encontrar o melhor equilíbrio. Ultralytics oferece um guia de ajuste de hiperparâmetros. Verifica as Dicas de treinamento de modelos para obter mais informações.

Exemplos do mundo real

Análise de imagens médicas: Ao treinar um Ultralytics YOLO para a análise de imagens médicas, como a deteção de tumores, os programadores têm de equilibrar a capacidade do modelo para identificar sinais subtis de doença (baixa tendência) sem ser demasiado sensível ao ruído ou a variações entre exames (baixa variância). Um modelo demasiado ajustado (elevada variância) pode ter um bom desempenho nas imagens do hospital de treino, mas falhar em imagens de equipamentos diferentes, enquanto um modelo pouco ajustado (elevada tendência) pode não detetar indicadores críticos na fase inicial. Este equilíbrio é crucial para uma IA fiável nos cuidados de saúde.
Manutenção preditiva: Na IA na indústria transformadora, os modelos são utilizados para estratégias de manutenção preditiva. Um modelo que preveja a avaria de um equipamento precisa de ter uma tendência baixa para detetar sinais de aviso genuínos a partir dos dados do sensor. No entanto, se tiver uma variação elevada, pode desencadear falsos alarmes frequentes devido a flutuações operacionais normais ou ao ruído do sensor, reduzindo a confiança e a eficiência. Se encontrar o equilíbrio certo, garante uma manutenção atempada sem interrupções desnecessárias. Os modelos de Visão por Computador (CV) podem analisar o desgaste visual ou os padrões térmicos, exigindo um equilíbrio semelhante.

Conceitos relacionados

É fundamental distinguir o compromisso entre o enviesamento e a variância de outros tipos de enviesamento discutidos na IA:

Preconceitos na IA: Refere-se a erros sistemáticos que conduzem a resultados injustos ou discriminatórios, muitas vezes resultantes de preconceitos sociais reflectidos nos dados ou nas escolhas de conceção algorítmica. Preocupa-se principalmente com a ética e a equidade na IA.
Viés do conjunto de dados: Ocorre quando os dados de treino não são representativos da população do mundo real ou do espaço do problema, levando o modelo a aprender padrões distorcidos. Lê mais sobre como entender o viés do conjunto de dados.
Viés algorítmico: Este viés resulta do próprio algoritmo, potencialmente amplificando os enviesamentos presentes nos dados ou introduzindo novos enviesamentos devido à sua conceção.

Enquanto que a compensação entre o enviesamento e a variância se centra nas propriedades estatísticas do erro do modelo relacionadas com a complexidade e a generalização (afectando métricas como a precisão ou o mAP), o enviesamento da IA, o enviesamento do conjunto de dados e o enviesamento algorítmico dizem respeito a questões de justiça, equidade e representação. Abordar o tradeoff visa otimizar o desempenho preditivo (ver guiaYOLO Performance Metrics), enquanto que abordar outros enviesamentos visa garantir resultados éticos e equitativos. Ferramentas como o Ultralytics HUB podem ajudar a gerir conjuntos de dados e processos de formação(Cloud Training), o que, indiretamente, ajuda a monitorizar aspectos relacionados com o desempenho e potenciais problemas com os dados.

Compensação do desvio e da variância

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Compreender o preconceito

Compreender o desvio

A troca

Gerir o compromisso

Exemplos do mundo real

Conceitos relacionados

Lê mais blogues

Junta-te à comunidade Ultralytics

Compensação do desvio e da variância

Treina os modelos YOLO simplesmentecom Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Compreender o preconceito

Compreender o desvio

A troca

Gerir o compromisso

Exemplos do mundo real

Conceitos relacionados

Lê mais blogues

Junta-te à comunidade Ultralytics

Treina os modelos YOLO simplesmente
com Ultralytics HUB