Glossário

Validação cruzada

Descobre o poder da validação cruzada na aprendizagem automática! Aprende como evita o sobreajuste, garante a precisão e ajuda na seleção de modelos.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A validação cruzada é uma técnica estatística utilizada na aprendizagem automática e na inteligência artificial para avaliar o desempenho de um modelo, testando-o em subconjuntos de dados que não foram utilizados durante a formação. Assegura que o modelo generaliza bem para dados novos e não vistos e ajuda a evitar o sobreajuste. Ao dividir o conjunto de dados em várias partes ou "dobras", a validação cruzada testa sistematicamente o modelo em diferentes partes dos dados, fornecendo uma medida robusta da sua eficácia.

Como funciona a validação cruzada

A ideia central da validação cruzada consiste em dividir o conjunto de dados em subconjuntos de treino e de teste várias vezes. O modelo é treinado num subconjunto e testado noutro, rodando através do conjunto de dados para garantir que cada ponto de dados é utilizado para treino e validação pelo menos uma vez. A técnica mais comummente utilizada é K-Fold Cross-Validationonde o conjunto de dados é dividido em K dobras de igual tamanho:

  • O modelo é treinado em K-1 dobra e testa a dobra restante.
  • Este processo repete-se K vezes, cada vez utilizando uma dobra diferente como conjunto de teste.
  • Calcula a média dos resultados de todas as iterações para obter uma métrica de desempenho final.

Outras variações incluem a validação cruzada leave-one-out (LOOCV), em que cada ponto de dados é utilizado uma vez como conjunto de teste, e a validação cruzada estratificada K-Fold, que mantém a distribuição das classes entre as dobras, o que a torna ideal para conjuntos de dados desequilibrados.

Vantagens da validação cruzada

A validação cruzada oferece várias vantagens na avaliação de modelos:

  • Melhor generalização: Ao testar dados não vistos, a validação cruzada garante que o modelo não está a ajustar-se excessivamente ao conjunto de dados de treino.
  • Métricas fiáveis: A média dos resultados de várias dobras fornece uma estimativa mais precisa e estável do desempenho do modelo.
  • Seleção de modelos: A validação cruzada ajuda a comparar diferentes modelos ou definições de hiperparâmetros para escolher o de melhor desempenho.

Sabe mais sobre como evitar o sobreajuste e a generalização na aprendizagem automática na página do glossário sobreajuste.

Aplicações em IA e ML

A validação cruzada é amplamente utilizada em várias aplicações de IA e ML para garantir que os modelos são robustos e fiáveis:

1. Afinação de hiperparâmetros

A validação cruzada desempenha um papel fundamental na otimização dos hiperparâmetros através de técnicas como a pesquisa em grelha ou a pesquisa aleatória. Ao avaliar várias combinações de parâmetros em diferentes dobras, os profissionais podem identificar a melhor configuração. Explora mais sobre o ajuste de hiperparâmetros para melhorar o desempenho do modelo.

2. Comparação de modelos

Ao selecionar entre diferentes algoritmos, como Support Vetor Machines (SVMs) ou Random Forests, a validação cruzada fornece uma comparação justa ao avaliar cada modelo em condições idênticas. Sabe mais sobre Random Forest e Support Vetor Machines (SVM).

3. Aplicações no mundo real

  • Cuidados de saúde: Na análise de imagens médicas, a validação cruzada garante que os modelos de diagnóstico, como os que identificam tumores cerebrais, se generalizam bem em diversos conjuntos de dados de pacientes. Explora o impacto da IA nos cuidados de saúde através da IA nos cuidados de saúde.
  • Retalho: Na previsão da procura no retalho, a validação cruzada ajuda os modelos a prever as vendas futuras com maior precisão, utilizando subconjuntos de dados históricos para validação. Sabe como a IA transforma o retalho em IA para uma gestão de inventário de retalho mais inteligente.

Validação cruzada vs. conceitos relacionados

Validação cruzada vs. dados de validação

Enquanto a validação cruzada envolve o particionamento dinâmico do conjunto de dados, os dados de validação referem-se a um subconjunto fixo reservado para avaliação de desempenho durante o treinamento. Sabe mais na página do glossário Dados de validação.

Validação cruzada vs. dados de teste

Os dados de teste são usados para avaliação final após o treinamento e a validação do modelo, enquanto a validação cruzada divide os dados de treinamento em vários subconjuntos para avaliação intermediária. Para obter mais detalhes, visita a página do glossário Dados de teste.

Validação cruzada vs. prevenção de sobreajuste

A validação cruzada é uma estratégia fundamental para identificar e atenuar o sobreajuste. Embora técnicas como camadas de dropout ou regularização também ajudem, a validação cruzada fornece evidência empírica do desempenho do modelo. Lê mais na página do glossário Regularização.

Conclusão

A validação cruzada é uma ferramenta indispensável na aprendizagem automática, garantindo que os modelos são exactos e generalizáveis. Ao testar rigorosamente dados não vistos e calcular a média dos resultados, fornece métricas de desempenho fiáveis que orientam a seleção e o ajuste do modelo. Para uma implementação prática da validação cruzada na deteção de objectos, explora a validação cruzada K-Fold para deteção de objectos utilizando Ultralytics YOLO no Ultralytics HUB.

Para começar a trabalhar com projectos de IA ou formação de modelos, visita o Ultralytics HUB para obteres ferramentas e recursos intuitivos.

Lê tudo