Glossário

Conjunto

Aumenta a precisão da previsão com métodos de conjunto! Aprende como a combinação de vários modelos melhora o desempenho na deteção de objectos, PNL e muito mais.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Na aprendizagem automática, um método Ensemble é uma técnica que combina as previsões de vários modelos individuais para produzir uma previsão mais exacta e robusta do que qualquer modelo individual poderia conseguir sozinho. Funciona com base no princípio frequentemente descrito como a"sabedoria da multidão", em que a decisão colectiva de vários modelos diversos é normalmente superior à decisão de um modelo especializado. Esta abordagem é particularmente poderosa em tarefas complexas da inteligência artificial (IA), como a deteção de objectos, a classificação de imagens e o processamento de linguagem natural, em que confiar numa única perspetiva pode conduzir a erros ou limitações.

Conceitos fundamentais dos métodos de ensemble

Os métodos de conjunto tiram partido da diversidade entre vários modelos (frequentemente designados por aprendentes de base ou aprendentes fracos) para reduzir os erros de previsão e melhorar o desempenho global. A ideia central é que diferentes modelos podem cometer diferentes tipos de erros em diferentes subconjuntos de dados. Ao combinar as suas previsões, estes erros podem frequentemente ser calculados ou cancelados, conduzindo a um modelo final mais estável e generalizado que tem um bom desempenho em dados não vistos. A chave para o sucesso dos métodos de conjunto é garantir uma diversidade suficiente entre os modelos de base. Esta diversidade pode ser alcançada através de várias estratégias, como a utilização de diferentes algoritmos de aprendizagem (por exemplo, a combinação de árvores de decisão e SVMs), modelos de treino em diferentes subconjuntos de dados de treino (como no Bagging) ou a utilização de diferentes hiperparâmetros para o mesmo algoritmo.

Vantagens da utilização de métodos de conjunto

A utilização de métodos de conjunto oferece várias vantagens significativas na aprendizagem automática (ML):

  • Precisão de previsão melhorada: Os conjuntos atingem frequentemente uma maior precisão do que qualquer modelo individual.
  • Aumenta a robustez e a estabilidade: A previsão final é menos sensível às peculiaridades de um único modelo ou a variações nos dados de treino.
  • Reduz o risco de sobreajuste: Ao calcular a média das previsões, os conjuntos podem atenuar a tendência dos modelos complexos para se ajustarem demasiado aos dados de treino.

Tipos de métodos de conjunto

Existem várias técnicas de conjunto populares, cada uma com uma abordagem distinta à combinação de modelos:

  • Bagging (Bootstrap Aggregating): Treina várias instâncias do mesmo algoritmo de base em diferentes subconjuntos aleatórios dos dados de treino (extraídos com substituição) e calcula a média das suas previsões. O Random Forest é um exemplo bem conhecido.
  • Reforço: Constrói modelos sequencialmente, com cada novo modelo focando na correção dos erros cometidos pelos anteriores. Exemplos incluem AdaBoost, Gradient Boosting Machines (GBMs), XGBoost e LightGBM.
  • Empilhamento (Generalização Empilhada): Combina previsões de vários modelos de base diferentes (alunos heterogéneos) treinando um meta-modelo (por exemplo, regressão logística) para aprender a melhor forma de combinar os seus resultados.

O termo "Model Ensemble" é frequentemente utilizado como sinónimo de "Ensemble" e refere-se ao mesmo conceito de combinação de vários modelos. Podes explorar estratégias para o Model Ensembling com o YOLOv5.

Aplicações reais de métodos de conjunto

Os métodos de conjunto são amplamente utilizados em vários domínios para melhorar o desempenho dos sistemas de IA:

  1. Visão computacional: Em tarefas como a deteção de objectos utilizando modelos como Ultralytics YOLOo ensembling pode envolver a combinação de previsões de modelos treinados com diferentes aumentos ou em diferentes fases(pontos de controlo). Isto melhora a robustez da deteção em cenários difíceis, como condições meteorológicas variáveis ou oclusões de objectos, cruciais para aplicações como veículos autónomos e sistemas de segurança.
  2. Diagnóstico médico: Os conjuntos são utilizados na análise de imagens médicas para combinar diagnósticos de diferentes algoritmos ou modelos treinados em diversos dados de pacientes. Por exemplo, a combinação de resultados de uma CNN e de um Vision Transformer (ViT) pode fornecer uma previsão mais fiável para a deteção de anomalias em exames, reduzindo o risco de erros de diagnóstico.

Embora poderosos, os conjuntos aumentam a complexidade e os requisitos computacionais para a formação e a implementação de modelos. No entanto, os ganhos significativos em desempenho muitas vezes justificam esses custos em aplicações críticas. Plataformas como o Ultralytics HUB podem simplificar o gerenciamento e o treinamento de vários modelos, facilitando a criação de conjuntos eficazes.

Lê tudo