Glossário

Conjunto

Aumenta a precisão da previsão com métodos de conjunto! Aprende como a combinação de vários modelos melhora o desempenho na deteção de objectos, PNL e muito mais.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Na aprendizagem automática, um método de conjunto é uma técnica que combina as previsões de vários modelos individuais para produzir uma previsão mais exacta e robusta do que qualquer modelo individual poderia conseguir sozinho. Pensa nisto como uma abordagem de "sabedoria da multidão", em que a decisão colectiva de vários modelos é frequentemente melhor do que a decisão de um modelo especializado. Esta abordagem é particularmente poderosa em tarefas complexas como a deteção de objectos, a classificação de imagens e o processamento de linguagem natural, em que as nuances dos dados podem ser ignoradas por um único algoritmo.

Conceitos fundamentais dos métodos de ensemble

Os métodos de conjunto tiram partido da diversidade de vários modelos para reduzir os erros e melhorar o desempenho global. O princípio fundamental é que modelos diferentes podem cometer erros diferentes e, ao combinar as suas previsões, esses erros podem ser calculados como média ou cancelados entre si. Isto conduz a um modelo mais estável e generalizado que tem um bom desempenho numa gama mais vasta de dados. A chave para o sucesso dos métodos de conjunto é garantir a diversidade entre os modelos de base. Esta diversidade pode ser alcançada através de várias técnicas, como a utilização de diferentes algoritmos, modelos de treino em diferentes subconjuntos de dados ou a variação dos parâmetros do mesmo algoritmo.

Vantagens da utilização de métodos de conjunto

A utilização de métodos de conjunto oferece várias vantagens na aprendizagem automática:

  • Precisão melhorada: Ao agregar as previsões de vários modelos, os conjuntos atingem frequentemente uma precisão mais elevada do que os modelos individuais. Isto deve-se ao facto de a previsão combinada ter menos probabilidades de ser influenciada pelos enviesamentos ou limitações de um único modelo.
  • Robustez e estabilidade: Os conjuntos são geralmente mais resistentes ao ruído e aos valores atípicos nos dados. Se um modelo for induzido em erro por dados ruidosos, os outros modelos do conjunto podem compensar, conduzindo a uma previsão mais estável e fiável.
  • Generalização melhorada: Os métodos de conjunto tendem a generalizar melhor para dados não vistos. Ao reduzir o sobreajuste, garante que o modelo tem um bom desempenho não só nos dados de treino, mas também em novos dados do mundo real. Saiba mais sobre sobreajuste e como evitá-lo.
  • Lida com problemas complexos: Os conjuntos são particularmente eficazes na resolução de problemas complexos de aprendizagem automática, em que nenhum modelo individual consegue captar todos os padrões subjacentes nos dados. Podem combinar os pontos fortes de diferentes modelos para abordar diferentes aspectos do problema.

Tipos de métodos de conjunto

Existem várias técnicas de conjunto populares, cada uma com a sua própria abordagem à combinação de vários modelos:

  • Ensacamento: O Bootstrap Aggregating, ou Bagging, envolve o treinamento de várias instâncias do mesmo algoritmo de base em diferentes subconjuntos aleatórios dos dados de treinamento, amostrados com substituição. O Random Forest é um exemplo bem conhecido de bagging, que utiliza árvores de decisão como modelos de base.
  • Impulsionamento: Os métodos de reforço treinam modelos de base sequencialmente, em que cada modelo subsequente tenta corrigir os erros cometidos pelos modelos anteriores. O XGBoost e o LightGBM são algoritmos de reforço de gradiente que são altamente eficazes e amplamente utilizados em competições de aprendizagem automática e em aplicações do mundo real.
  • Empilhamento: O empilhamento envolve o treino de um meta-modelo com base nas previsões de vários modelos de base. Os modelos de base são treinados nos dados originais e as suas previsões tornam-se as caraterísticas de entrada para o meta-modelo, que aprende a combinar estas previsões de forma óptima.
  • Votação: Os conjuntos de votação combinam simplesmente as previsões de vários modelos através de um voto maioritário (para classificação) ou de uma média (para regressão). Este é um método de conjunto simples, mas muitas vezes surpreendentemente eficaz.

Aplicações reais de métodos de conjunto

Os métodos de conjunto são utilizados em vários domínios para melhorar o desempenho dos sistemas de IA:

  1. Diagnóstico médico: Na análise de imagens médicas, os métodos de conjunto podem combinar previsões de diferentes modelos treinados para detetar doenças a partir de imagens médicas como raios X ou ressonâncias magnéticas. Por exemplo, um conjunto de Redes Neuronais Convolucionais (CNN) pode melhorar a precisão da deteção de tumores, ajudando a efetuar diagnósticos mais precoces e mais precisos. Ultralytics YOLO Os modelos de CNN podem fazer parte desses conjuntos para deteção precisa e em tempo real de objectos em imagens médicas.
  2. Previsão financeira: Os métodos de conjunto são também utilizados nos mercados financeiros para melhorar a exatidão das previsões dos preços das acções ou das avaliações de risco. Ao combinar previsões de diferentes modelos que captam vários indicadores e tendências do mercado, as instituições financeiras podem tomar decisões mais informadas e reduzir os erros de previsão. Por exemplo, conjuntos de Redes Neuronais Recorrentes (RNN) e modelos de séries temporais podem fornecer previsões financeiras mais fiáveis.

Os métodos de conjunto são uma ferramenta poderosa no conjunto de ferramentas de aprendizagem automática, oferecendo uma forma de aumentar significativamente o desempenho e a robustez do modelo numa vasta gama de aplicações. Plataformas como o Ultralytics HUB podem facilitar a formação e a implementação de vários modelos, que podem depois ser combinados em conjuntos eficazes para soluções de IA melhoradas. Para explorar melhor a aplicação prática dos modelos de aprendizagem automática, considera a possibilidade de investigar as opções de implementação de modelos.

Lê tudo