Glossário

Floresta aleatória

Descobre como o Random Forest, um poderoso algoritmo de aprendizagem de conjuntos, se destaca na classificação, regressão e aplicações de IA do mundo real.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

O Random Forest é um algoritmo de aprendizagem automática (ML) versátil e poderoso, amplamente utilizado para tarefas de classificação e regressão. Pertence à família dos métodos de aprendizagem em conjunto, que combinam vários modelos individuais para obter uma melhor precisão de previsão e robustez do que qualquer modelo individual poderia obter por si só. Proposto por Leo Breiman, baseia-se no conceito de árvores de decisão, introduzindo a aleatoriedade.

Como funcionam as florestas aleatórias

Na sua essência, uma floresta aleatória funciona através da construção de uma multiplicidade de árvores de decisão durante a fase de formação. Cada árvore é treinada em um subconjunto aleatório diferente dos dados de treinamento (uma técnica chamada bagging ou agregação bootstrap) e usa apenas um subconjunto aleatório de caraterísticas para decidir sobre a melhor divisão em cada nó. Esta dupla aleatoriedade ajuda a descorrelacionar as árvores, tornando o conjunto mais robusto.

Para um problema de classificação, o resultado final da Floresta Aleatória é a classe selecionada pelo voto maioritário de todas as árvores individuais. Para um problema de regressão, a previsão é normalmente a previsão média das árvores individuais. Essa abordagem aproveita a "sabedoria da multidão", em que um conjunto diversificado de modelos faz coletivamente previsões mais precisas e reduz significativamente o risco de sobreajuste, um problema comum com árvores de decisão individuais.

Caraterísticas principais

Vários aspectos-chave definem uma Floresta Aleatória:

  • Método de conjunto: Combina as previsões de várias árvores de decisão.
  • Ensacamento: Cada árvore é treinada em uma amostra bootstrapped do conjunto de dados original. Saiba mais sobre Bootstrap Aggregating (Bagging).
  • Aleatoriedade das caraterísticas: Em cada divisão de nó, apenas é considerado um subconjunto aleatório de caraterísticas.
  • Reduz a variância: O cálculo da média das previsões em muitas árvores descorrelacionadas reduz a variância geral do modelo.
  • Importância das caraterísticas: Pode fornecer estimativas da importância das caraterísticas, indicando quais as variáveis de entrada mais influentes nas previsões.

Aplicações do Random Forest

As Random Forests são aplicadas numa vasta gama de domínios devido à sua precisão, robustez e facilidade de utilização. Aqui tens alguns exemplos concretos:

  1. Finanças: Utilizado extensivamente para tarefas como a pontuação de crédito e a deteção de fraudes, em que a identificação de padrões complexos em dados financeiros é crucial.
  2. Cuidados de saúde: Aplicada em áreas como a previsão de doenças com base em registos de pacientes e até na análise de imagens médicas para identificar anomalias, embora a aprendizagem profunda domine frequentemente as tarefas baseadas em imagens. Explora as soluções de IA nos cuidados de saúde.

Tecnologias e ferramentas

Várias bibliotecas populares de aprendizagem automática fornecem implementações do algoritmo Random Forest. Scikit-learn, uma biblioteca Python amplamente utilizada, oferece uma implementação abrangente do Random Forest com opções para ajuste de hiperparâmetros. Outras bibliotecas, como a XGBoost e a LightGBM, fornecem implementações eficientes de métodos de conjunto baseados em árvores relacionadas, muitas vezes optimizadas para velocidade e desempenho em grandes conjuntos de dados.

Embora as Random Forests sejam excelentes com dados estruturados ou tabulares, são geralmente menos adequadas para tarefas que envolvem dados não estruturados, como imagens, em comparação com os modelos de aprendizagem profunda. Para tarefas de visão computacional de ponta, como deteção de objetos ou segmentação de imagens, modelos como Ultralytics YOLO da Ultralytics são normalmente preferidos. Podes treinar e implementar modelos YOLO utilizando plataformas como o Ultralytics HUB, que simplifica o ciclo de vida dos MLOps para projectos de IA de visão. Explora várias soluçõesUltralytics que utilizam modelos YOLO para aplicações do mundo real.

Lê tudo