Glossário

Floresta aleatória

Descobre como o Random Forest melhora a IA e o ML com elevada precisão, versatilidade e aplicações reais em cuidados de saúde, finanças e muito mais.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

O Random Forest é um algoritmo de aprendizagem automática versátil e amplamente utilizado, conhecido pela sua elevada precisão e capacidade de lidar com um grande número de variáveis de entrada. É um método de aprendizagem de conjunto que funciona através da construção de uma multiplicidade de árvores de decisão durante o treino e da produção da classe que é a moda das classes (classificação) ou a previsão média (regressão) das árvores individuais. Esta abordagem ajuda a reduzir o sobreajuste e a melhorar a generalização do modelo.

Conceitos-chave e como funciona

O Random Forest baseia-se no conceito de árvores de decisão, que são estruturas semelhantes a árvores em que cada nó interno representa uma caraterística, cada ramo representa uma regra de decisão e cada nó de folha representa o resultado. O Random Forest aprimora isso criando várias árvores de decisão usando subconjuntos aleatórios dos dados de treinamento e subconjuntos aleatórios das caraterísticas. Essa aleatoriedade ajuda a descorrelacionar as árvores, tornando o modelo geral mais robusto.

Durante o treino, cada árvore da floresta é construída utilizando uma técnica denominada "bagging" (agregação bootstrap). O ensacamento envolve a amostragem aleatória dos dados de treinamento com substituição, o que significa que alguns pontos de dados podem ser incluídos várias vezes no conjunto de treinamento de uma única árvore, enquanto outros podem ser deixados de fora. Além disso, em cada nó da árvore, um subconjunto aleatório de caraterísticas é considerado para divisão, em vez de todo o conjunto de caraterísticas. Isto aumenta ainda mais a diversidade entre as árvores.

Ao fazer previsões, cada árvore da floresta "vota" no resultado, e a previsão final é determinada pelo voto da maioria (para classificação) ou pela média das previsões individuais das árvores (para regressão). Esta abordagem de conjunto ajuda a suavizar as previsões e a reduzir a variância do modelo.

Relevância na IA e na aprendizagem automática

O Random Forest é altamente relevante nos domínios da Inteligência Artificial (IA) e da Aprendizagem Automática (AM) devido ao seu forte desempenho, facilidade de utilização e capacidade de lidar com vários tipos de dados. É frequentemente utilizado como modelo de referência para comparação com outros algoritmos. A capacidade do algoritmo para lidar com dados de elevada dimensão, valores em falta e estimativa da importância das caraterísticas torna-o uma ferramenta valiosa em muitas aplicações.

Aplicações e exemplos do mundo real

O Random Forest tem uma vasta gama de aplicações em vários sectores. Eis dois exemplos concretos:

  1. Cuidados de saúde: Na área da saúde, o Random Forest pode ser utilizado para previsão e diagnóstico de doenças. Por exemplo, pode ser treinado em dados de pacientes, incluindo histórico médico, sintomas e resultados de testes, para prever a probabilidade de desenvolver uma doença específica, como diabetes ou doença cardíaca. A capacidade do modelo para lidar com interações complexas entre variáveis torna-o adequado para estas tarefas. Podes ler mais sobre a IA nos cuidados de saúde no sítio Web Ultralytics .
  2. Finanças: No sector financeiro, o Random Forest pode ser utilizado para pontuação de crédito e deteção de fraude. Por exemplo, pode ser treinado em dados de transacções de clientes para identificar padrões indicativos de actividades fraudulentas. A capacidade do modelo para lidar com grandes conjuntos de dados e identificar caraterísticas importantes torna-o eficaz na deteção de padrões subtis que podem ser ignorados por outros algoritmos. Um recurso relevante é este artigo sobre IA nas finanças.

Termos distintos

O Random Forest está intimamente relacionado com as árvores de decisão, mas difere na sua natureza de conjunto. Enquanto uma única árvore de decisão pode ser propensa a sobreajuste e alta variância, o Random Forest atenua esses problemas combinando várias árvores. Outro termo relacionado é Gradient Boosting, que também constrói um conjunto de árvores de decisão, mas o faz sequencialmente, com cada árvore corrigindo os erros das anteriores. O Random Forest, por outro lado, constrói árvores de forma independente e em paralelo.

Tecnologias e ferramentas

Várias bibliotecas populares de aprendizagem automática fornecem implementações do algoritmo Random Forest. Scikit-learn, uma biblioteca Python muito utilizada, oferece uma implementação abrangente do Random Forest com várias opções de personalização. Outras bibliotecas como XGBoost e LightGBM também fornecem implementações eficientes de métodos de conjunto baseados em árvores, incluindo variações do Random Forest. Também podes explorar os modelos Ultralytics YOLO para outras tarefas de visão computacional no siteUltralytics . Também podes saber mais sobre Ultralytics na página Sobre.

Ao compreender os princípios e as aplicações do Random Forest, os profissionais podem tirar partido deste poderoso algoritmo para criar modelos robustos e precisos para uma vasta gama de tarefas. Quer sejas novo na aprendizagem automática ou um programador experiente, explorar as capacidades do Random Forest pode melhorar significativamente o teu conjunto de ferramentas de IA.

Lê tudo