Glossário

Floresta aleatória

Descobre como o Random Forest, um poderoso algoritmo de aprendizagem de conjuntos, se destaca na classificação, regressão e aplicações de IA do mundo real.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

O Random Forest é um algoritmo de aprendizagem automática versátil e poderoso, amplamente utilizado para tarefas de classificação e regressão. Pertence à família dos métodos de aprendizagem em conjunto, que combinam vários modelos individuais para obter uma melhor precisão de previsão e robustez do que qualquer modelo individual poderia obter por si só.

O que é uma floresta aleatória?

Na sua essência, uma floresta aleatória funciona através da construção de um grande número de árvores de decisão durante a fase de treino. Para um problema de classificação, o resultado da Floresta Aleatória é a classe selecionada pela maioria das árvores. Para um problema de regressão, a previsão é a previsão média das árvores individuais. Essa abordagem aproveita o princípio da "sabedoria da multidão", em que um conjunto diversificado de modelos faz previsões mais precisas coletivamente.

Vários aspectos-chave definem uma Floresta Aleatória:

  • Árvores de decisão: Os componentes fundamentais de uma Floresta Aleatória são as árvores de decisão. Cada árvore é construída com base em um subconjunto aleatório dos dados de treinamento e um subconjunto aleatório das caraterísticas. Essa aleatoriedade é crucial para criar uma floresta de árvores diversificada. Podes aprender mais sobre árvores de decisão e outros algoritmos de aprendizagem automática em recursos como a documentação do Scikit-learn sobre algoritmos de árvore.
  • Ensacamento (Bootstrap Aggregating): As Random Forests utilizam uma técnica chamada bagging. O ensacamento envolve a criação de vários subconjuntos dos dados de treinamento originais com substituição (bootstrapping). Cada árvore de decisão é então treinada em um desses conjuntos de dados bootstrapped, introduzindo variabilidade e reduzindo o sobreajuste.
  • Aleatoriedade das caraterísticas: Para além do ensacamento, as Random Forests introduzem aleatoriedade na seleção de caraterísticas. Ao construir cada nó da árvore, apenas um subconjunto aleatório de caraterísticas é considerado para a divisão. Isto descorrelaciona ainda mais as árvores e aumenta a capacidade de generalização da floresta.

A força das Random Forests reside na sua capacidade de lidar com conjuntos de dados complexos e evitar o sobreajuste. Ao calcular a média das previsões de muitas árvores diferentes, o modelo reduz a variação e fornece resultados mais estáveis e precisos. Também são relativamente fáceis de usar e interpretar, o que as torna uma escolha popular em várias aplicações.

Aplicações do Random Forest

As florestas aleatórias são aplicadas numa vasta gama de domínios devido à sua precisão e versatilidade. Eis alguns exemplos concretos que ilustram a sua utilização em aplicações reais de IA e ML:

  • Análise de imagens médicas: Na área da saúde, as florestas aleatórias são utilizadas para análise de imagens médicas, ajudando no diagnóstico de doenças como o cancro a partir de imagens médicas como exames de ressonância magnética ou raios X. Ao analisar as caraterísticas e os padrões dos pixels, as florestas aleatórias podem classificar as imagens como normais ou indicativas de doença, ajudando os médicos a fazer diagnósticos mais rápidos e precisos. Isto pode ser crucial na deteção precoce e no planeamento do tratamento, melhorando os resultados para os pacientes.
  • Deteção de objectos em visão computacional: Embora os modelos Ultralytics YOLO sejam os mais avançados para a deteção de objectos, as Random Forests também podem desempenhar um papel em determinadas tarefas de visão computacional. Por exemplo, em cenários em que os recursos computacionais são limitados ou o desempenho em tempo real não é crítico, as florestas aleatórias podem ser utilizadas para a classificação de imagens e até para tarefas de deteção de objectos. Podem analisar caraterísticas de imagem extraídas através de técnicas como as redes neurais convolucionais (CNN) para identificar objectos em imagens. Para necessidades mais avançadas e em tempo real de deteção de objectos, Ultralytics YOLOv8 Os modelos de florestas de árvores oferecem um desempenho superior.

Tecnologias e ferramentas

Várias bibliotecas populares de aprendizagem automática fornecem implementações do algoritmo Random Forest. Scikit-learn, uma biblioteca Python amplamente utilizada, oferece uma implementação abrangente do Random Forest com várias opções de personalização. Outras bibliotecas como XGBoost e LightGBM também fornecem implementações eficientes de métodos de conjunto baseados em árvores, incluindo variações do Random Forest optimizadas para velocidade e desempenho.

Para os utilizadores interessados em tirar partido dos modelos mais avançados para tarefas de visão computacional, Ultralytics oferece o Ultralytics HUB, uma plataforma para treinar e implementarUltralytics YOLO que se destacam em tarefas como a deteção de objectos e a segmentação de imagens. Embora as Random Forests sirvam bem para muitas tarefas de aprendizagem automática, para aplicações de IA de visão de ponta, explorar Ultralytics YOLOv11 e o ecossistema Ultralytics pode ser altamente benéfico. Também podes explorar várias soluçõesUltralytics que utilizam modelos YOLO para aplicações reais.

Lê tudo