Glossário

Árvore de decisão

Descobre o poder das árvores de decisão na aprendizagem automática para classificação, regressão e aplicações do mundo real, como cuidados de saúde e finanças.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Uma árvore de decisão é um algoritmo fundamental na aprendizagem automática utilizado para tarefas de classificação e regressão. Trata-se de uma estrutura em forma de árvore em que cada nó interno representa uma caraterística (ou atributo), cada ramo representa uma regra de decisão e cada nó folha representa um resultado. A estrutura foi concebida para imitar o processo humano de tomada de decisão, tornando-o intuitivo e fácil de compreender. As árvores de decisão são populares devido à sua simplicidade, interpretabilidade e capacidade de tratar dados numéricos e categóricos. São amplamente utilizadas em vários domínios, incluindo a saúde, as finanças e o marketing, para tarefas como o diagnóstico, a avaliação de riscos e a segmentação de clientes.

Conceitos-chave e estrutura

As árvores de decisão são construídas através de um processo designado por particionamento recursivo. Este processo envolve a divisão dos dados em subconjuntos com base no valor de diferentes caraterísticas. O objetivo é criar subconjuntos que sejam tão homogéneos quanto possível em relação à variável-alvo.

  • Nó raiz: O nó mais alto da árvore, que representa o ponto de decisão inicial ou a caraterística que melhor divide os dados.
  • Nós internos: Nós que representam caraterísticas do conjunto de dados e ramificações para outros nós.
  • Ramos: Ligações entre nós, representando os valores possíveis da caraterística no nó pai.
  • Nós de folha: Nós terminais que representam os resultados finais ou valores previstos.

Construir uma árvore de decisão

O processo de construção de uma árvore de decisão envolve a seleção da melhor caraterística para dividir os dados em cada nó. Esta seleção é baseada em critérios que medem a homogeneidade dos subconjuntos resultantes. Os critérios mais comuns incluem:

  • Impureza de Gini: Mede a probabilidade de classificar incorretamente um elemento escolhido ao acaso.
  • Ganho de informação: Baseado no conceito de entropia, mede a redução da incerteza sobre a variável alvo dado o conhecimento de uma caraterística.
  • Redução da variância: Utilizada em tarefas de regressão, mede a redução da variância da variável alvo.

Sabe mais sobre o ajuste de hiperparâmetros para otimizar o desempenho das árvores de decisão e de outros modelos de aprendizagem automática.

Vantagens das árvores de decisão

As árvores de decisão são preferidas pela sua capacidade de interpretação e facilidade de utilização. Podem tratar dados numéricos e categóricos sem exigir um pré-processamento exaustivo dos dados. Além disso, as árvores de decisão podem captar relações não lineares e interações entre caraterísticas, o que as torna versáteis para uma vasta gama de aplicações. A natureza visual das árvores de decisão permite uma fácil compreensão do processo de decisão, o que é particularmente valioso em domínios em que a transparência é crucial, como a análise de imagens médicas e as finanças.

Aplicações no mundo real

As árvores de decisão são utilizadas em várias aplicações do mundo real, demonstrando a sua versatilidade e eficácia.

Diagnóstico médico

Nos cuidados de saúde, as árvores de decisão são utilizadas para ajudar no diagnóstico de doenças com base nos sintomas do doente e nos resultados dos testes. Por exemplo, uma árvore de decisão pode ajudar a determinar a probabilidade de um doente ter diabetes com base em factores como a idade, o IMC, o historial familiar e os níveis de glicose no sangue. A estrutura em árvore permite aos médicos seguir um caminho claro de decisões, conduzindo a um diagnóstico. Explora a forma como a IA está a melhorar a imagiologia médica.

Pontuação de crédito

As instituições financeiras utilizam árvores de decisão para avaliar o risco de crédito. Ao analisar factores como o rendimento, o historial de crédito, a situação profissional e o montante do empréstimo, uma árvore de decisão pode prever a probabilidade de um mutuário não pagar um empréstimo. Isto ajuda os bancos a tomar decisões de empréstimo informadas e a gerir o risco de forma eficaz. Sabe mais sobre as aplicações da IA nas finanças.

Árvores de decisão vs. outros algoritmos

Embora as árvores de decisão sejam poderosas, são frequentemente comparadas com outros algoritmos de aprendizagem automática.

  • Floresta aleatória: Um método de conjunto que constrói várias árvores de decisão e funde os seus resultados para melhorar a precisão e controlar o sobreajuste. Descobre mais sobre o Random Forest.
  • Máquinas de vectores de suporte (SVM): Eficazes para dados de elevada dimensão e conjuntos de dados complexos, mas menos interpretáveis do que as árvores de decisão. Explora as SVMs em pormenor.
  • Redes neurais: Altamente flexíveis e capazes de aprender padrões complexos, mas requerem mais dados e são menos interpretáveis. Aprende sobre Redes Neuronais.

Desafios e limitações

Apesar das suas vantagens, as árvores de decisão têm limitações. Elas podem ser propensas ao sobreajuste, especialmente quando a árvore é muito profunda. O sobreajuste ocorre quando a árvore capta o ruído nos dados de treinamento, o que leva a uma generalização deficiente em dados novos e não vistos. Técnicas como a poda, a definição de um número mínimo de amostras por folha ou a limitação da profundidade máxima da árvore podem ajudar a mitigar esse problema. Saiba mais sobre sobreajuste.

Além disso, as árvores de decisão podem nem sempre captar as relações mais complexas nos dados, uma vez que tomam decisões com base numa única caraterística em cada nó. Os métodos de conjunto, como o Random Forest e o Gradient Boosting, podem muitas vezes proporcionar um melhor desempenho de previsão através da combinação de várias árvores de decisão.

Para explorar melhor os modelos de deteção de objectos e o seu desempenho, visita a documentação dos modelosUltralytics YOLO .

Lê tudo