Glossário

Árvore de decisão

Descubra o poder das árvores de decisão na aprendizagem automática para classificação, regressão e aplicações do mundo real, como cuidados de saúde e finanças.

Uma árvore de decisão é um modelo popular e intuitivo de aprendizagem automática (ML) que utiliza uma estrutura semelhante a uma árvore para efetuar previsões. Funciona dividindo um conjunto de dados em subconjuntos cada vez mais pequenos e desenvolvendo simultaneamente uma árvore de decisão associada. O resultado final é uma árvore com nós de decisão e nós folha. Um nó de decisão representa uma caraterística ou atributo, um ramo representa uma regra de decisão e cada nó de folha representa um resultado ou uma etiqueta de classe. Devido ao facto de a sua estrutura se assemelhar a um fluxograma, é um dos modelos mais simples de compreender e interpretar, o que o torna uma pedra angular da modelação preditiva.

Como funcionam as árvores de decisão

O processo de construção de uma árvore de decisão envolve a divisão recursiva dos dados de treino com base nos valores de diferentes atributos. O algoritmo escolhe o melhor atributo para dividir os dados em cada etapa, com o objetivo de tornar os subgrupos resultantes tão "puros" quanto possível - o que significa que cada grupo é constituído principalmente por pontos de dados com o mesmo resultado. Este processo de divisão é frequentemente orientado por critérios como a impureza de Gini ou o ganho de informação, que medem o nível de desordem ou aleatoriedade nos nós.

A árvore começa com um único nó raiz que contém todos os dados. De seguida, divide-se em nós de decisão, que representam perguntas sobre os dados (por exemplo, "A idade do cliente é superior a 30 anos?"). Estas divisões continuam até que os nós sejam puros ou até que seja cumprida uma condição de paragem, como uma profundidade máxima da árvore. Os nós finais, não divididos, são chamados de nós folha e fornecem a previsão final para qualquer ponto de dados que os alcance. Por exemplo, um nó folha pode classificar uma transação como "fraudulenta" ou "não fraudulenta". Esta interpretabilidade é uma vantagem fundamental, frequentemente destacada nas discussões sobre IA explicável (XAI).

Aplicações no mundo real

As árvores de decisão são versáteis e utilizadas tanto para tarefas de classificação como de regressão em vários sectores.

IA nos cuidados de saúde para diagnóstico: Pode ser utilizada uma árvore de decisão para criar um modelo de diagnóstico preliminar. O modelo utilizaria dados do doente, como sintomas (febre, tosse), idade e resultados laboratoriais, como entradas (caraterísticas). A árvore seguiria então uma série de regras de decisão para prever a probabilidade de uma doença específica. Por exemplo, uma divisão pode basear-se no facto de um doente ter ou não febre, seguida de outra divisão baseada na gravidade da tosse, conduzindo finalmente a um nó folha que sugere um diagnóstico provável. Isto fornece um caminho claro e baseado em regras para os profissionais médicos seguirem. Mais informações sobre este domínio podem ser encontradas no Instituto Nacional de Imagem Biomédica e Bioengenharia (NIBIB).
Serviços financeiros para avaliação do risco de crédito: Os bancos e as instituições financeiras utilizam árvores de decisão para determinar a elegibilidade do empréstimo. O modelo analisa os dados do candidato, como a pontuação de crédito, o rendimento, o montante do empréstimo e o historial de emprego. A árvore pode primeiro dividir-se com base na pontuação de crédito. Se a pontuação for elevada, segue um caminho; se for baixa, outro. As divisões subsequentes com base no rendimento e na duração do empréstimo ajudam a classificar o candidato como de baixo ou alto risco, influenciando a decisão de aprovação do empréstimo. Esta aplicação é uma parte essencial da IA no sector financeiro.

Relação com outros modelos

As árvores de decisão constituem a base para métodos de conjunto mais complexos que, frequentemente, produzem uma maior precisão.

Florestas aleatórias: Este modelo popular constrói várias árvores de decisão em diferentes subconjuntos aleatórios de dados e caraterísticas. Em seguida, agrega as suas previsões (através de votação para classificação ou cálculo da média para regressão), o que melhora o desempenho e torna o modelo mais robusto contra o sobreajuste.
Árvores com reforço de gradiente: Modelos como o XGBoost e o LightGBM são técnicas de conjunto avançadas que constroem árvores de decisão sequencialmente, em que cada nova árvore corrige os erros da anterior.
Agrupamento K-Means: É importante distinguir as árvores de decisão dos algoritmos de agrupamento. O K-Means é um método de aprendizagem não supervisionado para agrupar dados não etiquetados, enquanto as árvores de decisão são utilizadas na aprendizagem supervisionada para efetuar previsões com base em dados etiquetados.
Redes Neuronais Convolucionais (CNNs): Embora poderosas para problemas com dados tabulares, as árvores de decisão são menos eficazes para dados de elevada dimensão, como as imagens. Na visão computacional, são utilizados modelos como as CNN e os Transformadores de Visão (ViT). As arquitecturas mais avançadas, como o Ultralytics YOLO11, tiram partido destas estruturas de aprendizagem profunda para tarefas complexas como a deteção de objectos, a classificação de imagens e a segmentação de instâncias.

A compreensão de modelos fundamentais como as árvores de decisão fornece um contexto valioso no cenário mais amplo da inteligência artificial (IA). Ferramentas como o Scikit-learn fornecem implementações populares para árvores de decisão, enquanto plataformas como o Ultralytics HUB simplificam o desenvolvimento e a implantação de modelos de visão avançados para casos de uso mais complexos.

Árvore de decisão

Solução flexível de licenciamento empresarial para impulsionar a sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Treine modelos YOLO de forma simples com o Ultralytics HUB

Como funcionam as árvores de decisão

Aplicações no mundo real

Relação com outros modelos

Ler mais nesta categoria

Guia ERP para a indústria transformadora

Sistema de execução do fabrico (MES): Produção orientada para a IA

Compreender o fabrico aditivo: Tecnologia e casos de utilização

Junte-se à comunidade Ultralytics