Glosario

Árbol de decisión

Descubre el poder de los árboles de decisión en el aprendizaje automático para la clasificación, la regresión y las aplicaciones del mundo real como la sanidad y las finanzas.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Un Árbol de Decisión es un algoritmo de aprendizaje automático (AM) versátil y muy utilizado, que pertenece a la categoría del aprendizaje supervisado. Utiliza una estructura en forma de árbol para modelar las decisiones y sus posibles consecuencias, similar a un diagrama de flujo. Cada nodo interno representa una prueba sobre un atributo (o característica), cada rama representa el resultado de la prueba, y cada nodo hoja representa una etiqueta de clase (en tareas de clasificación) o un valor continuo (en tareas de regresión). Debido a su estructura intuitiva, los árboles de decisión son conocidos por ser relativamente fáciles de entender e interpretar, lo que los hace valiosos para la IA explicable (XAI).

Cómo funcionan los árboles de decisión

La idea central es dividir el conjunto de datos en subconjuntos cada vez más pequeños en función de los valores de las características de entrada, creando una estructura de árbol. El proceso comienza en el nodo raíz, que representa todo el conjunto de datos. En cada nodo, el algoritmo selecciona la mejor característica y el mejor umbral para dividir los datos de forma que aumente la pureza u homogeneidad de los subconjuntos resultantes con respecto a la variable objetivo. Los criterios habituales para encontrar la mejor división incluyen la impureza de Gini y la ganancia de información (basada en la entropía), que miden el desorden o aleatoriedad de un conjunto. Este proceso de división continúa recursivamente hasta que se cumple un criterio de parada, como alcanzar una profundidad máxima, tener un número mínimo de muestras en un nodo o conseguir nodos hoja puros (nodos que contienen muestras de una sola clase). Para hacer una predicción para un nuevo punto de datos, recorre el árbol desde la raíz hasta un nodo hoja basándose en los resultados de las pruebas de características, y la predicción es la clase mayoritaria o el valor medio en esa hoja. El preprocesamiento cuidadoso de los datos y la ingeniería de características pueden influir significativamente en el rendimiento de un árbol de decisión.

Tipos de árboles de decisión

Los árboles de decisión pueden clasificarse en dos tipos principales:

  • Árboles de clasificación: Se utilizan cuando la variable objetivo es categórica (por ejemplo, predecir "spam" o "no spam"). Los nodos de las hojas representan etiquetas de clase.
  • Árboles de regresión: Se utilizan cuando la variable objetivo es continua (por ejemplo, la predicción del precio de la vivienda). Los nodos hoja representan un valor numérico predicho, a menudo la media de los valores objetivo de las muestras de entrenamiento que llegan a esa hoja.

Ventajas y desventajas

Los árboles de decisión ofrecen varias ventajas:

  • Interpretabilidad: Su estructura gráfica facilita su visualización y comprensión.
  • Mínima preparación de los datos: Suelen requerir menos limpieza de datos en comparación con otros algoritmos, por ejemplo, necesitan menos normalización de datos.
  • Maneja Datos No Lineales: Pueden captar relaciones no lineales entre las características y la variable objetivo.
  • Importancia de la característica: Proporcionan intrínsecamente una medida de la importancia de la característica basada en lo pronto o a menudo que se utiliza una característica para dividir.

Sin embargo, también tienen inconvenientes:

  • Sobreajuste: Los árboles de decisión pueden volverse fácilmente demasiado complejos y captar ruido en los datos de entrenamiento, lo que lleva a una generalización deficiente en datos de prueba no vistos. Técnicas como la poda o el establecimiento de restricciones en el crecimiento del árbol ayudan a mitigar el sobreajuste.
  • Inestabilidad: Pequeñas variaciones en los datos pueden hacer que se genere un árbol completamente distinto.
  • Sesgo: los árboles pueden estar sesgados hacia características con más niveles o clases dominantes si el conjunto de datos está desequilibrado.

Aplicaciones en el mundo real

Los árboles de decisión se emplean en diversos ámbitos:

  1. Diagnóstico médico: Ayudar a los médicos creando modelos que sugieran diagnósticos basados en los síntomas del paciente y los resultados de las pruebas. Por ejemplo, un árbol podría guiar el diagnóstico haciendo preguntas sobre los síntomas de forma secuencial(IA en aplicaciones sanitarias).
  2. Predicción de la pérdida de clientes: Las empresas utilizan árboles de decisión para identificar a los clientes susceptibles de dejar de utilizar su servicio basándose en patrones de uso, datos demográficos e historial de interacciones, lo que permite realizar esfuerzos de retención específicos(Predicción de la pérdida de clientes).
  3. Evaluación del riesgo financiero: Evaluación de la solvencia mediante el análisis de factores como los ingresos, las deudas y el historial crediticio(Modelos de visión por ordenador en finanzas).
  4. Control de calidad en la fabricación: Identificación de posibles defectos en los productos a partir de las lecturas de los sensores o los parámetros del proceso(Mejora de la fabricación con visión por ordenador).

Relación con otros modelos

Los árboles de decisión son la base de métodos de conjunto más complejos, como los Bosques Aleatorios y los Árboles de Gradiente Potenciado (como XGBoost o LightGBM). Los Bosques Aleatorios, por ejemplo, construyen múltiples árboles de decisión sobre diferentes subconjuntos de datos y características y agregan sus predicciones, lo que a menudo conduce a una mayor precisión y solidez frente al sobreajuste en comparación con un solo árbol. Aunque son potentes para muchos problemas de datos tabulares, los árboles de decisión difieren significativamente de modelos como las Redes Neuronales Convolucionales (CNN) o los Transformadores de Visión (ViT) utilizados en visión por ordenador. Modelos como Ultralytics YOLO11 aprovechan arquitecturas de aprendizaje profundo optimizadas para tareas como la detección de objetos, la clasificación de imágenes y la segmentación de instancias, que implican el procesamiento de datos complejos y de alta dimensión como las imágenes, un dominio en el que los árboles de decisión simples son menos eficaces. Comprender los modelos fundacionales como los árboles de decisión proporciona un contexto valioso dentro del panorama más amplio de la IA y el modelado predictivo. Herramientas como Scikit-learn proporcionan implementaciones populares para árboles de decisión, mientras que plataformas como Ultralytics HUB agilizan el desarrollo y despliegue de modelos de visión avanzados.

Leer todo