Árbol de decisión

Basic

Árboles de decisión | Modelos interpretables basados en reglas

まとめ
  • Los árboles de decisión dividen el espacio de características mediante preguntas sencillas y generan conjuntos de reglas comprensibles.
  • Con las variantes de clasificación y regresión, los ensambles basados en gradiente y utilidades como dtreeviz, podemos ilustrar comportamientos complejos con diagramas intuitivos.
  • Los hiperparámetros (profundidad, tamaño mínimo de hoja, poda) controlan el equilibrio sesgo–varianza y conviene ajustarlos con datos de validación mientras se revisan las reglas resultantes.

Árboles de decisión #

1. Descripción general #

Cada división formula una pregunta tipo if-then y envía la muestra hacia la izquierda o la derecha hasta llegar a una hoja que emite la predicción. Como cada camino equivale a una regla explícita, los árboles son populares cuando la explicación importa: crédito, operaciones o cualquier flujo que requiera lógica de negocio transparente.

2. Impureza y poda #

Las métricas de impureza (Gini, entropía, MSE, MAE) miden cuán mezclado está un nodo. El crecimiento codicioso maximiza la reducción de impureza, mientras que la poda elimina ramas cuyo beneficio no justifica su complejidad aplicando penalizaciones como la de coste-complejidad (\alpha |T|).

3. Recorridos en Python #

En las subsecciones de este capítulo encontrarás:

  • Clasificador con Árboles de Decisión – explicación de Gini/entropía, regiones de decisión y visualización del árbol.
  • Regresor con Árboles de Decisión – ajustes por tramos constantes, métricas (R^2)/RMSE/MAE y superficies de predicción.
  • Parámetros del Árbol – comparación de max_depth, min_samples_leaf, ccp_alpha y distintos criterios de división.
  • RuleFit – combinación de reglas derivadas de árboles con términos lineales para lograr modelos dispersos e interpretables.

Todos los ejemplos usan scikit-learn y pueden reproducirse con los notebooks o scripts incluidos.

4. Referencias #

  • Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and Regression Trees. Wadsworth.
  • scikit-learn developers. (2024). Decision Trees. https://scikit-learn.org/stable/modules/tree.html