Rule Fit.pt
Resumo
- O RuleFit extrai regras de decisão de conjuntos de árvores e as combina com as características originais em um modelo linear esparso.
- A regularização L1 seleciona regras e características informativas, melhorando a interpretabilidade sem abrir mão da estrutura não linear.
- A profundidade das regras, o número de regras geradas e a intensidade da regularização afetam fortemente a generalização e a esparsidade.
Intuição #
O RuleFit transforma caminhos de árvores em indicadores se-então legíveis por humanos e então aprende pesos lineares sobre esses indicadores. Você obtém interações não lineares das árvores e interpretabilidade em nível de coeficientes da modelagem linear esparsa.
Explicação Detalhada #
1. Ideia (com fórmulas) #
- Extrair regras: cada caminho até uma folha se torna uma característica binária (r_j(x) \in {0,1}).
- Adicionar termos lineares escalonados (z_k(x)) para características contínuas.
- Ajuste linear com regularização L1:
A L1 promove esparsidade, de modo que apenas regras/termos influentes permanecem.
2. Conjunto de dados (OpenML: house_sales) #
Preços de imóveis no King County (OpenML data_id=42092). Apenas colunas numéricas para clareza.
| |
3. Ajustar o RuleFit #
Implementação em Python: christophM/rulefit
| |
4. Inspecionar as principais regras #
| |
rule: condição se-então (type=linearindica um termo linear)coef: coeficiente de regressão (unidades do alvo)support: fração de amostras que satisfazem a regraimportance: pontuação escalonada combinando magnitude do coeficiente e suporte
5. Validar via visualização #
| |
| |
6. Dicas práticas #
- Trate valores atípicos (Winsorização, recorte) para regras estáveis.
- Limpe os níveis de variáveis categóricas e codifique somente após agrupar categorias raras.
- Transforme alvos assimétricos (
log(y)ou Box-Cox) se necessário. - Selecione contagens de regras/profundidades que as partes interessadas consigam ler; use validação cruzada para escolher os limites.
- Resuma as principais regras em linguagem simples para relatórios empresariais.
7. Referências #
- Friedman, J. H., & Popescu, B. E. (2008). Predictive Learning via Rule Ensembles. The Annals of Applied Statistics, 2(3), 916–954.
- Christoph Molnar. (2020). Interpretable Machine Learning. https://christophm.github.io/interpretable-ml-book/rulefit.html