2.1.12
Orthogonal Matching Pursuit (OMP)
Resumen
- Orthogonal Matching Pursuit (OMP) selecciona en cada paso la característica más correlacionada con el residuo para construir un modelo lineal disperso.
- Resuelve un problema de mínimos cuadrados restringido a las características ya elegidas, lo que mantiene los coeficientes interpretables.
- En lugar de ajustar una fuerza de regularización, la dispersión se controla indicando cuántas características deben conservarse.
- Estandarizar las características y revisar la multicolinealidad ayuda a que el método permanezca estable al recuperar señales dispersas.
Intuicion #
Este metodo se entiende mejor al conectar sus supuestos con la estructura de los datos y su efecto en la generalizacion.
Explicacion Detallada #
Formulación matemática #
Inicializamos el residuo como \(\mathbf{r}^{(0)} = \mathbf{y}\). Para cada iteración \(t\):
- Calculamos el producto interno entre cada característica \(\mathbf{x}_j\) y el residuo \(\mathbf{r}^{(t-1)}\), y elegimos la características \(j\) con mayor valor absoluto.
- Añadimos \(j\) al conjunto activo \(\mathcal{A}_t\).
- Resolvemos mínimos cuadrados restringidos a \(\mathcal{A}t\) para obtener \(\hat{\boldsymbol\beta}{\mathcal{A}_t}\).
- Actualizamos el residuo \(\mathbf{r}^{(t)} = \mathbf{y} - \mathbf{X}_{\mathcal{A}t} \hat{\boldsymbol\beta}{\mathcal{A}_t}\).
El proceso se detiene al alcanzar la dispersión deseada o cuando el residuo es suficientemente pequeño.
Experimentos con Python #
El siguiente código compara OMP y lasso sobre datos cuyo vector de coeficientes verdadero es disperso.
| |
Interpretación de los resultados #
- Si
n_nonzero_coefscoincide con el número real de coeficientes distintos de cero, OMP recupera las características relevantes con alta probabilidad. - Comparado con lasso, OMP produce coeficientes exactamente nulos para las características descartadas.
- Cuando las características están muy correlacionadas, el orden de selección puede variar; conviene realizar preprocesados y diseño de características adecuados.
Referencias #
- Pati, Y. C., Rezaiifar, R., & Krishnaprasad, P. S. (1993). Orthogonal Matching Pursuit: Recursive Function Approximation with Applications to Wavelet Decomposition. En Conference Record of the Twenty-Seventh Asilomar Conference on Signals, Systems and Computers.
- Tropp, J. A. (2004). Greed is Good: Algorithmic Results for Sparse Approximation. IEEE Transactions on Information Theory, 50(10), 2231–2242.