2.1.12
Orthogonal Matching Pursuit (OMP)
Resumo
- O Orthogonal Matching Pursuit (OMP) seleciona em cada etapa a variável mais correlacionada com o resíduo atual para construir um modelo linear esparso.
- O algoritmo resolve um problema de mínimos quadrados restrito às variáveis selecionadas, mantendo os coeficientes interpretáveis.
- Em vez de ajustar a força de regularização, você controla diretamente a esparsidade especificando o número de variáveis a manter.
- A padronização das variáveis e a verificação de multicolinearidade ajudam o método a permanecer estável na recuperação de sinais esparsos.
Intuição #
Este método deve ser interpretado através de suas suposições, condições dos dados e como as escolhas de parâmetros afetam a generalização.
Explicação Detalhada #
Formulação Matemática #
Inicialize o resíduo como \(\mathbf{r}^{(0)} = \mathbf{y}\). Para cada iteração \(t\):
- Calcule o produto interno entre cada variável \(\mathbf{x}_j\) e o resíduo \(\mathbf{r}^{(t-1)}\), e selecione a variável \(j\) com o maior valor absoluto.
- Adicione \(j\) ao conjunto ativo \(\mathcal{A}_t\).
- Resolva o problema de mínimos quadrados restrito a \(\mathcal{A}t\) para obter \(\hat{\boldsymbol\beta}{\mathcal{A}_t}\).
- Atualize o resíduo \(\mathbf{r}^{(t)} = \mathbf{y} - \mathbf{X}_{\mathcal{A}t} \hat{\boldsymbol\beta}{\mathcal{A}_t}\).
Pare ao atingir a esparsidade desejada ou quando o resíduo for suficientemente pequeno.
Experimentos em Python #
O trecho abaixo compara OMP e Lasso em dados com um vetor de coeficientes verdadeiros esparso.
| |
Interpretação dos resultados #
- Definir
n_nonzero_coefscom a esparsidade verdadeira ajuda o OMP a recuperar de forma confiável as variáveis relevantes. - Em comparação com o Lasso, o OMP produz coeficientes exatamente zero para as variáveis não selecionadas.
- Quando as variáveis são altamente correlacionadas, a ordem de seleção pode oscilar, portanto o pré-processamento e a engenharia de variáveis continuam sendo importantes.
Referências #
- Pati, Y. C., Rezaiifar, R., & Krishnaprasad, P. S. (1993). Orthogonal Matching Pursuit: Recursive Function Approximation with Applications to Wavelet Decomposition. In Conference Record of the Twenty-Seventh Asilomar Conference on Signals, Systems and Computers.
- Tropp, J. A. (2004). Greed is Good: Algorithmic Results for Sparse Approximation. IEEE Transactions on Information Theory, 50(10), 2231–2242.