2.1.12
Orthogonal Matching Pursuit
สรุป
- OMP เป็นวิธีละโมบที่เลือกคุณลักษณะซึ่งมีสหสัมพันธ์สูงที่สุดกับส่วนที่เหลืออยู่ (residual) ทีละตัว ทำให้สร้างโมเดลเชิงเส้นที่สปาร์สได้
- ทุกครั้งที่เลือกฟีเจอร์ใหม่ จะคำนวณคำตอบกำลังสองน้อยที่สุดเฉพาะฟีเจอร์ที่เลือกไว้ จึงตีความสัมประสิทธิ์ได้ตรงไปตรงมา
- แทนที่จะกำหนดค่าการทำให้เป็นระเบียบ เรากำหนด “จำนวนฟีเจอร์ที่ต้องการคงไว้” ได้โดยตรง จึงควบคุมความสปาร์สได้อย่างชัดเจน
- การทำมาตรฐานฟีเจอร์และลดการพึ่งพากันช่วยให้ได้คำตอบที่เสถียรยิ่งขึ้น
สัญชาตญาณ #
การเข้าใจวิธีนี้ควรดูสมมติฐานของโมเดล ลักษณะข้อมูล และผลของการตั้งค่าพารามิเตอร์ต่อการทั่วไปของโมเดล
คำอธิบายโดยละเอียด #
สูตรสำคัญ #
ให้ residual เริ่มต้นเป็น \(\mathbf{r}^{(0)} = \mathbf{y}\) แล้วในรอบที่ \(t\) ทำดังนี้
- คำนวณสหสัมพันธ์ระหว่างแต่ละฟีเจอร์ \(\mathbf{x}_j\) กับ \(\mathbf{r}^{(t-1)}\) แล้วเลือกดัชนี \(j\) ที่มีค่าสัมบูรณ์มากที่สุด
- เพิ่ม \(j\) เข้าเซตรวมฟีเจอร์ที่เลือก \(\mathcal{A}_t\)
- คำนวณคำตอบวิธีกำลังสองน้อยที่สุดโดยใช้เฉพาะฟีเจอร์ใน \(\mathcal{A}t\) ได้ \(\hat{\boldsymbol\beta}{\mathcal{A}_t}\)
- อัปเดต residual เป็น \(\mathbf{r}^{(t)} = \mathbf{y} - \mathbf{X}_{\mathcal{A}t} \hat{\boldsymbol\beta}{\mathcal{A}_t}\)
ทำซ้ำจนกว่าจะเลือกครบจำนวนที่กำหนดหรือ residual มีค่าน้อยพอ
ทดลองด้วย Python #
ตัวอย่างต่อไปนี้สร้างข้อมูลที่มีสัมประสิทธิ์จริงแบบสปาร์ส แล้วเปรียบเทียบ OMP กับ Lasso
| |
วิเคราะห์ผลลัพธ์ #
- ถ้ากำหนด
n_nonzero_coefsให้ตรงกับจำนวนสัมประสิทธิ์ที่แท้จริง OMP มักกู้คืนฟีเจอร์เป้าหมายได้ครบ - ต่างจาก Lasso ที่ยังมีสัมประสิทธิ์เล็กๆ หลงเหลือ OMP ให้ค่าศูนย์อย่างแท้จริงกับฟีเจอร์ที่ไม่ได้เลือก
- หากฟีเจอร์มีความสัมพันธ์สูง การเลือกอาจไม่นิ่ง ดังนั้นการทำมาตรฐานและออกแบบฟีเจอร์ให้ดีเป็นเรื่องสำคัญ
เอกสารอ้างอิง #
- Pati, Y. C., Rezaiifar, R., & Krishnaprasad, P. S. (1993). Orthogonal Matching Pursuit: Recursive Function Approximation with Applications to Wavelet Decomposition. In Conference Record of the Twenty-Seventh Asilomar Conference on Signals, Systems and Computers.
- Tropp, J. A. (2004). Greed is Good: Algorithmic Results for Sparse Approximation. IEEE Transactions on Information Theory, 50(10), 2231 E242.