4.3.14
Strategi averaging
Ringkasan
- Memilih strategi averaging untuk metrik klasifikasiの概要を押さえ、評価対象と読み取り方を整理します。
- Python 3.13 のコード例で算出・可視化し、手順と実務での確認ポイントを確認します。
- 図表や補助指標を組み合わせ、モデル比較や閾値調整に活かすヒントをまとめます。
1. Pilihan averaging utama #
| average | Cara perhitungan | Kapan digunakan |
|---|---|---|
micro | Menjumlahkan TP/FP/FN seluruh sampel lalu menghitung metrik | Menekankan akurasi total tanpa memedulikan distribusi kelas |
macro | Menghitung metrik per kelas lalu mengambil rata-rata sederhana | Memberi bobot sama untuk setiap kelas; menyorot kelas minoritas |
weighted | Menghitung metrik per kelas lalu merata-ratakan dengan bobot jumlah sampel | Mempertahankan proporsi kelas asli; perilakunya mirip Accuracy |
samples | Khusus multi-label. Merata-ratakan metrik per sampel | Untuk kasus ketika satu sampel memiliki banyak label |
2. Perbandingan di Python 3.13 #
| |
| |
classification_report menampilkan metrik per kelas sekaligus macro avg, weighted avg, dan micro avg, sehingga kita dapat membandingkan strategi averaging dengan cepat.
3. Cara memilih strategi #
- micro – Gunakan bila Anda mengutamakan performa keseluruhan dan setiap prediksi dianggap sama penting.
- macro – Cocok saat kelas minoritas sangat penting; sensitif terhadap recall yang rendah pada label langka.
- weighted – Berguna jika ingin mempertahankan proporsi kelas nyata sekaligus melaporkan Precision/Recall/F1.
- samples – Pilihan standar untuk tugas multi-label di mana satu sampel dapat memiliki beberapa label ground truth.
Catatan akhir #
- Parameter
averagedapat mengubah interpretasi metrik secara drastis; sesuaikan dengan kebutuhan bisnis dan sifat data. - Ingat:
macromemandang kelas secara adil,microfokus pada rasio global,weightedmempertahankan distribusi, dansamplesdirancang untuk multi-label. - Manfaatkan kemampuan scikit-learn untuk menghitung beberapa average sekaligus agar tidak salah menilai kualitas model.