4.3.10
Brier Score
- Brier Score | Mengukur kalibrasi probabilitasの概要を押さえ、評価対象と読み取り方を整理します。
- Python 3.13 のコード例で算出・可視化し、手順と実務での確認ポイントを確認します。
- 図表や補助指標を組み合わせ、モデル比較や閾値調整に活かすヒントをまとめます。
1. Definisi #
Untuk klasifikasi biner, Brier Score ditulis sebagai \mathrm{Brier} = \frac{1}{n} \sum_{i=1}^{n} (p_i - y_i)^2, dengan \(p_i\) adalah probabilitas kelas positif dan \(y_i\) label aktual (0 atau 1). Pada kasus multikelas, error kuadrat dihitung per kelas lalu dirata-rata.
2. Implementasi dan visualisasi di Python 3.13 #
| |
Contoh berikut melatih regresi logistik pada dataset Breast Cancer, menghitung Brier Score, dan menggambar diagram reliabilitas. Gambar disimpan di static/images/eval/classification/brier-score/reliability_curve.png sehingga dapat diregenerasi lewat generate_eval_assets.py.
| |

Penyimpangan dari garis 45° menandakan probabilitas yang terlalu percaya diri atau terlalu ragu.
3. Cara membaca skor #
- Kalibrasi sempurna menghasilkan 0.
- Model yang selalu memprediksi 0.5 (pada data seimbang) mencapai 0.25.
- Nilai semakin kecil semakin baik; probabilitas yang jauh dari hasil aktual akan menambah penalti secara kuadrat.
4. Diagnostik kalibrasi dengan reliabilitas diagram #
Diagram reliabilitas mengelompokkan probabilitas ke dalam beberapa bin, lalu menampilkan rata-rata probabilitas yang diprediksi versus frekuensi aktual.
- Titik di bawah garis diagonal → model terlalu percaya diri (probabilitas terlalu tinggi).
- Titik di atas garis diagonal → model kurang percaya diri.
- Setelah menerapkan teknik kalibrasi (Platt scaling, isotonic regression, dsb.), hitung kembali Brier Score dan diagram ini untuk memastikan adanya perbaikan.
Ringkasan #
- Brier Score mengukur kesalahan kuadrat rata-rata dari probabilitas; semakin kecil semakin baik.
- Dengan Python 3.13, rier_score_loss dan diagram reliabilitas memberikan inspeksi kalibrasi secara cepat.
- Gunakan bersama ROC-AUC serta Precision/Recall agar evaluasi mencakup kualitas ranking sekaligus akurasi probabilitas.