title: “Fitur Numerik | Pra-pemrosesan” weight: 3 created: 2019-03-09T08:04:12+09:00 lastmod: 2024-06-01T00:00:00+09:00 chapter: true not_use_colab: true not_use_twitter: true pre: “3.1 ” header_image: “/images/bg/japan3.jpg” #
Bagian 3.3 #
Fitur numerik #
Resep umum untuk penskalaan, transformasi distribusi, pembatasan outlier, imputasi nilai hilang, dan seleksi fitur.
| Tugas | Tujuan | Alat |
|---|---|---|
| Standarisasi / Normalisasi | Menstabilkan perilaku model | StandardScaler, MinMaxScaler, RobustScaler |
| Transformasi daya | Membuat data lebih mirip normal | PowerTransformer, Box‑Cox, Yeo‑Johnson |
| Tangani outlier | Mengurangi pengaruh berlebihan | Winsorization, filter IQR, IsolationForest |
| Nilai hilang | Pertahankan baris, tambah indikator | Simple/Iterative/KNN Imputer + indikator |
| Seleksi fitur | Kurangi dimensi | Ambang varians, PCA, berbasis model |
Panduan: telusuri distribusi, tangani outlier dengan bijak, dan bangun pra‑pemrosesan di dalam pipeline untuk mencegah kebocoran.