6.2
分布・ばらつき可視化
まとめ
- ヒストグラム・KDE・箱ひげ図・バイオリンプロットなど、データの分布形状を把握する代表的な手法を学ぶ。
- Q-QプロットやECDFで正規性の確認や分布の比較を行い、前処理やモデル選択の判断に活かせるようになる。
使い分けのヒント #
- まず全体像を見るなら → ヒストグラム か KDE
- カテゴリ間の分布を比較するなら → 箱ひげ図 か バイオリンプロット
- 正規性の確認なら → Q-Qプロット
- 個々のデータ点を見たいなら → スウォームプロット か ラグプロット
![]() ヒストグラム | ![]() 箱ひげ図 | ![]() バイオリンプロット |
|---|---|---|
![]() KDE(密度プロット) | ![]() リッジライン | ![]() スウォームプロット |
![]() ラグプロット | ![]() ECDF(経験分布) | ![]() Q-Q プロット |
![]() 2D KDE | ![]() レインクラウドプロット |










