分布・ばらつき可視化

6.2

分布・ばらつき可視化

まとめ
  • ヒストグラム・KDE・箱ひげ図・バイオリンプロットなど、データの分布形状を把握する代表的な手法を学ぶ。
  • Q-QプロットやECDFで正規性の確認や分布の比較を行い、前処理やモデル選択の判断に活かせるようになる。

使い分けのヒント #

  • まず全体像を見るなら → ヒストグラムKDE
  • カテゴリ間の分布を比較するなら → 箱ひげ図バイオリンプロット
  • 正規性の確認なら → Q-Qプロット
  • 個々のデータ点を見たいなら → スウォームプロットラグプロット
ヒストグラム
ヒストグラム
箱ひげ図
箱ひげ図
バイオリンプロット
バイオリンプロット
KDE(密度プロット)
KDE(密度プロット)
リッジライン
リッジライン
スウォームプロット
スウォームプロット
ラグプロット
ラグプロット
ECDF
ECDF(経験分布)
Q-Qプロット
Q-Q プロット
2D KDE
2D KDE
レインクラウドプロット
レインクラウドプロット