6.5.4
Jointplotで相関と分布を同時に表示
まとめ
- 散布図と周辺分布(KDE・ヒストグラム)を同時に表示するチャート。
sns.jointplot一行で中央の散布図+周辺分布を描画できる。- 2変数の相関だけでなく各変数の分布形状もまとめて確認したいときに使う。
- 散布図の基本形 の概念を先に学ぶと理解がスムーズです
seaborn.jointplot は中央に散布図、上下左右にヒストグラムを描画してくれる便利な関数です。
| |

読み方のポイント #
- 中央の散布図が濃い領域は出現頻度が高い。周辺の KDE で各軸の分布も把握できる。
kind="hex"やkind="hist"に切り替えると別タイプのチャートになる。- データ量が多いと等高線の描画が重くなるため、サンプリングするか
levelsを減らすと良い。
いつ使うか #
- 適している場面: 2変数の相関と各変数の周辺分布を同時に確認したいとき。EDAの初期段階に最適です。
- 不向きな場面: サブプロットが固定構成のため、レイアウトの細かいカスタマイズが必要な場面には向きません。
- 代替手段: マージナルヒストグラム付き散布図なら matplotlib だけでレイアウトを自由に制御できます。
よくある失敗パターン #
- 周辺分布の種類の不適切な選択: データが少ないのに KDE を選ぶと滑らかすぎて実態と乖離します。データ数に応じてヒストグラムと KDE を使い分けてください。
- 図のサイズ不足: 小さすぎる figure サイズだと周辺分布が潰れて読めなくなります。最低でも 6×6 以上を確保しましょう。
- 回帰直線を重ねた散布図 — 線形トレンドを回帰線で確認
- マージナルヒストグラム付き散布図 — JointGridで柔軟にカスタマイズ
- 2次元KDE — 2変数の密度を等高線で表示