6.5.3
回帰直線を重ねた散布図
まとめ
- 散布図に回帰直線と信頼区間を重ねて線形関係を可視化するチャート。
sns.lmplotでカテゴリ別の回帰線を自動描画できる。- 2変数の線形トレンドやグループ間の傾向差を確認したいときに使う。
- 散布図の基本形 の概念を先に学ぶと理解がスムーズです
seaborn.lmplot を使うと、散布図と回帰直線を同時に描画できます。信頼区間も自動で付与されます。
| |

読み方のポイント #
- 回帰線の傾きで関係性の強弱を判断できる。信頼区間が広い箇所はデータが少ない。
- カテゴリごとに色分けすることで、グループ間の傾向の違いが分かる。
- 非線形が疑われる場合は
order引数で多項式回帰を試してみる。
いつ使うか #
- 適している場面: 2変数間の線形トレンドを視覚的に確認したいとき。回帰直線と信頼区間を同時に見られます。
- 不向きな場面: 非線形な関係が強いデータに直線を引くとミスリードになるため、まず散布図で形状を確認すべきです。
- 代替手段: 多項式フィットや LOWESS を重ねれば非線形な傾向も捉えられます。
よくある失敗パターン #
- 非線形データへの直線フィット: 明らかに曲線的な関係に直線を引くとミスリードになります。残差プロットで直線性を確認してからフィットしてください。
- 外れ値の影響を無視: 外れ値が回帰直線を大きく引っ張ることがあります。ロバスト回帰や外れ値除外の影響を必ず確認しましょう。