Rugplotで個票を補助線として表示

Visualize

Rugplotで個票を補助線として表示

作成日: 最終更新: 読了時間: 1 分

ヒストグラムや KDE に rugplot を重ねると、データの一つひとつがどこにあるかが分かりやすくなります。

import seaborn as sns
import matplotlib.pyplot as plt

diamonds = sns.load_dataset("diamonds").sample(300, random_state=0)

fig, ax = plt.subplots(figsize=(6, 3.5))
sns.kdeplot(data=diamonds, x="price", ax=ax, color="#0ea5e9")
sns.rugplot(data=diamonds, x="price", ax=ax, color="#1d4ed8", alpha=0.4)

ax.set_xlabel("価格 ($)")
ax.set_ylabel("密度")
ax.set_title("ダイヤ価格の KDE + Rugplot")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

ヒストグラムや KDE に rugplot を重ねると、データの一つひとつがどこにあるかが分かりやすくなりますの図

読み方のポイント #

  • Rugplot の短い線が密集している箇所はデータが多い。
  • 色を薄くしておけば KDE の主役を奪わずに情報を補足できる。
  • 大量データで Rugplot を使うと描画負荷が高いので、サンプリングや height の調整を検討する。