3.2.3
数値カラムを一括集計する
まとめ
- 複数の数値列に対して平均・中央値・標準偏差などの KPI を一括で算出する。
pandas.DataFrame.aggとgroupbyを組み合わせてカテゴリ別の集計表を作成する。- 定例レポートや監視ダッシュボードで集計テンプレートを自動化したいときに使う。
狙い #
定例レポートや監視では「平均・中央値・標準偏差・前年比差分」など複数の指標を一括で計算したい場面が多いです。pandas の agg / describe / groupby を組み合わせると、集計表をテンプレ化できます。
| |
1. agg で複数集計
#
| |
- 行列を転置すると “列ごとの統計量” を見やすくできる
.round()で桁数を制御してレポートにそのまま貼り付け可能
KPI を追加 #
| |
独自関数を apply で渡すだけでカスタム KPI も一覧化できます。
2. groupby + agg でカテゴリ別集計
#
| |
agg では (列名, 集計関数) のタプルで任意の集計を組み合わせられます。lambda を使えば差分や比率なども一発で算出できます。
3. Aggregation Report を DataFrame にまとめる #
| |
この report を CSV / Markdown に書き出しておくと、タスク管理ツールや BI へ反映しやすくなります。
| |
可視化でトレンド確認 #
| |
agg で概況を掴んだあとに、ラインチャートでトレンドを確かめると精度の高いインサイトにつながります。
チェックリスト #
-
aggの結果をテンプレ DataFrame にまとめ、レポート出力を自動化した - カスタム KPI(CV、前年比差分など)も
lambdaで定義した -
groupbyと組み合わせ、カテゴリ別の増減を可視化できる状態にした - Markdown / CSV 出力を整備し、ナレッジ共有しやすくした
このテンプレートを他プロジェクトでも再利用できるよう GitHub gist や Snippet 管理に登録しておくと便利です。