プロットと前処理

5.10

プロットと前処理

まとめ
  • CSVの読み込みから欠損・重複の確認まで、時系列データの初期点検手順を学ぶ。
  • トレンド推定・季節分解・対数変換・インフレ調整で、分析しやすい形に整える。
  • 移動平均(SMA/WMA/EMA)でノイズを抑え、信号を読みやすくする。

直感 #

時系列分析で正確な結果を得るには、モデルに投入する前のデータ準備が欠かせない。列型の確認、欠損値の処理、トレンドの分離、分布の正規化、通貨データのインフレ調整など、地味だが重要なステップを1つずつ踏むことで、後段のモデリングが安定する。

詳細な解説 #

このチャプターで学べること #

  • データの読み込みと型変換、欠損・重複チェックの基本手順
  • 多項式フィットによるトレンド推定と残差の活用
  • STLによる季節性・トレンド・残差の分解
  • Box-Cox/Yeo-Johnson変換で歪んだ分布を整える方法
  • CPIを使ったインフレ調整で時価を実質値に変換する手法
  • SMA・WMA・EMAの3種の移動平均の比較

これがわかるとできること #

  • 新しい時系列データを受け取ったとき、品質チェックから前処理までを体系的に進められる
  • トレンドや季節性を分離し、モデルが学習すべき成分を明確にできる
  • 通貨データを正しく実質値に揃えて、過去との比較を歪みなく行える

学習の進め方 #

  1. まずデータ読み込みと基本チェック(チェック1)で土台を作る
  2. トレンド推定と季節分解(チェック2〜3)で成分を分離する
  3. 分布変換とインフレ調整(チェック4〜5)でスケールを揃える
  4. 移動平均(チェック6)でノイズ除去の手法を比較する