5.10
プロットと前処理
まとめ
- CSVの読み込みから欠損・重複の確認まで、時系列データの初期点検手順を学ぶ。
- トレンド推定・季節分解・対数変換・インフレ調整で、分析しやすい形に整える。
- 移動平均(SMA/WMA/EMA)でノイズを抑え、信号を読みやすくする。
直感 #
時系列分析で正確な結果を得るには、モデルに投入する前のデータ準備が欠かせない。列型の確認、欠損値の処理、トレンドの分離、分布の正規化、通貨データのインフレ調整など、地味だが重要なステップを1つずつ踏むことで、後段のモデリングが安定する。
詳細な解説 #
このチャプターで学べること #
- データの読み込みと型変換、欠損・重複チェックの基本手順
- 多項式フィットによるトレンド推定と残差の活用
- STLによる季節性・トレンド・残差の分解
- Box-Cox/Yeo-Johnson変換で歪んだ分布を整える方法
- CPIを使ったインフレ調整で時価を実質値に変換する手法
- SMA・WMA・EMAの3種の移動平均の比較
これがわかるとできること #
- 新しい時系列データを受け取ったとき、品質チェックから前処理までを体系的に進められる
- トレンドや季節性を分離し、モデルが学習すべき成分を明確にできる
- 通貨データを正しく実質値に揃えて、過去との比較を歪みなく行える
学習の進め方 #
- まずデータ読み込みと基本チェック(チェック1)で土台を作る
- トレンド推定と季節分解(チェック2〜3)で成分を分離する
- 分布変換とインフレ調整(チェック4〜5)でスケールを揃える
- 移動平均(チェック6)でノイズ除去の手法を比較する