SQLで操作

使用しているデータセットについては『総務省のデータ』の項を参照してください。 Pandasを使用すればデータベースをSQLで操作することもできます。 以下の例では、読み込んだcsvをSQLデータベースに変換し、それに対して SELECT文を実行します。

データを読み込む

import pandas as pd

df = pd.read_csv("./z-001.csv")
df.columns = df.columns.str.replace(" ", "")  # カラム名に含まれるスペースは消す
df.head()
Unnamed:0Unnamed:1平成21年度平成22年度平成23年度平成24年度平成25年度平成26年度平成27年度平成28年度平成29年度平成30年度令和元年度
02社会保障関係費29.831.232.732.731.832.833.734.434.634.434.7
13公債費18.920.319.820.920.921.421.320.620.920.620.0
24機関費11.912.511.710.611.811.711.811.411.511.911.8
35教育費11.711.911.712.111.611.711.711.711.811.811.9
46国土保全及び開発費12.011.310.610.210.910.59.910.410.510.510.8

SQLで操作できる形式にする

from sqlite3 import connect

conn = connect(":memory:")
df.to_sql("Table1", conn)

SQLを実行する

pd.read_sql("SELECT 平成21年度 FROM Table1", conn)
平成21年度
029.8
118.9
211.9
311.7
412.0
59.9