7.4.2
EDINET
まとめ
- EDINET API v2で書類一覧を取得し、特定企業の有価証券報告書を自動検索する。
- DocIDを指定してPDFやCSVなどの開示書類をPythonでダウンロードする。
- pandasでDataFrame化し、分析に使えるデータパイプラインを構築する。
EDINETのAPIを使用してみる #
Pythonで四半期報告書のPDFデータを取得するために、EDINETを使います。以下のコンテンツではEDINET閲覧サイトから取得できる情報をもとにデータを加工して作成しています。本ページに記載されているコードの実行や取得したデータの利用についてはEDINETの利用規約を確認し理解した上で利用してください。また、Version2のAPIを使用する際はログイン認証+APIキーの発行が必要になります。
| |
書類一覧APIのリクエストURL #
11_EDINET_API仕様書に従って書類一覧を取得してみます。
| |
取得データの確認 #
今は四半期報告書を取得したいので、『四半期報告書』が文書の説明(docDescription)に含まれている行のみを抽出して確認します。
| |
| seqNumber | docID | edinetCode | secCode | JCN | filerName | fundCode | ordinanceCode | formCode | docTypeCode | |
|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2 | S100SSMQ | E04505 | 95070 | 9470001001933 | 四国電力株式会社 | None | 010 | 043000 | 140 |
| 2 | 3 | S100SSHR | E01441 | 59730 | 5122001016280 | 株式会社トーアミ | None | 010 | 043000 | 140 |
| 5 | 6 | S100SQAH | E30982 | 71750 | 9220001001223 | 今村証券株式会社 | None | 010 | 043000 | 140 |
| 6 | 7 | S100SPH6 | E03562 | 83600 | 3090001002315 | 株式会社 山梨中央銀行 | None | 010 | 043000 | 140 |
| 10 | 11 | S100SRF2 | E00783 | 40910 | 7010701015826 | 日本酸素ホールディングス株式会社 | None | 010 | 043000 | 140 |
5 rows × 29 columns
DocIDの確認 #
商船三井の四半期報告書のDocIDを確認してみます。filerNameに商船三井が含まれる行のみを抽出します。
| |
| seqNumber | docID | edinetCode | secCode | JCN | filerName | fundCode | ordinanceCode | formCode | docTypeCode | |
|---|---|---|---|---|---|---|---|---|---|---|
| 1307 | 1308 | S100STH6 | E04236 | 91040 | 4010401082896 | 株式会社商船三井 | None | 010 | 043000 | 140 |
1 rows × 29 columns
四半期報告書の取得 #
docID をもとに四半期報告書の取得に必要なデータを取得します。pdfを取得したい場合はマニュアルに従い、type=2を指定します。
| |
ダウンロードしたpdfを表示する #
| |
(pdfの表示は省略します)