read_csvで列数が合わずParserErrorになる

最終更新 2025-11-04 読了時間 1 分

まとめ

pandas.read_csv() で次のようなエラーに遭遇したことはありませんか？

pandas.errors.ParserError: Error tokenizing data. C error: Expected 5 fields in line 12, saw 7

あるいは

pandas.errors.ParserError: ',' expected after '"'

といったメッセージです。これは 区切り文字や引用符の扱いが想定と違う ときに起こります。
主な原因は次のパターンです。

解決法 1: 区切り文字を正しく指定する #

1
2
3
4
5
6
7
import pandas as pd

# セミコロン区切り
df = pd.read_csv("sales.csv", sep=";")

# タブ区切り
df = pd.read_csv("log.tsv", sep="\t")

ファイルの先頭数行を head -n やメモ帳で確認し、実際の区切り文字を把握してから sep= を設定しましょう。

1
df = pd.read_csv("survey.csv", quotechar="'", escapechar="\\")

Excel から書き出した CSV では セル内のカンマ や改行が混入していることがあります。
引用符 (quotechar) を明示し、バックスラッシュなどでエスケープされている場合は escapechar も指定します。

標準の C エンジンでは扱えない複雑なパターンも engine="python" へ切り替えると読み込めることがあります。

1
2
3
4
5
6
7
df = pd.read_csv(
    "messy.csv",
    engine="python",
    sep=",",
    quotechar='"',
    on_bad_lines="warn",  # 破損行は警告だけ出してスキップ
)

on_bad_lines="skip" にすると崩れた行を無視できます。
データ損失を防ぎたい場合は warn にしてログだけ取り、後で該当行を手動で修正しましょう。