3.7.7
氏名から敬称やカッコ書きを除去する
まとめ
- 氏名文字列から敬称(様・さん・殿など)やカッコ書きの補足情報を除去する。
- 正規表現で括弧注釈を除去し、敬称リストで末尾の敬称を削る。
- 顧客名寄せや担当者照合の前処理として使う。
顧客名や担当者名には「田中太郎 様」「佐藤花子(新担当)」のように敬称や補足情報が付くことがよくあります。名寄せや照合をスムーズに行うために、敬称・注釈を取り除きましょう。
| |
運用上の注意 #
- 役職(「部長」「課長」など)を残したい場合はリストを分けておき、別カラムへ保持します。
- カタカナやローマ字で記載された敬称(例:
SAMA)が混じる場合は、全角・半角正規化と合わせてルールを拡張します。 - 企業名と担当者名が同じカラムに入っている場合は、敬称除去 → 正規表現で人名っぽさを判定 → 人名だけ抽出、という流れでフィルタするのが実務では定番です。