案件でクライアントからもらったcsvが上手く読み込めず苦労したので解決法をメモしておきます。
過去記事:pandasでcsv読み込み時に「UnicodeDecodeError」が出る際の解決方法
エラーメッセージ
UnicodeDecodeError: ‘utf-8’ codec can‘t decode byte 0x83 in position 0: invalid start byte
sakuraエディタでファイルを開いてエンコード方式を確認すると「Unicode BOM付」というエンコード方式だったのですが、みたことが無かったので少し調べたところ以下のように指定してあげるとよかったみたいです。
# CSV読み込み import pandas as pd df = pd.read_csv(r'/xxxxxx.csv', encoding="UTF-16")
「Unicode BOM付」を読みこむ際は引数のencodingをUTF-16を指定すればよいだけの話でした。
参考:https://qiita.com/niwaringo/items/d2a30e04e08da8eaa643
関連記事:pandasでcsv読み込み時に「UnicodeDecodeError」が出る際の解決方法
コメント
[…] 関連記事:pandasのread_csv()で「Unicode BOM付」csvファイルを読み込む方法 […]
[…] 関連記事:pandasのread_csv()で「Unicode BOM付」csvファイルを読み込む方法 […]