Python

pandasのread_csv()で「Unicode BOM付」csvファイルを読み込む方法

この記事は約2分で読めます。

 

案件でクライアントからもらったcsvが上手く読み込めず苦労したので解決法をメモしておきます。

 

過去記事:pandasでcsv読み込み時に「UnicodeDecodeError」が出る際の解決方法

 

エラーメッセージ

UnicodeDecodeError: ‘utf-8’ codec can‘t decode byte 0x83 in position 0: invalid start byte

 

sakuraエディタでファイルを開いてエンコード方式を確認すると「Unicode BOM付」というエンコード方式だったのですが、みたことが無かったので少し調べたところ以下のように指定してあげるとよかったみたいです。

 

# CSV読み込み
import pandas as pd 
df = pd.read_csv(r'/xxxxxx.csv', encoding="UTF-16")

 

「Unicode BOM付」を読みこむ際は引数のencodingをUTF-16を指定すればよいだけの話でした。

 

参考:https://qiita.com/niwaringo/items/d2a30e04e08da8eaa643

 

関連記事:pandasでcsv読み込み時に「UnicodeDecodeError」が出る際の解決方法

 

コメント

タイトルとURLをコピーしました