Python

【Python】pandasのread_csv()で「UnicodeDecodeError」が出たときの最終手段

この記事は約2分で読めます。

 

pd.read_csv()時の「UnicodeDecodeError」

 

pandasでpd.read_csv()でcsvを読み込むとたまにファイルによっては読み込みエラーが起きます。

 

そんなときは引数のencoding=wを「utf-8」とか「utf-8-sig」とか「shift-jis」とか「cp932」に適当に変更して再実行すると大抵上手くいくのですが、たまにどれでやってもうまく読み込めない時があります。

 

そんなときは最終手段で以下のように書くと良いです。

(codecsはデフォルトのライブラリなのでpipインストールは不要です)

 

import codecs

with codecs.open(r'path/to/xxx.csv', "r", "shift-jis", "ignore") as f:
    
    df = pd.read_csv(f)

 

参考:https://qiita.com/niwaringo/items/d2a30e04e08da8eaa643

 

 

コメント

タイトルとURLをコピーしました