Python

pandasのread_csv()で「Unicode BOM付」csvファイルを読み込む方法

この記事は約2分で読めます。

 

案件でクライアントからもらったcsvが上手く読み込めず苦労したので解決法をメモしておきます。

 

過去記事:pandasでcsv読み込み時に「UnicodeDecodeError」が出る際の解決方法

 

エラーメッセージ

UnicodeDecodeError: ‘utf-8’ codec can‘t decode byte 0x83 in position 0: invalid start byte

 

sakuraエディタでファイルを開いてエンコード方式を確認すると「Unicode BOM付」というエンコード方式だったのですが、みたことが無かったので少し調べたところ以下のように指定してあげるとよかったみたいです。

 

# CSV読み込み
import pandas as pd 
df = pd.read_csv(r'/xxxxxx.csv', encoding="UTF-16")

 

「Unicode BOM付」を読みこむ際は引数のencodingをUTF-16を指定すればよいだけの話でした。

 

参考:https://qiita.com/niwaringo/items/d2a30e04e08da8eaa643

 

関連記事:pandasでcsv読み込み時に「UnicodeDecodeError」が出る際の解決方法

 


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

  1. […] 関連記事:pandasのread_csv()で「Unicode BOM付」csvファイルを読み込む方法 […]

  2. […] 関連記事:pandasのread_csv()で「Unicode BOM付」csvファイルを読み込む方法 […]

タイトルとURLをコピーしました