Python

MecabのparseToNode()でUnicodeDecodeErrorが発生した時の対処法

この記事は約1分で読めます。

 

エラーの内容

 

node = mecab.parseToNode("吾輩は猫である")
while node:
    print(node.surface)
    node = node.next

 

エラーメッセージ

UnicodeDecodeError Traceback (most recent call last) <ipython-input-11-1f88b1ec9c08> in <module>() 1 while node: —-> 2 print(node.surface) 3 node = node.next UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb5 in position 0: invalid start byte

 

解決法

 

mecab.parse(“”)という一文をコードに追加します。

 

mecab = MeCab.Tagger()
mecab.parse("")  # 追加


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

タイトルとURLをコピーしました