こんにちは、ミナピピン(@python_mllover)です。この前仕事でモノタロウのサイトの情報をスクレピングしていたのですが、いつも通りのやり方でスクレピングするとスクレイピングした情報が文字化けしていていました。
import requests from bs4 import BeautifulSoup res = requests.get('https://www.monotaro.com/g/04100001/') soup = BeautifulSoup(res.text, 'lxml') #要素を抽出
文字化けの解決方法
res.contentを渡す
res = requests.get('https://www.monotaro.com/g/04100001/') soup = BeautifulSoup(res.content, 'lxml') #要素を抽出
大体これで治る気がします。他にも文字コードをutf-8指定するみたいな方法もあるみたいなのですが、今回は試しても効果はありませんでした。とりま日本語は面倒くせぇって感じです笑
コメント
[…] 関連記事:【Python】BeautifulSoupでスクレイピングしたhtmlが文字化けしたときの解消法 […]