Beautiful Soup Python スクレイピング

【Python】BeautifulSoupで特定のHTMLタグ要素を削除・置換する

この記事は約2分で読めます。

 

こんにちは、ミナピピン(@python_mllover)です!

 

今回はBeautifulSoupで特定のHTMLタグ要素を削除・置換するメソッドについてメモしておきます。

 

BeautifulSoupで特定のHTMLタグ要素を削除・置換する

 

PythonのBeautifulSoupでは、.extract().replace_with() 関数を使うことで特定のHTMLタグ要素を削除・置換が行えます。

from bs4 import BeautifulSoup

txt = """<p>I have a dog.  His name is <span class="secret">Ken</span>.</p>"""

soup = BeautifulSoup(txt)

# This keeps "unwanted" information
soup.get_text()
#: u'I have a dog.  His name is Ken.'


# remove an element by tag matching 
soup.find("span", {"class":"secret"}).extract()
soup.get_text()
#: u'I have a dog.  His name is .'


# or you can replace that with something
soup = BeautifulSoup(txt)
soup.find("span", {"class":"secret"}).replace_with("confidential")
soup.get_text()
#: u'I have a dog.  His name is confidential.'

 

参考:https://qiita.com/kota9/items/ee921b742f65b3db50bd


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

タイトルとURLをコピーしました