Beautiful Soup

RequestsとBeautifulSoupでWikipediaをスクレイピングするサンプルコード

今日はPythonで実際に有名なWebサイトをスクレイピングしてみたいと思います。 Requestsとは Requestsは、PythonのHTTP通信ライブラリです。Requestsを使うとWebサイトの情報取...
GCP

GoogleColaboratoryでBigQuery上のテーブル情報の読み込み・書き出し

前準備 GoogleColaboratoryはGoogleアカウントさえあれば使えますが、GCPアカウントと直接紐づいているわけではないのでユーザーの認証を事前に通しておく必要があります。 #グーグルアカウント認証で...
Python

Scipyで階層型クラスタリングの結果をデンドログラムでプロットする

今回は業務でクラスタリングを行う必要がありその過程でPythonのScipyというライブラリを使用して階層型クラスタリングを行い、その結果をデンドログラムをプロットするみたいなことをやってみたので、流れなどをメモしておこうと思います...
Python

【Python】mlxtendを使ってアソシエーション分析を実装する

今回は業務でPythonの「mlxtend」というライブラリを使ってアソシエーション分析を行ったので、手順などをメモしておきます Aprioriとアソシエーション分析 Aprioriとは、アソシエーション分析を実践す...
Python

MecabのparseToNode()でUnicodeDecodeErrorが発生した時の対処法

エラーの内容 node = mecab.parseToNode("吾輩は猫である") while node: print(node.surface) node = node.next エラーメッセー...
Python

MeCabのtagger.parseToNodeの戻り値がNoneになる原因と解決法

先日MENTAで自然言語処理の相談を受けていてその中でMecabのテキストデータに対して形態素解析を実行する関数であるMecab.tagger.parseToNode()で謎のエラーが発生するという相談を受けたのでその時の原因と解決...
Beautiful Soup

iTunesストアのアプリレビューをスクレイピングで自動取得する

こんにちは、ミナピピン(@python_mllover)です。 今回はiTunesStoreのアプリや音楽の情報をスクレイピングする方法について紹介していきたいと思います。 まずiTtuneStoreには...
Python

自然言語処理が簡単にできる「nlplot」でツイートデータを可視化・分析する

今回は業務でツイッターAPIを用いてツイートデータを収集して「nlplot」というライブラリでワードクラウドや共起ネットワークの作成みたいな自然言語処理を少し試してみたので忘れないようにメモしておきます。 前準備 必...
Python

Pythonで全角・半角を判別して文字列の長さを計算する方法

MENTAの相談でよくエクセルやメール送信の自動化の相談を受けるのですが、その中でメール本文などを自動化する際に文字列の長さを判定することがたまにあり、その際に全角と半角の区別をつけて文字列の長さを計算しないと文章がズレるこ...
Python

TwitterAPI v2でツイート検索やユーザー情報を取得するサンプルコードまとめ集

2021年の11月にTwitterAPIの仕様変更が実施されてV2が標準になったのをきっかけにTwitterAPIのラッパーライブラリのTweepyもV2用にバージョンアップが行われました。 それにより関数の名前や引数...
タイトルとURLをコピーしました