ミナピ@データアナリスト

Python

【Python】mlxtendを使ってアソシエーション分析を実装する

今回は業務でPythonの「mlxtend」というライブラリを使ってアソシエーション分析を行ったので、手順などをメモしておきます Aprioriとアソシエーション分析 Aprioriとは、アソシエーション分析を実践す...
Python

MecabのparseToNode()でUnicodeDecodeErrorが発生した時の対処法

エラーの内容 node = mecab.parseToNode("吾輩は猫である") while node: print(node.surface) node = node.next エラーメッセー...
Python

MeCabのtagger.parseToNodeの戻り値がNoneになる原因と解決法

先日MENTAで自然言語処理の相談を受けていてその中でMecabのテキストデータに対して形態素解析を実行する関数であるMecab.tagger.parseToNode()で謎のエラーが発生するという相談を受けたのでその時の原因と解決...
Beautiful Soup

iTunesストアのアプリレビューをスクレイピングで自動取得する

こんにちは、ミナピピン(@python_mllover)です。 今回はiTunesStoreのアプリや音楽の情報をスクレイピングする方法について紹介していきたいと思います。 まずiTtuneStoreには...
Python

自然言語処理が簡単にできる「nlplot」でツイートデータを可視化・分析する

今回は業務でツイッターAPIを用いてツイートデータを収集して「nlplot」というライブラリでワードクラウドや共起ネットワークの作成みたいな自然言語処理を少し試してみたので忘れないようにメモしておきます。 前準備 必...
Python

Pythonで全角・半角を判別して文字列の長さを計算する方法

MENTAの相談でよくエクセルやメール送信の自動化の相談を受けるのですが、その中でメール本文などを自動化する際に文字列の長さを判定することがたまにあり、その際に全角と半角の区別をつけて文字列の長さを計算しないと文章がズレるこ...
Python

TwitterAPI v2でツイート検索やユーザー情報を取得するサンプルコードまとめ集

2021年の11月にTwitterAPIの仕様変更が実施されてV2が標準になったのをきっかけにTwitterAPIのラッパーライブラリのTweepyもV2用にバージョンアップが行われました。 それにより関数の名前や引数...
JavaScript

【JQuery】HTMLの要素をclass、idで指定して取得・操作するサンプルコード

JQueryでHTMLの要素に対してclass、idで指定して操作するサンプルコードをメモ用にまとめておきます。 クラスで指定する時 classで指定する時は「.」を使用します。 また要素内のテキストは.t...
Python

Tweepyでツイートの検索結果をCSVに出力保存するサンプルコード

Tweepyでツイート検索した結果をCSVに出力するサンプルコードを紹介したいと思います。 前準備 tweepyのバージョン3~4で関数の書き方などがかなり異なるので、バージョンを固定します。他の記事などでコード...
Python

TweepyとTwitter API V2を使って大量のツイート情報をスクレイピングする

以前TwiterAPI V2を使用してツイート検索を行う記事を投稿したのですが、V2だと従来のV1.1と比較してツイート件数や取得できる情報に制限があったので今回はそれをできるだけなくす方法を紹介したいと思います。 以...
タイトルとURLをコピーしました