Python 【Python】TwitterAPIで取得したツイートから@メンション・リツイート・URLを正規表現で除去する こんにちは、ミナピピン(@python_mllover)です。 今回はTwitterAPIで取得したツイートデータからメンションやURLを除去して自然言語処理を行う前処理のコードに書いたのでメモとして残しておきます。 ... 2021.12.13 Pythonデータ分析プログラミング自然言語処理
Python 【Python】pykakasiで日本語文字列をローマ字に変換する 日本語をローマ字にする処理を自動化する必要がありライブラリを調べていたのですが、その際に「pykakasi」というPythonで日本語をローマ字に変換できる非常に便利なライブラリを見つけたので紹介したいと思います pyka... 2021.12.09 Pythonプログラミング自然言語処理
Python 【Python】ウマ娘のアプリレビューをスクレイピングしてワードクラウドを作ってみた こんにちは、ミナピピン(@python_mllover)です。 今回はウマ娘のレビューをスクレイピングしてワードクラウドにしてみましたので結果の紹介になります。 # ライブラリのインストール ! pip insta... 2021.11.13 Pythonプログラミング機械学習自然言語処理
Python 【Python】spacyのload()でja_ginzaがPATHエラーを吐くときの対処法 こんにちは、ミナピピン(@python_mllover)です。spacyで日本語の形態素解析をしようとしたら以下のようなエラーに遭遇したので解決法をメモしておきます !pip install -U ginza impor... 2021.11.12 Python自然言語処理
Python Pythonによる自然言語処理①~janomeを使ってテキストから名詞を抽出する テキストデータ(自然言語)の前処理でよくやること 分かち書き URL,スペース,句読点, 記号などのノイズ削除 改行の排除 ・文字データの辞書ベクトル化 自然言語のテキストデータを用... 2019.06.07 Pythonデータ分析自然言語処理