自然言語処理

Python

【Python】TwitterAPIで取得したツイートから@メンション・リツイート・URLを正規表現で除去する

こんにちは、ミナピピン(@python_mllover)です。 今回はTwitterAPIで取得したツイートデータからメンションやURLを除去して自然言語処理を行う前処理のコードに書いたのでメモとして残しておきます。 ...
Python

【Python】pykakasiで日本語文字列をローマ字に変換する

日本語をローマ字にする処理を自動化する必要がありライブラリを調べていたのですが、その際に「pykakasi」というPythonで日本語をローマ字に変換できる非常に便利なライブラリを見つけたので紹介したいと思います pyka...
Python

【Python】ウマ娘のアプリレビューをスクレイピングしてワードクラウドを作ってみた

こんにちは、ミナピピン(@python_mllover)です。 今回はウマ娘のレビューをスクレイピングしてワードクラウドにしてみましたので結果の紹介になります。 # ライブラリのインストール ! pip insta...
Python

【Python】spacyのload()でja_ginzaがPATHエラーを吐くときの対処法

こんにちは、ミナピピン(@python_mllover)です。spacyで日本語の形態素解析をしようとしたら以下のようなエラーに遭遇したので解決法をメモしておきます !pip install -U ginza impor...
Python

Pythonによる自然言語処理①~janomeを使ってテキストから名詞を抽出する

 テキストデータ(自然言語)の前処理でよくやること 分かち書き URL,スペース,句読点, 記号などのノイズ削除 改行の排除 ・文字データの辞書ベクトル化 自然言語のテキストデータを用...
タイトルとURLをコピーしました