自然言語処理

Python

mecab-python で [ifs] no such file or directory: c:\mecab\mecabrc エラーが出た話

pymlaskで感情分析をしようとした時にエラーに遭遇したのでメモしておきます。 from mlask import MLAsk emotion_analyzer = MLAsk() emotion_analyzer....
Python

【Python】Googleの「NaturalLanguage API」を使って形態素解析をやってみた

こんにちは、ミナピピン(@python_mllover)です!前回はyahooのgooラボが提供している自然言語処理APIを使って形態素解析を行いましたが、あのあと実際に自分のプログラムに組み込んで形態素解析に使っていたところ、漫画...
Python

【Python】GoogleColab上でNetworkXによる日本語の共起ネットワークを文字化けせずにプロット

今回はテキストデータから共起ネットワークをプロットします。そもそも共起ネットワークとは同時に出現する単語の組み合わせをエッジで繋ぎ、単語間の関係をネットワークで表したものです。これにより、文章内の単語の関連性を可視化できます...
Python

【Python】PymlaskでML-ASK感情分析をやってみた話

ML-Askで何ができるのか ML-Askでは感情の推定ができます。デフォルトの辞書では2,100語の辞書によるパターンマッチングで{喜, 怒, 哀, 怖, 恥, 好, 厭, 昂, 安, 驚}の10種類の感情を推定します。この...
Python

【Python】TwitterAPIで取得したツイートから@メンション・リツイート・URLを正規表現で除去する

こんにちは、ミナピピン(@python_mllover)です。 今回はTwitterAPIで取得したツイートデータからメンションやURLを除去して自然言語処理を行う前処理のコードに書いたのでメモとして残しておきます。 ...
Python

【Python】pykakasiで日本語文字列をローマ字に変換する

日本語をローマ字にする処理を自動化する必要がありライブラリを調べていたのですが、その際に「pykakasi」というPythonで日本語をローマ字に変換できる非常に便利なライブラリを見つけたので紹介したいと思います pyka...
Python

【Python】ウマ娘のアプリレビューをスクレイピングしてワードクラウドを作ってみた

こんにちは、ミナピピン(@python_mllover)です。 今回はウマ娘のレビューをスクレイピングしてワードクラウドにしてみましたので結果の紹介になります。 # ライブラリのインストール ! pip insta...
Python

【Python】spacyのload()でja_ginzaがPATHエラーを吐くときの対処法

こんにちは、ミナピピン(@python_mllover)です。spacyで日本語の形態素解析をしようとしたら以下のようなエラーに遭遇したので解決法をメモしておきます !pip install -U ginza impor...
Python

Pythonによる自然言語処理①~janomeを使ってテキストから名詞を抽出する

 テキストデータ(自然言語)の前処理でよくやること 分かち書き URL,スペース,句読点, 記号などのノイズ削除 改行の排除 ・文字データの辞書ベクトル化 自然言語のテキストデータを用...
タイトルとURLをコピーしました