こんにちは、ミナピピン(@python_mllover)です!
今回はYahooの提供している形態素解析APIを使って文字列から名詞や動詞を抽出したいと思います。使い方はgithubのアカウントと連携させるだけです。概要やパラメーターについては以下参照↓
概要:https://labs.goo.ne.jp/api/jp/morphological-analysis/
ちなみにYAHOOでは他にも自然言語処理系のAPIサービスを提供しています。
API一覧:https://labs.goo.ne.jp/
yahooの形態素解析APIをpythonで叩く
import json import requests headers = {'Content-Type':'application/x-www-form-urlencoded'} parameters = {"app_id":"<自分のapp_id>", "sentence":"【画像】妹や姉が欲しいとか言ってるやつ、これが現実だからな?", "info_filter":"form|pos"} res = requests.post('https://labs.goo.ne.jp/api/morph',headers=headers, data=parameters) word_lists = json.loads(res.text) path = '' for word in word_lists['word_list'][0]: if word[1] == '名詞': path += word[0]+'-' print(word_lists) print('-------------------------------------') print(path)
<実行結果>
{'info_filter': 'form|pos', 'request_id': 'labs.goo.ne.jp\t1628146098\t0', 'word_list': [[['【', '括弧'], ['画像', '名詞'], ['】', '括弧'], ['妹', '名詞'], ['や', '格助詞'], ['姉', '名詞'], ['が', '格助詞'], ['欲し', '形容詞語幹'], ['い', '形容詞接尾辞'], ['とか', '引用助詞'], ['言', '動詞語幹'], ['っ', '動詞活用語尾'], ['て', '動詞接尾辞'], ['る', '動詞接尾辞'], ['やつ', '名詞'], ['、', '読点'], ['これ', '名詞'], ['が', '格助詞'], ['現実', '名詞'], ['だ', '判定詞'], ['から', '接続接尾辞'], ['な', '終助詞'], ['?', '句点']]]} ------------------------------------- 画像-妹-姉-やつ-これ-現実-
herokuでJanomeを使って形態素解析をしようとしたらメモリがオーバフローしたのでこれで代用しましたが、いい感じです。Limitは今のところ3000/日なので、個人で使う分には問題ないと思います。
では~
コメント
[…] 関連記事:【Python】Yahooのgooラボが提供している形態素解析APIを使って自然言語処理をしてみた […]