Python Webアプリケーション

【Python】Yahooのgooラボが提供している形態素解析APIを使って自然言語処理をしてみた

この記事は約3分で読めます。

 

こんにちは、ミナピピン(@python_mllover)です!

 

今回はYahooの提供している形態素解析APIを使って文字列から名詞や動詞を抽出したいと思います。使い方はgithubのアカウントと連携させるだけです。概要やパラメーターについては以下参照↓

概要:https://labs.goo.ne.jp/api/jp/morphological-analysis/

 

ちなみにYAHOOでは他にも自然言語処理系のAPIサービスを提供しています。

API一覧:https://labs.goo.ne.jp/

 

 

スポンサーリンク
スポンサーリンク

yahooの形態素解析APIをpythonで叩く

 

import json
import requests 
headers = {'Content-Type':'application/x-www-form-urlencoded'}
parameters = {"app_id":"<自分のapp_id>",  
              "sentence":"【画像】妹や姉が欲しいとか言ってるやつ、これが現実だからな?", 
              "info_filter":"form|pos"}

res = requests.post('https://labs.goo.ne.jp/api/morph',headers=headers, data=parameters)
word_lists = json.loads(res.text)
path = ''
for word in word_lists['word_list'][0]:
    if word[1] == '名詞':
        path += word[0]+'-'
print(word_lists)
print('-------------------------------------')
print(path)

 

<実行結果>

{'info_filter': 'form|pos', 'request_id': 'labs.goo.ne.jp\t1628146098\t0', 'word_list': [[['【', '括弧'], ['画像', '名詞'], ['】', '括弧'], ['妹', '名詞'], ['や', '格助詞'], ['姉', '名詞'], ['が', '格助詞'], ['欲し', '形容詞語幹'], ['い', '形容詞接尾辞'], ['とか', '引用助詞'], ['言', '動詞語幹'], ['っ', '動詞活用語尾'], ['て', '動詞接尾辞'], ['る', '動詞接尾辞'], ['やつ', '名詞'], ['、', '読点'], ['これ', '名詞'], ['が', '格助詞'], ['現実', '名詞'], ['だ', '判定詞'], ['から', '接続接尾辞'], ['な', '終助詞'], ['?', '句点']]]}
-------------------------------------
画像-妹-姉-やつ-これ-現実-

 

herokuでJanomeを使って形態素解析をしようとしたらメモリがオーバフローしたのでこれで代用しましたが、いい感じです。Limitは今のところ3000/日なので、個人で使う分には問題ないと思います。

 

では~

 

 

 

コメント

タイトルとURLをコピーしました