今回はGoogle Colaboratory環境でMeCabをインストールして自然言語処理を行う方法について紹介します
Google ColaboratoryにMecabをインストールして形態素解析するサンプルコード
以下のコマンドをコピペして実行するだけでMecabと辞書がインストールされます。
!pip install mecab-python3 unidic-lite !apt install aptitude !aptitude install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file -y !pip install mecab-python3==0.7 !apt-get -q -y install sudo file mecab libmecab-dev mecab-ipadic-utf8 git curl python-mecab > /dev/null !git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git > /dev/null !echo yes | mecab-ipadic-neologd/bin/install-mecab-ipadic-neologd -n > /dev/null 2>&1 !pip install mecab-python3 > /dev/null # シンボリックリンクによるエラー回避 !ln -s /etc/mecabrc /usr/local/etc/mecabrc
インストールが完了したら確認のために簡単な形態素解析を行ってみます。
import MeCab print(MeCab.Tagger().parse("吾輩は猫である"))
<実行結果>
吾輩 名詞,代名詞,一般,*,*,*,吾輩,ワガハイ,ワガハイ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 猫 名詞,一般,*,*,*,*,猫,ネコ,ネコ で 助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ ある 助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル EOS
これで簡単に自然言語処理の環境が整いました。ローカルのPCにmecabと辞書を入れるとPATHとかがめんどくさいので、簡単な自然言語処理はgooglecolabでよくね?と思い始めている今日この頃です。
コメント
[…] 関連記事:Google ColaboratoryにMecabをインストールして形態素解析を行うサンプルコード […]
[…] 参照:Google ColaboratoryにMecabをインストールして形態素解析を行うサンプルコード […]