Python3でCaboChaを使う際の環境設定
筆者の開発環境
- macOS Sierra ver. 10.12.6
- MacBook Pro (Retina, 13-inch, Mid 2014)
- zsh
- Homebrew
CaboChaをインストールする方法
CaboChaをインストールする為には、MeCabとCRF++を先にインストールする必要があります。今回は、Homebrewを用いてインストールしていくので、Homebrewをインストールしていない方は先にインストールする必要があります。その為、全体の流れは下記のようになります。
- Homebrewのインストール(必要な方のみ)
- MeCabのインストール
- CRF++のインストール
- CaboChaのインストール
- 動作確認
1. Homebrewのインストール
今回は、Homebrewのインストールに関しては割愛します。詳細を知りたい方やインストールが済んでいない方はこちらを参考にしてください。
kakubari-ryusei.hatenablog.com
2. MeCabのインストール
MeCabはHomebrewがあると簡単にインストールすることができます。その方法は下記の記事で紹介していますので、参考にしてください。
kakubari-ryusei.hatenablog.com
3. CRF++のインストール
CRF++もMeCabと同様に、Homebrewでインストールできます。下記のコマンドをターミナルで入力するだけで完了です。
% brew install crf++
4. CaboChaのインストール
ここで、本題のCaboChaのインストールになります。CaboChaもHomebrewでインストールができるので、サクッとインストールします。
% brew install cabocha
これで、ターミナルでcabocha
を入力すると、CaboChaが立ち上がります。例えば、「私はバスに乗って駅へ向かった。」という文を解析してみると、下記のような結果が得られます。
% cabocha 私はバスに乗って駅へ向かった。 私は-------D バスに-D | 乗って---D 駅へ-D 向かった。 EOS
また、オプションで-I0 -O2
と指定することで、文節区切りまでの結果を出力させることもできます。
% cabocha -I0 -O2 私はバスに乗って駅へ向かった。 * 0 -1D 私 代名詞,*,*,*,*,*,ワタクシ,私-代名詞,私,ワタクシ,私,ワタクシ,和,*,*,*,* は 助詞,係助詞,*,*,*,*,ハ,は,は,ワ,は,ワ,和,*,*,*,* * 1 -1D バス 名詞,普通名詞,一般,*,*,*,バス,バス-bus,バス,バス,バス,バス,外,*,*,*,* に 助詞,格助詞,*,*,*,*,ニ,に,に,ニ,に,ニ,和,*,*,*,* * 2 -1D 乗っ 動詞,一般,*,*,五段-ラ行,連用形-促音便,ノル,乗る,乗っ,ノッ,乗る,ノル,和,*,*,*,* て 助詞,接続助詞,*,*,*,*,テ,て,て,テ,て,テ,和,*,*,*,* * 3 -1D 駅 名詞,普通名詞,一般,*,*,*,エキ,駅,駅,エキ,駅,エキ,漢,*,*,*,* へ 助詞,格助詞,*,*,*,*,ヘ,へ,へ,エ,へ,エ,和,*,*,*,* * 4 -1D 向かっ 動詞,一般,*,*,五段-ワア行,連用形-促音便,ムカウ,向かう,向かっ,ムカッ,向かう,ムカウ,和,*,*,*,* た 助動詞,*,*,*,助動詞-タ,終止形-一般,タ,た,た,タ,た,タ,和,*,*,*,* 。 補助記号,句点,*,*,*,*,,。,。,,。,,記号,*,*,*,* EOS
ここまでの作業では、ターミナルでCaboChaを使用することができていることが確認できます。Python3でCaboChaを使用するためには、import CaboCha
をプログラム内で記述する必要があります。
筆者の場合は、この段階でインポートしようとしても、CaboChaというモジュールはないと言われてしまいました。色々と調べてみると、CaboChaをPython内で使用するための設定ができていないようです。そのため、下記の方法で、解決しました。
まず、公式サイトからCaboChaをダウンロードします。今回は最新版のcabocha-0.69.tar.bz2をダウンロードしました。
次に、ダウンロードしたファイル(cabocha-0.69.tar.bz2)を展開し、cabocha-0.69を得ます。そして、そのディレクトリに移動し、設定します。具体的なコマンドは次のようになります。
% ./configure --with-mecab-config=`which mecab-config` --with-charset=UTF8 --with-posset=UNIDIC % make % make install % cd python % sudo pyhton3 setup.py install
5. 動作確認
ここで、次のようにコマンドを入力してエラーにならなければ、無事にPython3で使用できるようになっています。
% python3 Python 3.5.1 |Anaconda 4.0.0 (x86_64)| (default, Dec 7 2015, 11:24:55) [GCC 4.2.1 (Apple Inc. build 5577)] on darwin Type "help", "copyright", "credits" or "license" for more information. >>> import CaboCha >>>
これで一連の作業は終了になります。お疲れ様でした。