かっくんの学習記録

エンジニアの卵が綴る学習の記録です。何かの参考になれば嬉しいです。

Python3でCaboChaを使う際の環境設定

筆者の開発環境

CaboChaをインストールする方法

 CaboChaをインストールする為には、MeCabとCRF++を先にインストールする必要があります。今回は、Homebrewを用いてインストールしていくので、Homebrewをインストールしていない方は先にインストールする必要があります。その為、全体の流れは下記のようになります。

  1. Homebrewのインストール(必要な方のみ)
  2. MeCabのインストール
  3. CRF++のインストール
  4. CaboChaのインストール
  5. 動作確認

1. Homebrewのインストール

 今回は、Homebrewのインストールに関しては割愛します。詳細を知りたい方やインストールが済んでいない方はこちらを参考にしてください。

kakubari-ryusei.hatenablog.com

2. MeCabのインストール

 MeCabはHomebrewがあると簡単にインストールすることができます。その方法は下記の記事で紹介していますので、参考にしてください。

kakubari-ryusei.hatenablog.com

3. CRF++のインストール

 CRF++もMeCabと同様に、Homebrewでインストールできます。下記のコマンドをターミナルで入力するだけで完了です。

% brew install crf++

4. CaboChaのインストール

 ここで、本題のCaboChaのインストールになります。CaboChaもHomebrewでインストールができるので、サクッとインストールします。

% brew install cabocha

これで、ターミナルでcabochaを入力すると、CaboChaが立ち上がります。例えば、「私はバスに乗って駅へ向かった。」という文を解析してみると、下記のような結果が得られます。

% cabocha
私はバスに乗って駅へ向かった。
      私は-------D
      バスに-D   |
        乗って---D
            駅へ-D
        向かった。
EOS

また、オプションで-I0 -O2と指定することで、文節区切りまでの結果を出力させることもできます。

% cabocha -I0 -O2
私はバスに乗って駅へ向かった。
* 0 -1D
私 代名詞,*,*,*,*,*,ワタクシ,私-代名詞,私,ワタクシ,私,ワタクシ,和,*,*,*,*
は 助詞,係助詞,*,*,*,*,ハ,は,は,ワ,は,ワ,和,*,*,*,*
* 1 -1D
バス  名詞,普通名詞,一般,*,*,*,バス,バス-bus,バス,バス,バス,バス,外,*,*,*,*
に 助詞,格助詞,*,*,*,*,ニ,に,に,ニ,に,ニ,和,*,*,*,*
* 2 -1D
乗っ  動詞,一般,*,*,五段-ラ行,連用形-促音便,ノル,乗る,乗っ,ノッ,乗る,ノル,和,*,*,*,*
て 助詞,接続助詞,*,*,*,*,テ,て,て,テ,て,テ,和,*,*,*,*
* 3 -1D
駅 名詞,普通名詞,一般,*,*,*,エキ,駅,駅,エキ,駅,エキ,漢,*,*,*,*
へ 助詞,格助詞,*,*,*,*,ヘ,へ,へ,エ,へ,エ,和,*,*,*,*
* 4 -1D
向かっ   動詞,一般,*,*,五段-ワア行,連用形-促音便,ムカウ,向かう,向かっ,ムカッ,向かう,ムカウ,和,*,*,*,*
た 助動詞,*,*,*,助動詞-タ,終止形-一般,タ,た,た,タ,た,タ,和,*,*,*,*
。 補助記号,句点,*,*,*,*,,。,。,,。,,記号,*,*,*,*
EOS

ここまでの作業では、ターミナルでCaboChaを使用することができていることが確認できます。Python3でCaboChaを使用するためには、import CaboChaをプログラム内で記述する必要があります。

筆者の場合は、この段階でインポートしようとしても、CaboChaというモジュールはないと言われてしまいました。色々と調べてみると、CaboChaをPython内で使用するための設定ができていないようです。そのため、下記の方法で、解決しました。


まず、公式サイトからCaboChaをダウンロードします。今回は最新版のcabocha-0.69.tar.bz2をダウンロードしました。

次に、ダウンロードしたファイル(cabocha-0.69.tar.bz2)を展開し、cabocha-0.69を得ます。そして、そのディレクトリに移動し、設定します。具体的なコマンドは次のようになります。

% ./configure --with-mecab-config=`which mecab-config` --with-charset=UTF8 --with-posset=UNIDIC
% make
% make install
% cd python
% sudo pyhton3 setup.py install

5. 動作確認

 ここで、次のようにコマンドを入力してエラーにならなければ、無事にPython3で使用できるようになっています。

% python3
Python 3.5.1 |Anaconda 4.0.0 (x86_64)| (default, Dec  7 2015, 11:24:55)
[GCC 4.2.1 (Apple Inc. build 5577)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import CaboCha
>>>

これで一連の作業は終了になります。お疲れ様でした。