ちょっと MeCab とかで遊びたくなったので、インストールとかのメモ。
基本的には、各ドキュメントにあるインストール方法そのままだったりします。
MeCab のインストール
まぁ、公式サイト通りに。
$ wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE" -o mecab-0.996.tar.gz $ tar zxfv mecab-0.996.tar.gz $ cd mecab-0.996 $ ./configure $ make $ make check $ sudo make install
辞書のインストール
推奨されている、 IPA 辞書をインストールします。
ただ、 configure するときに、 --with-charset=utf8
を指定しないと文字化けするので注意。
$ wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM" -o mecab-ipadic-2.7.0-20070801.tar.gz $ tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801 $ ./configure --with-charset=utf8 $ make $ sudo make install
あと、新語に対応した NEologd もインストールしておきます。
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git $ cd mecab-ipadic-neologd $ ./bin/install-mecab-ipadic-neologd -n
CaboCha のインストール
CRF++ が必要なので、まずはそれから。
$ wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7QVR6VXJ5dWExSTQ" -O CRF++-0.58.tar.gz $ tar zxfv CRF++-0.58.tar.gz $ cd CRF++-0.58 $ ./configure $ make $ sudo make install
で、 CaboCha。
こちらも、 --with-charset=utf8
を忘れずに。
$ wget "https://googledrive.com/host/0B4y35FiV1wh7cGRCUUJHVTNJRnM/cabocha-0.69.tar.bz2" -O cabocha-0.69.tar.bz2 $ tar jxvf cabocha-0.69.tar.bz2 $ cd cabocha-0.69 $ ./configure --with-charset=utf8 $ make $ sudo make install
これで、インストールは完了。
使うときはこんな感じ。
$ cabocha -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd 10日放送の「中居正広のミになる図書館」(テレビ朝日系)で、SMAPの中居正広が、篠原信一の過去の勘違いを明かす一幕があった。 10日放送の-D 「中居正広のミになる図書館」-D (テレビ朝日系)で、---------------D SMAPの-D | 中居正広が、-----------D 篠原信一の---D | 過去の-D | 勘違いを-D | 明かす-D | 一幕が-D あった。 EOS
おわり。