UNIX ( Linux FreeBSD )のコマンドに関する各種メモ書き

形態素解析ソフト「mecab」を使ってみる

mecabのダウンロード

http://mecab.sourceforge.jp/ から

「mecab-0.93.tar」(mecab本体)

「mecab-ipadic-2.7.0-20060707.tar」(辞書ファイル)

をダウンロードする。

mecabのインストール

tar xvf mecab-0.93.tar
cd mecab-0.93
./configure
make
make install

辞書のインストール(./configure --with-charset=utf8 で文字コードをutf8にしている)

tar xvf mecab-ipadic-2.7.0-20060707.tar
cd mecab-ipadic-2.7.0-20060707.tar
./configure --with-charset=utf8
make
make install

使い方

mecab

でmecabを起動する。

後は解析したい日本語を入力するだけ。

日本語の形態素解析を行ってみます。
日本語     名詞,一般,*,*,*,*,日本語,ニホンゴ,ニホンゴ
の       助詞,連体化,*,*,*,*,の,ノ,ノ
形態素     名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析      名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
を       助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
行っ      動詞,自立,*,*,五段・ワ行促音便,連用タ接続,行う,オコナッ,オコナッ
て       助詞,接続助詞,*,*,*,*,て,テ,テ
み       動詞,非自立,*,*,一段,連用形,みる,ミ,ミ
ます      助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。       記号,句点,*,*,*,*,。,。,。

コマンドラインからmecabを使うには do_mecab というシェルスクリプトを作成する。

/usr/local/bin/do_mecabというファイルを下記の内容で作成する

#! /bin/sh
echo $*|/usr/local/bin/mecab

作成後実行権限を与える

chmod 755 do_mecab

これで

do_mecab 日本語の形態素解析を行ってみます。

で実行できる。

MeCab使い方:http://mecab.sourceforge.jp/#usage-tools


No.322
04/11 10:41

edit