Perlプログラムに関する各種メモ書き

形態素解析Mecab をPerlから使う【Text::Mecab】

◆ Text::Mecab

http://search.cpan.org/~dmaki/Text-MeCab-0.17/lib/Text/MeCab.pm

インストールはCPANから

perl -MCPAN -e shell
install Text::MeCab

でインストール完了。(XSなのでコンパイルしないとインストール出来ません。)


コードはこんな風に書きます。

#! /usr/bin/perl -w

use strict;
use warnings;
use Text::MeCab;

my $m = Text::MeCab->new();
my $s = "日本語の形態素解析のテストを行ってみます";
my $n = $m->parse($s);
while ($n = $n->next) {
    printf("%s?t%s?t%d?n",
           $n->surface,          # 表層
           $n->feature,          # 現在の品詞
           $n->cost              # その形態素までのコスト
           );
}

実行結果

日本語     名詞,一般,*,*,*,*,日本語,ニッポンゴ,ニッポンゴ   -569
の       助詞,連体化,*,*,*,*,の,ノ,ノ    5
形態素     名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ   3062
解析      名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ    6884
の       助詞,連体化,*,*,*,*,の,ノ,ノ    7963
テスト     名詞,サ変接続,*,*,*,*,テスト,テスト,テスト     9944
を       助詞,格助詞,一般,*,*,*,を,ヲ,ヲ   9720
行っ      動詞,自立,*,*,五段・ワ行促音便,連用タ接続,行う,オコナッ,オコナッ   11787
て       助詞,接続助詞,*,*,*,*,て,テ,テ   10289
み       動詞,非自立,*,*,一段,連用形,みる,ミ,ミ        15340
ます      助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス    12780
        BOS/EOS,*,*,*,*,*,*,*,* 10261



関連エントリー

No.508
06/30 17:02

edit

CPAN