Perlプログラムに関する各種メモ書き:タグ「CPAN」での検索

形態素解析Mecab をPerlから使う【Text::Mecab】

◆ Text::Mecab

http://search.cpan.org/~dmaki/Text-MeCab-0.17/lib/Text/MeCab.pm

インストールはCPANから

perl -MCPAN -e shell
install Text::MeCab

でインストール完了。(XSなのでコンパイルしないとインストール出来ません。)


コードはこんな風に書きます。

#! /usr/bin/perl -w

use strict;
use warnings;
use Text::MeCab;

my $m = Text::MeCab->new();
my $s = "日本語の形態素解析のテストを行ってみます";
my $n = $m->parse($s);
while ($n = $n->next) {
    printf("%s?t%s?t%d?n",
           $n->surface,          # 表層
           $n->feature,          # 現在の品詞
           $n->cost              # その形態素までのコスト
           );
}


実行結果

日本語     名詞,一般,*,*,*,*,日本語,ニッポンゴ,ニッポンゴ   -569
の       助詞,連体化,*,*,*,*,の,ノ,ノ    5
形態素     名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ   3062
解析      名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ    6884
の       助詞,連体化,*,*,*,*,の,ノ,ノ    7963
テスト     名詞,サ変接続,*,*,*,*,テスト,テスト,テスト     9944
を       助詞,格助詞,一般,*,*,*,を,ヲ,ヲ   9720
行っ      動詞,自立,*,*,五段・ワ行促音便,連用タ接続,行う,オコナッ,オコナッ   11787
て       助詞,接続助詞,*,*,*,*,て,テ,テ   10289
み       動詞,非自立,*,*,一段,連用形,みる,ミ,ミ        15340
ます      助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス    12780
        BOS/EOS,*,*,*,*,*,*,*,* 10261

No.508
06/30 17:02

edit

CPAN

CPANをインストールする

まず最初にCPANの設定を行う。コマンドラインから次のように打ち込む

perl -MCPAN -e shell

いろいろと設定の質問をされるが基本的に[enter]をそのまま押していくだけでよい。 地域と国を聞かれたら Asia Japan を選択しておけばOK!

CPANのインストールが完了したら

install モジュール名
(例: install Jcode)

でモジュールがインストールできる。(その時に必要なモジュールがあった場合も自動的にインストールされる) 便利!!

インストール済みのCPANモジュールを表示させるには

cpan -a 

とする

cpanを再設定するには cpanシェルから

o conf init

MacOSXにインストールするときはあらかじめ「デベロッパーツール(Xcode Tools)」をインストールしておくこと。

No.168
10/09 10:25

edit

CPAN

CPANモジュールのバージョンを調べる

コマンドラインから
perl -M「モジュール名」 -e 'print $「モジュール名」::VERSION'

例)例えば「DBIモジュール」のバージョンを調べたいときは
perl -MDBI -e 'print $DBI::VERSION'

でOK。
No.132
12/03 11:29

edit

CPAN