spiritlooseのはてなダイアリー このページをアンテナに追加 RSSフィード

2008-02-28

[][]Text::TinySegmenter(TinySegmenterのPerl移植版)リリース


http://search.cpan.org/dist/Text-TinySegmenter/


TinySegmenterPerlに移植した。


PurePerlでシンプルにさくっと分かち書き。

use utf8;
use Text::TinySegmenter;

my $str = '私の名前は中野です';
my @words = Text::TinySegmenter->segment($str);
# got ('私', 'の', '名前', 'は', '中野', 'です')

工藤さんもおっしゃってるように品詞を特定するのはきつい。

そういうことやりたいならMeCabつかえってことで。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

Connection: close