Hatena::ブログ(Diary)

sileの日記

2010-07-24

ham: ベイジアンフィルタ

手軽に使える二値分類器*1が急遽必要になったので、ベイジアンフィルタを用いたものを実装。

素性にはNグラムを採用。

対応文字コードUTF-8のみ。

多分実用程度には高速。


分類性能評価的なことはこれから行う予定。

それらしいデータを用意しないと...。

*1:要件:
日本語対応
学習結果をファイルに保存可能
コマンドインターフェース
そこそこ高速な分類速度
それなりの分類精度
依存パッケージなし

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/sile/20100724/1279986004