(2008年当時のメモ)わずか25KBほどの日本語の分かち書き分割器TinySegmenterでは解析の為の辞書を使用せず、機械学習のみで行なっているそうです。日本語として正しく書かれている新聞記事などに対して強いが、チャットやブログなどで書かれる口語体などのくだけた文章に対しては精度が低くなりがちのようだ。今後は品詞の推定も予定されている(これができると本当に素晴らしい)。今後に期待がかかるソフトウェアだ。 [ブックマーク]TinySegmenter: Javascriptだけで実装されたコンパクトな分かち書きソフトウェア(注:http接続です!気になる方はクリックしないほうがいいです) c…