Hatena::ブログ(Diary)

public static void main

誰かが困って検索したときに助けになる話題を書いていければと思っています。

2007-10-23

[][][]LuceneとSenのダウンロード元

毎回ググっても一発で出てこないんでメモしておく。

Luceneミラー

最新版は2.2。

SenとLucene-ja

lucene-ja-2.0test2.zipのlucene-jaが最新版で動く。

2007-06-25

[][]Lucene2.2

なんか気づいたらバージョンアップしてました。インデックスの互換はないそうです。

参考:Apache Lucene - Apache Lucene Core

以前のLuceneだと品詞の情報を保持できず、後からテキストマイニングをしようと思うと面倒だったので最近は使用を控えていたのですが、新しくついた「ペイロード機能」を使えば品詞の情報なども保持できるようになるみたいです。

参考:記事から名詞だけを取り出す | 関口宏司のLuceneブログ

個人的には、point-in-time検索機能が気になります。