gaeeyoの日記 RSSフィード

2009年12月10日(木)

[][] Tokyo Cabinet で全文検索

ここの何日かで↑この記事を見てLIKEじゃない検索を試していたんだけどいくつか不満があって、これとは別の手段を探していたところ...

↑こちらは「超」がつくほどお手軽だということで試すことに。


私があほすぎるためにいろんな段階で困ったけど、とりあえず期待通りに動いたので簡単なテストをしてみた。

しょぼいカレンダーのタイトルのデータを使って TID={Comment='こめんと'} な形式でデータを入れてCommentにインデックスつけておく。で、ランダムに選んだ1〜3つのワードで200回検索してみるテスト。

phpからTokyo Tyrantを扱うライブラリは2つ試した。

結果の一部。
tt0[   1] tt1[   1] mysql[   1] 安部貴俊
tt0[  14] tt1[  14] mysql[  14] 劇場版
tt0[   0] tt1[   0] mysql[   0] 増尾昭一 きただにひろし
tt0[   0] tt1[   0] mysql[   0] 枢やな スネオヘアー 「コンプエース」
tt0[   0] tt1[   0] mysql[   0] HIRO☆TAKAMI 藤本さとる 面出明美
tt0[   0] tt1[   0] mysql[   0] 冨永愛 東京放送 増田幹生
tt0[   0] tt1[   0] mysql[   0] Masahiro,Kiyoshi 岡田和則 結城辰弥
tt0[   0] tt1[   0] mysql[   0] 窪田健一 村上悦也
tt0[   1] tt1[   1] mysql[   1] ウルトラジャンプエッグ
tt0[   1] tt1[   1] mysql[   1] こんのひとみ
tt0[   0] tt1[   0] mysql[   0] ベツコミ 本山哲
tt0[   0] tt1[   0] mysql[   0] 末永雄一 マッグガーデン
tt0[   9] tt1[   9] mysql[   9] 田中涼子
tt0[   1] tt1[   1] mysql[   1] 水野和則
tt0[   0] tt1[   0] mysql[   0] 今村卓博 古川昌義 Hans Zimmer
-----------------------------------------------------------------------------------------------
Section                        Total Ex Time         Netto Ex Time         #Calls    Percentage
-----------------------------------------------------------------------------------------------
TokyoTyrant                    0.12526106834412      0.12526106834412      200           N/A
Net_TokyoTyrant                0.08645224571228      0.08645224571228      200           N/A
PDO_mysql                      6.2304773330688       6.2304773330688       200           N/A

PurePHPのNet_TokyoTyrantのほうが、PECLのライブラリ使うより速いのは謎。

ともかく、どちらのライブラリを使ってもとても簡単でパワフルそうな雰囲気。

こりゃいいや。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/gae/20091210/1260460098