Hatena::ブログ(Diary)

ARTIFACT@ハテナ系 このページをアンテナに追加 RSSフィード Twitter

日記一覧 注目エントリー 人気エントリー

2005-11-08

はてなブックマークの検索は精度が低過ぎ

前から思っていたんだけど、わかりやすい具体例があったので。

http://b.hatena.ne.jp/kanose/

ここから下の検索ボックスで「民族」を検索すると、

はてなブックマーク - はてなダイアリー - 終わらぬ「民族浄化セルビア・モンテネグロ

http://b.hatena.ne.jp/entry/http://d.hatena.ne.jp/asin/4087202976

しか出てこない。

しかし、下記も「民族」の文字が入っているが検索結果表示に出てこない。

はてなブックマーク - 貂主の国:ツラン民族圏

http://b.hatena.ne.jp/entry/http://blog.goo.ne.jp/north_eurasia/e/2ffb90126ce018b9e1f891b780f62827

なんでこういう現象起きるのかなあ…。

はてなブックマークは、自分がフィルターをかけたURLに対する絞り込み検索として使えそうなんだけど、こういうことがあるから使えないのが残念。結局タグを絶対つけないとまずいという。

※追記

はてブid:Retasuさんから情報提供。

はてなアイデア - [不具合]検索結果がおかしい。nobodyのブックマークから「それくらいの暗算はで」で検索すると1件hitするが「暗算はでき」で検索すると何もhitしない。同じものがhitすべき。

http://i.hatena.ne.jp/idea/5690

はてなアイデア - 一文字を検索した場合、結果が出ず、挙動も妙になりました。修正願います。(例)

http://i.hatena.ne.jp/idea/357

一文字検索は負荷が大きいからできない、ってのはわかるけど、単純な文字列マッチングができないのはなあ…。

TigerTiger 2005/11/08 22:47 はてなアイデアを読むと、単純な文字列マッチではないかという話しもありますが、やっぱり、今はもう形態素解析してインデックス作っているんじゃないですかね。それが原因みたいな気がします。その場合、インデックスの区切りを間違っちゃうと絶対マッチしませんね。

はてなキーワードも変な位置でキーワードがマッチしているときがありますね。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト

コメントを書くには、なぞなぞ認証に回答する必要があります。