yacyでgoogle八分検索

Web検索データをP2Pで共有するyacyにはgoogle八分検出機能がある。ただし日本語に対応していなかったので、この方法で日本語を使えるようにした

linux http://d.hatena.ne.jp/niitsuma/20100416/1271403446
windows http://d.hatena.ne.jp/niitsuma/20100416/1273138280

次にこれを実際に使ってみる。

適用例としては、グーグル八分対策センター http://www.google8bu.com/ で上げられてる実例1「グロービートジャパン」について調べてみる

googleで検索すると2頁目ぐらいにgoogle八分がある

Wikipediaの関連する項目 [グロービートジャパン平和神軍観察会事件]
http://ja.wikipedia.org/wiki/%E3%82%B0%E3%83%AD%E3%83%BC%E3%83%93%E3%83%BC%E3%83%88%E3%82%B8%E3%83%A3%E3%83%91%E3%83%B3%E5%AF%BE%E5%B9%B3%E5%92%8C%E7%A5%9E%E8%BB%8D%E8%A6%B3%E5%AF%9F%E4%BC%9A%E4%BA%8B%E4%BB%B6
を出発点としてyacyでwebクロールしてから検索してみるとこうなる(yacyにはデフォルトでgoogleとの比較機能がある)

yacyの検索上位に入ってるものでgoogleにないのはhatena関連(hatenaキーワードなど)と、あと以下のサイトがなかった

平和神軍観察会vsグロービートジャパンの裁判記録 http://d.hatena.ne.jp/globeat_saiban/archive

ただしyacyのP2Pネットーワークに参加してくれる人が増えないと本当に検索順位が操作されているかはわからない。