隠れん坊将軍の隠れ蓑

Tuesday
September 23
2008

深江直人(カッペ)さんのサイトは邪魔だよね、という話

タイトルにどう書こうかと悩んだんだけど、どうしてもこんな感じになってしまう。いきなり相手の実名出して「邪魔」などと言い放つのはどうなのか…と思いつつも、こういう表現しかしようがない感じ。

このカッペ氏が運営してるのはいわゆるbot型のまとめサイトで、色んなSBMサービス*1でクリップされたエントリーを自動抽出してデータベース化しているらしいです。例えばこんな感じで

で、はっきり言ってしまえば、こういうページって邪魔なんですよ。こういうページ、という表現にははてブのコメント一覧ページなんかも含まれるんですが…コメントは読みたい時に自分の意志で読みに行くものであって、強制的に見せられても大抵の場合は有用性が低いと思うんです。いや、有用性云々を言う前にそもそも、検索結果をクリックした時に「見たい」と思っているのはそのコンテンツ自体であって、その一つ外側の(メタな)ページなんて見たくないんですよ。ime.nuが邪魔なのと似てる。

f:id:Falky:20080923132239p:image
【図1】「デザイン パンくずリスト Web2.0」でのGoogle検索結果の一例。

上の画像には同じエントリが2つ見えてますが、どちらもカッペ氏のまとめサイトであり、Breadcrumb CSS - Appleに習うパンくずデザインCSS - youmosへ飛ぶにはもう1クリックしなければなりません。URLに「frame_」というのが含まれてるやつはもっとあからさまに邪魔で、コメントがニコニコ風に流れる

前述のメタページが邪魔ってのもあるんですけど、もうなんかそれ以前の話で、これアフィ狙いの検索spamとしか思えないんですよ。本当にイライラしちゃう。

カッペ氏のまとめサイトは現在のところ、

と14ほどあるようです。

とりあえずこれらのページを飛ばして直接エントリへ移動するProxomitronフィルタも書いてみましたが…

[Patterns]
Name = "KAPPE | url jump 20080923"
Active = TRUE
URL = "[^.]+.(rightclicksright|designlinkdatabase|thumbnailcloud|basefeed).net/(data|feed)/ $TYPE(htm)"
Limit = 300
Match = "<a id="lnkOutbound" href="\0"[^>]+>|"
        "<h3[^>]+><a href=$AV([^?]+?url=\0)[^>]+>"
Replace = "$STOP()"
          "<script type="text/javascript">document.location=""
          "$UESC(\0)"
          "";</script>"

それでもやっぱり、同じURLが検索に引っかかりまくるのは単純に邪魔。検索結果から除外するってのも考えた方が良いかもしれないなぁ。

追記

検索結果から除外するフィルタを書きました。