Hatena::ブログ(Diary)

hoshikuzu | star_dust の書斎 このページをアンテナに追加 RSSフィード Twitter

hoshikuzu|star_dustの日記について

書く内容の方針とかはフラフラしているのです。あまり考えていないかも知れません。面白いなぁと思うこと、大事なことだなぁと思うことを書いています。あんまり悲しいことは書かない主義。

 | 

2005-09-10 このエントリーを含むブックマーク このエントリーのブックマークコメント

Googleによる検索結果からの閲覧情報取得蓄積はいつから始まっていたのか

I support individual rights

id:RIPさんのところへ持ち込んだネタの関連で。

RIPさんがみつけた、「Googleで検索した後、実際にページを見に行った行動について、Googleのサーバにその情報が送られている」という仕組みを読んで、私はゾっとしたのでした。以下。

上記記事だけでもGoogleの処理は確かに気に入らないのですが、検索キーワードと具体的にどのページが見られたかの関連付けは、検索エンジンのユーザビリティーをあげる為の統計処理と考えれば、まだ納得できる範囲、というのが大方の見方でしょう。ページランク調整という奴ですな。個人と結びつける意図が薄ければまぁ許容範囲かと。

ところがRIPさんの記事を読んでいたら、つい最近ブックマークレット関連でたまたま見かけた情報が頭をよぎったのです。GoogleのCookieにIDが付与されているよ、という記事でした。

両者を結びつければ、Googleはスパイウェア一歩手前であるという冷や汗が出たのです。匿名ながら個人別の名寄せが出来てしまうと。そこで、RIPさんの日記のコメント欄でタレこんだのでした。

されど、そこに留まりませんでした。RIPさんの知見により、Gmailアカウントとの関連付けが指摘されたのです。これで、個人との連結が可能なプロファイリングが可能であることが判明したわけです。(もちろん、しているかどうかは決め付けることは出来ません。が、していなければ、なんでCookieにIDが?)

さて、私は読みもしない、後で読もうと放っておく「つんどく」ブックマークがありまして。その中から本日、関連情報を発掘しました。以下に。

私はjavascriptはよくわかりませんが、ルートディレクトリ:ウェブマーケティングの長い尻尾をつかまえろの主宰者のJeff RootさんがGoogleについて発見したものと、RIPさんが発見したものとは深い相似があります。Google側が求める情報は全く同じでしょう。Jeff Rootさんの上記記事は、昨年、2004年01月23日の記事です。少なくとも、その頃からは、追跡していたのでしょう。

一方、Googleのクッキー内に、セッションIDでもないことがわかっているPREF=IDという変なものがあるなぁという気分がしていたのは、いつからかわかりませんけれど、かなり前からです。Cookieの中身を見る癖はありませんが(笑)セキュリティ系の記事を探し回れば何かわかるのかもしれません。…でも私、そのような根性ないなぁ。

23/Jun/2004において、PREF=IDがcookie中にあったことは、Web Security and Mobile Codeで判明しています。もう少し昔のデータはないものかなぁ。ん?October 17, 2003 の記事がありました。BLOGKID: Google PageRankがそれ。Jan 7, 2002 にもあやしげなものが。古くからなのですね(汗)。CAUTION: PRmaster sends unique ID to Google……ふう。2002年までは遡れるわけですね。

なお、■SecuLog - Googleによるユーザ行動追跡には興味深い指摘が。Googleのプライバシーポリシー関連が微妙だというお話と、お仲間のYahooが中国警察に反体制者の個人情報を自発的にタレこんでいる?関連のお話があります。…今回の件、想像以上に嫌な風味がしてきました。

えむけいえむけい 2005/09/16 05:02 これら一連の記事のせいなのかどうか知りませんが、Googleの検索結果が急にリダイレクタを経由しなくなりました(少なくともFirefoxの場合)。
リダイレクタを経由させるためにJavaScriptを使うこと自体は、訪問済みかどうかリンクの色で判別できる等のユーザビリティ上のメリットが大きいので、プライバシーポリシー等で明示していればアリだと思います。Firefoxにリダイレクタが導入された直後はスクリプトを使っておらず、検索結果を一瞥しても訪問済みかどうかぜんぜん分からなかったのでかなり不便でした。

hoshikuzuhoshikuzu 2005/09/16 13:15 えむけいさん、それは良いことを聞きました。…Googleは定期的にリダイレクトを休止しているのかなぁと丁度思っていたところなのですが(根拠無し)。onclickで参照先を動的に替える事については、ユーザビリティーに連動するのであるならば、JavaScriptオフでも使えることを条件に、やぶさかではありません。まぁそうした折についでに何を収集しているのか、そして、個人特定とは結びついてはおらず、あくまで統計処理にしか使っていないのだ、とポリシー上でしっかりとわかるように具体的な表現があると良いなぁと思っております。信用するしないはか各個人の選択なのでしょうけれど。
しかし。あんなにこった仕掛けはなんの為に?って企業ノウハウが背後にあって明かせなかったりするのでしょうかねぇ。

えむけいえむけい 2005/09/16 21:10 > Googleは定期的にリダイレクトを休止しているのかなぁと丁度思っていたところなのですが(根拠無し)。
時間限定で検索結果のURLが陽にリダイレクタを通すようになっています。少なくとも以前はそうでした。JavaScriptによるリダイレクタと併用しているかどうかは定かではありません。
Firefoxでリダイレクタを中止したのは、1.5 betaの仕様変更で従来のリダイレクタの方式では不都合が生じたせいかもしれません。
> JavaScriptオフでも使えることを条件に、やぶさかではありません。
この場合、JavaScriptオフでリダイレクタを通せなくなって困る理由はあるでしょうか? Googleは困るかもしれませんがJavaScriptオフでは収集できないことを当然承知で設置しているはずなので、ユーザーが困らなければ問題ないような。
それとも<a href=”javascipt:rwt()”>とかマークアップするのはやめれという意味でしょうか? それはもちろん同意しますというかそんな馬鹿なことをしていないからこそ:visitedが素直に反映されるわけで。
> あんなにこった仕掛けはなんの為に?って企業ノウハウが背後にあって明かせなかったりするのでしょうかねぇ。
別に隠したいわけではなくて、ユーザビリティ上の理由からできるだけ通常のリンクと区別が付かない振舞いをするように設計したら結果的にこうなったのだと勝手に思っています。

hoshikuzuhoshikuzu 2005/09/17 11:52 う〜む、なるほど。m(_ _)m

hoshikuzuhoshikuzu 2005/09/17 11:53 RIPさんとこにも同様な記述がありました。

通りすがり通りすがり 2005/10/04 12:34 はじめまして。ちょっと話は変わりますが,アドレス帳から Google Map で検索するプラグインが最近ありますが,これで住所検索すると氏名情報まで送信されちゃうみたいですが,これってどうなんでしょう?
http://kkbizmac.blogspot.com/2005/10/google-map-plug-in.html

 | 
最近のコメント