アンカテ このページをアンテナに追加 RSSフィード

2007-10-19

グーグルの野望は「初音ミク」排除なんて小さいものではない

これが、他のヴァーチャルアイドルの販促を企む企業グループによる陰謀だということで、2ちゃんねるでは大騒ぎになっているようです。「グーグルの公共性」と「陰謀論」がからんだ話題ですから、「グーグル八分」という言葉の発案者としてスルーするわけにはいきませんね。

しかし、結論から言えば、これは人為的な検閲ではなくて、画像検索の特性による情報の遅れだと私は考えます。つまり、グーグルの画像検索は、収集した情報の鮮度において、他の検索エンジンより劣っている為に、急速に立ち上がった「初音ミク」ブームに対応しきれなかったということでしょう。(タイトルはある意味「釣り」です)

2ちゃんねるでは、この主張に対する反例として、次の例が上がっています。

最初のは、ほぼ同時期に発売された「Sweet Ann」という同種のソフトについては「初音ミク」と違ってパッケージ写真が表示されるという話。次のは、最近の事件である時津風部屋の問題について、謝罪写真や新時津風親方の写真が表示されるという点。最後のは、10/6発売の新製品についても製品の画像が表示されるという所。

これらの検索を見ると、グーグルの画像検索全体が新しい画像を収集できてないとは思えず、「初音ミク」だけを狙い打ちしているように見えます。

しかし、同じキャノンの製品でもCanonでなく日本語のキャノン mp610で検索すると該当の製品の画像は表示されません(10/19 9:00現在)。

実際、 MP610 にしろ、Sweet Ann にしろ、各画像をクリックして元記事まで見ていくと、検索結果に出て来ているのは、7月以前に発表された報道機関によるページであることがわかります。時津風の場合は最近のものも含まれますが、やはり、報道機関のページにある写真がほとんどです。

つまり、グーグルの画像検索は、WEB検索と違って、ソースの特性に合わせたチューニングが行なわれているのではないでしょうか。

よく考えると当然のことで、ブログを日記的に書いている人は、「時津風ひでー、ところでやっぱりうちの猫は可愛いい」とか書いて「時津風」というテキストの横に愛猫の写真を貼りつけたりします。写真とテキストの関連づけを機械的に行なうなら、ソースを格付けせざるを得ない。その為に、報道機関や公的なサイトを優先してソースとして使用するでしょう。ひょっとしたら内部的にはグーグルニュースとの連動があるかもしれません。

「初音ミク」は、そういう一般的な格調高いソースとは違う筋で爆発的に広まったので、その優先付けが災いして、意図的にこれを排除したように見える結果が生じてしまったのではないかと思います。

そもそも、このようなことはグーグルという企業の特性を考えると起こりにくいことだと思います。

グーグルのシステムは世界各地のデータセンターにある数十万台のサーバが連動する壮大かつ緻密なシステムです。これを「営業上の都合」で操作することを開発者が受け入れるかどうか。「グーグル八分」のようなデータの操作は、あらかじめ設計され慎重にテストされたコマンドで行なわなければ、システム全体が予想外のトラブルを起こす可能性が高いでしょう。

日本法人は支社というより、実態は「営業所」と言った方が適切だと思います。おそらく日本オフィスに勤務して開発に携わる技術者はいるでしょうが、開発の仕事を行なうなら実態としては本社(の開発部隊)の一部になっていて、組織としての日本法人は、その本社が開発したシステムを与えられた通りに使うしかない営業の最前線だと思います。これまでもグーグルは全世界一律のシステムに固執していて、システムの内部に関わるローカライズには非常に消極的な企業でした。

だから、もしこのような操作が大規模に行なわれるとしたら、本社の了解を得なければできません。

しかし、たかが日本ローカルな事情で、日本においてどれだけの見返りがあるとしても(日本国内におけるメディアの操作も期待できるとしても)、本気の世界征服を視野に入れているグーグルの本社が、これを自分たちの利益と考えるとは思えません。現時点で、悪評と引きかえに日本を支配するのは、たとえうまく行ったとしても、グーグルの野望から見てあまりにも「安売り」だと思います。

日本法人が本社の了解なく独断で動いたとしたらあるかもしれませんが、これは本社にバレたら即クビでしょう。

ただ、このような疑惑が広がるのは理由が無いとは言えません。

いずれにせよ憶測が飛び交うのは、検索エンジンは公平性が担保されておらず、検証や監査といったものが行われて無いからです。

[悪徳商法?支店

Beyondさんが言うように、検索エンジンには実質的に公共的な使命があるのに、それに見当った正当性を担保する検証や監査の制度が無いことが、この問題の本質だと思います。企業の会計監査と比較してみれば、制度の立ち遅れがよくわかると思います。会計監査にも問題や抜け道があることも事実ですが、これが無かったら今起こっている問題の比ではない大きな問題が起きて、市場も社会も大混乱になるでしょう。検索(一般的に言って、ネットにおける大規模データ処理)の公共性というのは、それと同じ段階にあるわけです。

∞Eyes - グーグル八分発見システムには、その点において、非常に重要な意味があると思います。

それともうひとつタイムリーだと思うのが、コレ。

当ブログの関連記事:

(10/22 追記)

ここに書いたような説明では、説明できない状況も別にあるようです。詳しくは下記エントリを参照してください。

necoffeenecoffee 2007/10/19 13:07 いくらソースの特性に合わせたチューニングが行なわれている
としても、全く一枚も画像が出てこないと言うことがありうる
のでしょうか?

いや、陰謀論とかじゃなく技術的なことでですけど。

vanguard777vanguard777 2007/10/19 14:10 単純にGoogleの画像検索の画像データがweb検索上のデータに比べ3ヶ月くらい遅れたものなんじゃないかな。
特にblog形式の更新の激しいところで画像検索を行うと最新の画像が検索結果として出てこない。
いろいろなblog形式の画像サイトさんの検索(サイト名とURL)で試す限り、ざっと見る限り最新の画像は表示されず3ヶ月くらい昔の出ていて画像データの更新が3ヶ月くらい遅れが出ているような感じ。

kengo9999qkengo9999q 2007/10/19 15:51 あの〜
『キャノン』でなくて『キヤノン』なのですが・・

ちなみに、キヤノンの総務は書類にキャノンという書類を見つけたら
キヤノンですからと激怒します(蛇足)

dreamyoudreamyou 2007/10/19 19:39 Yahooと同時に起こり、他の検索エンジンだと引っかかることへの説明になっていないと思います。

blochablocha 2007/10/19 21:34 YahooってGoogleのエンジン採用してなかったっけ?

qwqwqwqw 2007/10/20 01:05 ちなみにYahooは修正されましたね
バグだったのかフィルター解除したのかは分かりませんが

sol1ogsol1og 2007/10/20 10:37 つっこもうとおもったら、
もうつっこまれてましたね
キヤノンです (笑)
http://images.google.co.jp/images?q=%E3%82%AD%E3%83%A4%E3%83%8E%E3%83%B3%20mp610&lr=lang_ja&ie=UTF-8&oe=UTF-8&rls=org.mozilla:ja-JP-mac:official&client=firefox-a&um=1&sa=N&tab=wi

essaessa 2007/10/20 23:34 キヤノンの話は知りませんでした。
しかし、キヤノンでもキャノンでもGoogleでは該当の機種の写真は最初のページに一つしか出てないですね。
一方、MSNのLive Searchでは、キャノンで検索してもほぼそればかりでゴミ無しです。
http://search.live.com/images/results.aspx?q=%E3%82%AD%E3%83%A3%E3%83%8E%E3%83%B3+mp610&go=%E7%94%BB%E5%83%8F%E6%A4%9C%E7%B4%A2&form=QBIR
検索の精度に違いがあるのは確かではないでしょうか。

kurahakukurahaku 2007/10/21 20:14 この検索で初音ミクのキーワードが入った動画だけ見事にサムネ外されているのはなんででしょうか?
http://www.google.co.jp/search?hl=ja&q=%E3%83%8B%E3%82%B3%E3%83%8B%E3%82%B3+site%3Ahttp%3A%2F%2Fwww.youtube.com%2F&btnG=%E6%A4%9C%E7%B4%A2&lr=

essaessa 2007/10/22 09:42 これは確かに変ですね。新しくエントリ書きました。
http://d.hatena.ne.jp/essa/20071022/p1

はてなユーザーのみコメントできます。はてなへログインもしくは新規登録をおこなってください。

Connection: close