Google、次世代検索エンジン「Caffeine」導入 インデックスの更新が

Googleは6月8日、次世代検索エンジン「Caffeine」を全世界で導入した。これまでよりも検索インデックスの更新が早くなるという。

Caffeineは従来の検索インデックスとは異なる構造をしているため更新が早く、検索結果が「従来より50%新しい」とGoogleは述べている。従来の検索インデックスは複数のレイヤーで構成されており、メインのレイヤーは数週間おきに更新されていた。レイヤーを更新するためには、Web全体の解析しなければならないため、Webページが検索インデックスに反映されるまでに時間がかかっていた。CaffeineではWebを小さな部分に分けて解析し、検索インデックスを絶えずアップデートしているため、新しいWebページや、既存のページの新しい情報を発見したときにそのままインデックスに追加できるという。


Caffeineは処理能力も拡大しており、1秒間に数十万ページを並行して処理できる。同技術は約1億Gバイトのストレージを占有しており、1日に数十万Gバイトのペースで新情報を追加している。

GoogleはCaffeineを開発した理由について、Web上に動画や画像、リアルタイム更新が増え、通常のWebページの複雑化、リッチ化が進んだこと、最新コンテンツを検索できるようにしてほしいというユーザーからの要望があったことを挙げている。


http://www.itmedia.co.jp/enterprise/articles/1006/09/news034.html