Hatena Blog Tags

HITS

(コンピュータ)
ひっつ

Hyperlink-induced topic search

ウェブグラフのリンク解析によりページのスコア付けをする情報検索のアルゴリズム。1999年、Jon Kleinberg の論文で発表される。

Authoritative Sources in a Hyperlinked Environment
http://www.cs.cornell.edu/home/kleinber/auth.pdf

HITS はページの評価を権威的スコア(authority score)とハブスコア(hub score) という二つの値で評価する。authority スコアは、特定の情報要求に対して権威的なページに対して高い値が付与される。例えば有名人の人物名で検索した場合その人物のオフィシャルサイトやブログなどが権威的なページである。一方、たくさんの良質な権威的ページにリンクしているページは、権威的ではないものの、良質なページへたどりつくために価値の高いページであると言える。この権威的ではないが価値の高いリンク集ページの尺度を測るのがハブスコアである。

HITS スコアを算出するには、ページ間のリンクの有無を 0 or 1 で表現した正方行列である隣接行列を利用する。隣接行列により権威的スコア、ハブスコアをそれぞれページごとにまとめたスコアベクトルを写像し続けると、やがてベクトルの値が収束する。この収束したベクトルの成分が各ページのスコアとなる。この、HITS の計算は隣接行列の自己相関行列から主固有ベクトルを求めていることに等価である。

同時期に似たようなリンク解析アルゴリズムとして提案されたのが、かの有名な PageRank である。

このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ネットで話題

もっと見る

関連ブログ