スマートフォン用の表示で見る

hits

Hyperlink-induced topic search

ウェブグラフのリンク解析によりページのスコア付けをする情報検索のアルゴリズム。1999年、Jon Kleinberg の論文で発表される。

Authoritative Sources in a Hyperlinked Environment
http://www.cs.cornell.edu/home/kleinber/auth.pdf

HITS はページの評価を権威的スコア(authority score)とハブスコア(hub score) という二つの値で評価する。authority スコアは、特定の情報要求に対して権威的なページに対して高い値が付与される。例えば有名人の人物名で検索した場合その人物のオフィシャルサイトブログなどが権威的なページである。一方、たくさんの良質な権威的ページにリンクしているページは、権威的ではないものの、良質なページへたどりつくために価値の高いページであると言える。この権威的ではないが価値の高いリンク集ページの尺度を測るのがハブスコアである。

HITS スコアを算出するには、ページ間のリンクの有無を 0 or 1 で表現した正方行列である隣接行列を利用する。隣接行列により権威的スコアハブスコアをそれぞれページごとにまとめたスコアベクトル写像し続けると、やがてベクトルの値が収束する。この収束したベクトルの成分が各ページのスコアとなる。この、HITS の計算は隣接行列の自己相関行列から主固有ベクトルを求めていることに等価である。

同時期に似たようなリンク解析アルゴリズムとして提案されたのが、かの有名な PageRank である。