kaz::hatena

 | 

2005-12-18

タグ付けの構造

最近発見したHP Information Dynamics Labの論文。

HP Labs : Research: Information Dynamics Lab

なかなか興味深い内容だったので軽く紹介してみる。

まずはカテゴリ分類の弱点から語られる。目的のファイルがディレクトリツリーのどこにあるのかを見るけるのは難しいし、二つの側面を持つようなものはどっちのディレクトリに入れるべきか悩まされる。

自分の場合、MMのメモ種別欄でこの弱点を実感することがよくある。Web, Programming, Design, Misc…と分野別に種別を割り振っているのだけど、このメモ種別は数ヶ月使っているうちに完全に破綻してしまった。WebとDesign、WebとProgrammingなんかは特に境界が曖昧になりがち。最近では悩んだらとりあえずMisc(その他)につっこむようになってしまった。

カテゴリの欠点指摘についてはこんな記事もあって、この論文でも参考文献にも挙げられている。

Shirky: Ontology is Overrated -- Categories, Links, and Tags

これについては、日本語で要約された以下の記事を見た人も多いのでは。

カテゴリ分けでは世界を認識できない。物理的な制約を超えて意味づけを実現するFolksonomy:Goodpic

さて、それならカテゴリからタグに移行してしまえば万事解決するのかと言うとそうでもなくて、依然として残るのが多義語、同義語(表記のゆれ)、それから"basic level"の問題。

MMを使っていると、人によってタグの表記にゆれがあるのはよく感じる。例えば人によって「SBS」だったり「SBM」だったり。あるいは「可視化」だったり「visualization」だったり。

"basic level"問題というのは、例えばstrutsに関する記事があったとして、それに対してstruts, java, programmingのどのタグをつけるかという話。その分野に明るくない人ほど大雑把なタグ付けになって、逆に詳しい人ほどより細かいタグをつける傾向にある。

この辺はタグ同士が独立しているのをなんとかする必要があるのだと思う。以下の記事あたりでもそういう話が出てくる。

fladdict.net blog: タグについてメモ

fladdict.net blog: ソーシャルブックマーク考2 タグの構造について

fladdict.net blog: ソーシャルブックマーク考3 タグの構造について(続編)

論文ではその後del.icio.usの分析に入る。この辺はSBSを日頃利用している人間にとっては自明なものが多いのだけど、その中でなるほど、と思ったのが過去のタグを修正するコストの話。

今まで大雑把に分類していたものの一部に実はある共通点があったとしても、後になってそれに気づいた時点で分類し直すのは面倒すぎて現実的じゃない。その共通点は個人的な発見される場合もあれば、Ajaxのように、今まで技術として存在していたものに後から名前がつくような場合もある。

そもそもどのSBSもタグ管理機能は貧弱すぎるような気がする。蓄積されたブックマークをいかに使うかについてはまだ発展の余地がありそう。

あとはタグを7種類に分類しているのが面白かった。

何の話題かを示すタグ
MMでは9割方これしか使われていないような。
それが何かを示すタグ
本とかCDとか。MMではメモ種別によく見られる。
著者・作者を示すタグ
あまり見ないかも。「東浩紀」とかたまに見るけど。
他のタグの評価付け用タグ
見たことないけど25とか100とかつけるらしい。
質や特徴を表すタグ
「これはひどい」とか「ネタ」とか。
自己参照用タグ
セルフブクマとか、自分がコメントした記事とか。
タスクタグ
「課題」とか「後で読む」とかのタスク分類用。

というあたりで、より詳しいところを知りたい人は原文を。

トラックバック - http://d.hatena.ne.jp/kaz24/20051218/1134899143
 |