Googleサイトマップは、RDFの観点を取り入れることで、セマンティックWEBへの大きな一歩となる(かもしれない)

RSSマーケティングガイド: Google SitemapsとRSSの関係

の記事を読んで考えた。

RDFによる、オンラインリソースの関係記述

KANZAKIさんの素晴らしい解説記事RDF -- リソース表現のフレームワークで読みかじった程度の知識しかないけれど。

RDFとは、主語-述語-目的語の関係を、XML形式で表現する枠組みだ。

XML形式であることや、主語や目的語をURIで特定する仕組みを持つことにより、オンラインリソース間の関係を記述することに適している仕組みだと理解している。

RSS1.0はこの枠組みを利用したものだ。

サイトが「記事単位」のPermalinkで構成されるようになることと、RDFの関係

一方、近頃Blogツールの普及により、サイトが「記事」単位に分解できるようになってきた、という議論がなされている。

あるURLを記述しても、その先にある情報の粒度がばらばらだったこれまでのウェブから、Permalink を用いれば、目的の情報をURLとしてあらわせるという、最小単位が記事単位に変わったウェブ。ウェブの根底に根ざす REST アーキテクチャのレイヤと、情報のレイヤがようやく足並みを揃えたわけです。

「RSSだけのブログ? / 重要なのは Permalink と RSS」

ブログの登場で、今までの「ウェブサイト」を主体とした情報の流れとは別に「記事」を単位とした情報の流れが明確になり、またそれに対応したサービスも登場している。しかし、ネット内には今もまだ「サイト」単位を中心とした情報の流れしか理解していない人たちもいる。

「「サイト」単位と「記事」単位の情報の流れ、アルファミームの発見」

RDFは、URI単位で、つまりPermalink単位でリソース間の関係を記述する仕組みなわけだから、情報がこの単位に分解できるようになってくれば、RDFの有効性も高まってくる。

Googleサイトマップの意味

GoogleサイトマップXMLの書式を見ると、必ずしもRDFを意識したものではないようだ。


http://www.yoursite.com/catalog?item=73&desc=vacation_new_zealand
2004-12-23
weekly

Google による「Sitemap Protocol」の解説とサンプル (要ログイン)

しかし、上記を見てわかるとおりlocというタグでURI情報を記述しているので、これをRDFと関連付けることはそう難しくはなさそうな気がする。(詳しくはわからないけど)

ということは、サイトマップGoogle形式とRDFモデルとを応用して記述することで、記事単位で記事間の関係を明確にして、機械に伝えることができるということなんじゃないか?

そんなわけでGoogleサイトマップが今後RDF的な観点を取り入れるようになっていけば、SEOとかクロール頻度とかの観点だけではなく、セマンティックWEBの実現に向かった取り組みという位置付けができるようになるんじゃないかと思った。