Hatena::ブログ(Diary)

研究開発創作日誌 このページをアンテナに追加 RSSフィード

2011-09-05

第4章 「1.解析プラットフォーム紹介【中尾光輝/藤澤貴智】」実験医学増刊 Vol.29 No.15「使えるデータベース・ウェブツール」

有田正規さん編纂による実験医学増刊号「使えるデータベース・ウェブツール」に、DDBJ の藤澤さんといっしょに記事を執筆しました。解析プラットフォーム GalaxyやBioMart、Cytoscape活用の解説です。

Galaxyの説明のところでは、いわゆる Galaxy彼女ができた、という都市伝説が、いつのまにか原稿から消えていました。文字数の都合とかそういう、そういうものです。

2011-06-16

The Power of Open 日本語版

http://thepowerofopen.org/assets/images/cover.jpg

クリエイティブ・コモンズ・ライセンスの活用事例集 The Power of Open翻訳に参加しました。


この本は、いろいろなクリエイティブ現場創造物のライセンスクリエイティブ・コモンズ・ライセンスをつかって成功している事例紹介です。どんな分野でつかわれているの? つかうことで何が得られたの? トレードオフは? という疑問に答えられる内容となっています。

印刷版PDFでは、CC-BY ライセンス写真を実際に再利用し、冊子自体が Reuse 事例になっているところがひそかに注目するところでしょうか。

翻訳版PDFダウンロードサイトから取得できます。

2010-06-24

セマンティックWebプログラミングが出版されました

オライリージャパンから監訳本「セマンティックWeb プログラミング」が出版されました。マッシュアップ時代のデータ統合技術として有望な RDF や Linked Data を活用したプログラミングやウェブサイト開発をはじめるのに最適な一冊となっております。

  • セマンティックWeb プログラミング
  • Toby Segaran, Colin Evans, Jamie Taylor 著
  • 大向 一輝、加藤 文彦、中尾 光輝、山本 泰智 監訳、玉川 竜司 訳
  • 2010年06月 発行
  • 312ページ
  • 定価3,360円
  • ISBN978-4-87311-452-1
  • 原書: Programming the Semantic Web

目次

監訳者まえがき

序文

はじめに

第1部 セマンティックデータ

1章 セマンティクスとは何か?

1.1 Webをまたいだデータ統合

1.2 伝統的なデータモデリング手法

1.2.1 テーブル形式のデータ

1.2.2 リレーショナルデータ

1.2.3 スキーマの進化とリファクタリング

1.2.4 非常に複雑なスキーマ

1.2.5 最初が肝心

1.3 セマンティックな関係表現

1.4 メタデータはデータである

1.5 不測の事態に備えた構成

1.6 「永遠のベータ」

2章 意味の表現

2.1 例:映画に関するデータ

2.2 シンプルなトリプルストアの構築

2.2.1 インデックス

2.2.2 addおよびremoveメソッド

2.2.3 クエリの実行

2.3 グラフのマージ

2.4 映画データの追加とクエリ

2.5 その他の例

2.5.1 地域

2.5.2 セレブリティ

2.5.3 ビジネス

3章 セマンティックデータの利用

3.1 シンプルなクエリ言語

3.1.1 変数のバインディング

3.1.2 クエリ言語の実装

3.2 フィードフォワード推論

3.2.1 新しいトリプルの推論

3.2.2 ジオコーディング

3.2.3 ルールのチェーン

3.2.4 「人工知能」についてひと言

3.3 結びつきの検索

3.3.1 Kevin Baconの6段階

3.4 共有キーと重なりのあるグラフ

3.4.1 例:企業と地域のグラフの結合

3.4.2 結合されたグラフへのクエリ

3.5 基本的なグラフの可視化

3.5.1 Graphviz

3.5.2 トリプルの集合の表示

3.5.3 クエリの結果の表示

3.6 セマンティックデータの柔軟性

第2部 標準とソース

4章 必要最小限のRDF

4.1 RDFとは何か?

4.2 RDFのデータモデル

4.2.1 強力なキーとしてのURI

4.2.2 リソース

4.2.3 空白ノード

4.2.4 リテラル値

4.3 RDFシリアライゼーションフォーマット

4.3.1 友人のグラフ

4.3.2 N-Triples

4.3.3 N3

4.3.4 RDF/XML

4.3.5 RDFa

4.4 RDFLibの紹介

4.4.1 RDFLibを使った永続的保存

4.5 SPARQL

4.5.1 SELECT形式のクエリ

4.5.2 OPTIONALおよびFILTER制約

4.5.3 複数のグラフパターン

4.5.4 CONSTRUCTクエリ形式

4.5.5 ASKおよびDESCRIBEクエリ形式

4.5.6 RDFLibにおけるSPARQLクエリ

4.5.7 便利なクエリ修飾子

5章 セマンティックデータのソース

5.1 Friend of a Friend(FOAF)

5.1.1 ソーシャルネットワークのグラフ解析

5.2 リンクトデータ

5.2.1 データのクラウド

5.2.2 その人は、その人のFOAFファイルか?

5.2.3 リンクトデータの利用

5.3 Freebase

5.3.1 識別子データベース

5.3.2 RDFインターフェース

5.3.3 Freebaseのスキーマ

5.3.4 MQLインターフェース

5.3.5 metaweb.pyライブラリの利用

5.3.5 人とのインタラクション

6章 「オントロジー」って何ですか?

6.1 その利点は何ですか?

6.1.1 意味の契約

6.1.2 モデルはデータである

6.2 データモデリングへの招待

6.2.1 クラスと属性

6.2.2 フィルムのモデル化

6.2.3 関係の具体化

6.3 最小限のOWL

6.4 Protégéの利用

6.4.1 新しいオントロジーの作成

6.4.2 オントロジーの編集

6.5 OWLをもう少し

6.5.1 関数属性と逆関数属性

6.5.2 逆関係属性

6.5.3 排他的クラス

6.5.4 リアルに保つ

6.6 他のオントロジー

6.6.1 FOAFの記述

6.6.2 ビールのオントロジー

6.7 こんなのはきれいなリレーショナルスキーマじゃない!

7章 セマンティックデータの公開

7.1 セマンティクスの埋め込み

7.1.1 microformat

7.1.2 RDFa

7.1.3 Yahoo! SearchMonkey

7.1.4 GoogleのRich Snippets

7.2 レガシーデータの扱い

7.2.1 Internet Video Archive

7.2.2 テーブルとスプレッドシート

7.2.3 レガシーなリレーショナルデータ

7.3 RDFLibからリンクトデータへ

第3部 実践

8章 ツールキット群の概要

8.1 Sesame

8.1.1 Sesame Java APIの利用

8.1.2 SesameにおけるRDFS推論

8.1.3 Sesameサーバーのサーブレットコンテナ

8.1.4 Sesame Webアプリケーションのインストール

8.1.5 ワークベンチ

8.1.6 データの追加

8.1.7 SPARQLクエリ

8.1.8 REST API

8.2 他のRDFストア

8.3 SIMILE/Exhibit

8.3.1 簡単なExhibitのページ

8.3.2 検索、フィルタリング、パターンビュー

8.3.3 Sesameとのリンク

8.3.4 タイムライン

9章 データによるオブジェクトのイントロスペクション

9.1 RDFObjectのサンプル

9.2 RDFObjectフレームワーク

9.3 RDFObjectの動作

10章 まとめ上げる

10.1 求人情報アプリケーション

10.1.1 アプリケーションの要件

10.2 求人情報のデータ

10.2.1 RDFへの変換

10.2.2 Sesameへのデータのロード

10.3 Webサイトの動作

10.3.1 CherryPy

10.3.2 Makoページテンプレート

10.4 汎用ビューアー

10.4.1 Sesameからのデータの取得

10.4.2 汎用テンプレート

10.5 企業データの取得

10.5.1 Crunchbase

10.5.2 Yahoo! Finance

10.5.3 Freebaseの接続との調整

10.6 専用ビュー

10.7 外部への公開

10.7.1 RDFa

10.7.2 RDF/XML

10.8 データの拡張

10.8.1 位置情報

10.8.2 地理学、経済、人口統計学

10.9 洗練されたクエリ

10.10 求人情報の視覚化

10.11 さらなる拡張

第4部 エピローグ

11章 地球を覆うグローバルグラフ

11.1 ビジョン、誇大広告、現実

11.2 グローバルグラフのコミュニティへの参加

11.2.1 コモンズへのデータの解放

11.2.2 ライセンスに関する考察

11.2.3 データのサイクル

11.3 連続的な変化を支える

索引

O’Reilly Japan - セマンティックWeb プログラミング

今年2010年は Linked Data の普及がはじまった年として記憶されると予想しています。世界的には Data.gov.ukData.gov といった政府系公共データの公開方法のひとつに SPARQL エンドポイントや Linked Data が取り入れられはじめたり、セマンティックWeb技術のデモンストレーションとして Wikipedia のデータを活用した DBpedia が注目を集めています。日本でも、国立国会図書館件名標目表が、SPARQL エンドポイントをふくむ Linked Data での公開を最近はじめました。ライフサイエンス統合データベースセンターでは国内のライフサイエンスの公共データを Linked Data 化する活動に取り組んでいます。このような流れを本書で後押しできることを期待しています。

Linked Data についてはもう少し知りたいときは、本書の前書きでも紹介しました Tim-Berners Lee のTEDでのトークを見るのがよいでしょう。

2009-09-19

中尾光輝、片山俊明「1. 分散データの統合とセマンティック Web」情報処理学会誌9月号, 836-844, 小特集: 生命情報学が直面する大規模ゲノムデータ時代の課題

情報処理学会誌9月号小特集: 生命情報学が直面する大規模ゲノムデータ時代の課題に BioHackathon 2009 での議論を踏まえた記事を書きました。BioHackathon 2008 と 2009 でおこなってきたライフサイエンスにおけるウェブサービスの相互運用性向上による統合の現状、そしてセマンティックWeb技術でとりくまれつつあるデータの統合の展望について述べています。

screenshot

小特集 生命情報学が直面する大規模ゲノムデータ時代の課題 目次

  • 0.編集にあたって (片山俊明)
  • 1.分散データの統合とセマンティックWeb (中尾光輝・片山俊明)
  • 2.巨大データの扱いと解析 (小西史一)
  • 3.生命科学分野におけるテキストマイニング (山本泰智)
  • 4.生命科学分野・ゲノムデータの可視化技術 (西村邦裕)
http://fw8.bookpark.ne.jp/cm/ipsj/mokuji.asp?category1=Magazine&vol=50&no=9

情報処理学会電子図書館-会誌「情報処理」で目次や記事の冒頭2ページ分が立ち読みできます。


http://d.hatena.ne.jp/kwg/20090916/p2 のご指摘については、SRA を身近に扱っているひとを著者陣に巻き込めればよかったなと思います。

Creative Commons License
このブログの個別に注のある作品以外はクリエイティブ・コモンズ・ライセンス 表示 2.1 日本としてライセンスされています。