わさっきhb

大学(教育研究)とか ,親馬鹿とか,和歌山とか,とか,とか.

データ収集の難しさ

第3回「知識・芸術・文化情報学研究会」の最初のトークは,大友浩氏による,「芸能データ収集の難しさ」 と題した講演でした.
来歴などは大友浩 | アーティストプロフィール | ラジオデイズ大友浩とは - はてなキーワードに載っています.wikipedia:ワザオギからも,お名前が見つかります.
講演は,スクリーン使用なしの“トーク”でした.研究会の開催案内や当日配布のプログラムに書かれていない情報も多く,聞きながらメモをとりました.
東京かわら版(関連:東京かわら版.NET)を手がけていたのが縁で,「芸能白書」の作成に協力したこと,データは紙→ワープロ→パソコン(FileMaker Pro)へと変わっていったこと,集めるためのシステムを長い時間かけて作っていったこと,東京かわら版で整備したデータベースが,「猫の皿」という落語の演目の調査で役に立ったこと,あたりが,データ収集の成果もしくは表通りになっていたように感じました.
裏通りといいますか,聞いたけれども文字にしにくい情報も,あるにはあります.1点だけ挙げておくと,落語は,自分などテレビで目にする程度の者にとっては「古典芸能」なのですが,「くだらないお笑い」と見られていた時代もあったというのです.
日常的にデータ収集をする方法は確立していて,一つは演目リスト,それから協会などから送られてくるファクス,そして新規に探して見つかるもの*1も入れていくとのことでした.
そんなふうに話を聞いていくと,自分も何かでデータベースを整備して,そのデータを活用してもらえればなんて思うようになりました.
しかしその漫然とした思いを,形にしていくにあたり,考えるべきことはいっぱいあります.そもそも「何の」データベースにするか,データベースとして構築・公開することに意義はあるのか,コンテンツは自分の内外に現時点でどれくらいあるのか,収集したらどれくらい網羅できるのか(例えばカバー率を提示できるか),公開にあたって著作権その他の権利上の問題をどのように解決すればいいのか…
とか考えるだけで,実例がないのでは,先には進みません.これについては,当ブログのアクセスというのが,データベース構築の方針決定に役立ちそうにも思っています*2.ブログから主要なところを切り貼りして「種」とし,年月をかけて,成長させていきますかね.

昔書いたこと

自分はというと…継続した運用を意識しないといけないものが,4種類あります.研究と,教育と,ブログと,プライベートです.
(略)
ブログは4つのうち,一番うまいこと継続できているかなと思います.文章,プログラムコード,図や画像,そして数式が,いいバランスでアウトプットできています.アクセス数とはてブ数のアップを,ささやかな楽しみとしています.

継続のために - わさっき

自分の書いたものは,人によってはリファレンスになり得るでしょうし,別の人にとっては,読むだけ時間の無駄な文字の羅列となるのかもしれません.
それでも,「(略)について調べたい」だとか,「(略)というのがあって,そこでコレコレという言葉を見かけたけど,何を探したらいいか,教えてくれない?」とかいった問い合わせがあったときに,そのとっかかりとなるものを提案できないか,と思うことはよくあります.要はレファレンスサービスです.

ツイート感謝 - わさっき

*1:「書いていないとはどういうことか」とお叱りを受けたこともあったとか.トップランナーの悩み,ですかね.

*2:といっても,アクセスログそのものの公開は,考えていません.