Hatena::ブログ(Diary)

清澄日記 RSSフィード

Twitter / i2k twitter / i2k

2010.11.10

[]CiNii論文データが「Yahoo!検索 論文検索」で検索できるようになりました

きのう、「Yahoo!検索」の新機能「論文検索」リリースされ、国立情報学研究所NII)が運営するCiNii(サイニィ)論文データ約400万件が検索対象となりました。まずは関係者のみなさま、お疲れさまでした!

突然現れたように見えるこのサービスですが、NIIのプレスリリースにも書かれているように、昨年度からNIIヤフーとで共同研究を行い、サービスのあり方を検討してきたものです。最終的には、検索機能をヤフー提供し、論文の詳細情報CiNiiが受け持つという極めてシンプルな形になりました。単純ですが、これがお互いの強みを一番生かせるだろうという判断です。

NIIデータを出しているだけ?と思われるかもしれませんが、実はそのデータ作りがぼくたちの生命線です。複数の異なるデータベース(それぞれが数百万件オーダー)から個々のレコード名寄せし、1つのきれいなデータベースを作るのは、とてつもなく困難で、終わりのない作業です。NIIではそれを機械学習などの自動処理や人手を含めたワークフローを構築することで日々対応しています。表からはほとんど見えないこのプロセスについては、いずれ何か書きたいと思いますが、こうして作ったいわば「虎の子」のデータオープンにしていくのは、ひとえに論文という情報を多くの人々に届けたいがためです。

以前から、CiNii情報グーグルヤフーなどの検索エンジンからのクローリングを許可し、検索の対象となっていますし、Google Scholarとは密な連携をしています(現在はわけあって検索できない状態になっていますが、近日中には復活します)。今回の連携もその一環で、CiNiiへのアクセス経路が増えることでより多くの方々に論文情報を見てもらえればと考えています。

いずれにせよ、公共的なサービスとして、また図書館サービスとしてかなり思い切った連携の形だと思います。いろいろなご意見があるかとは思いますが、あたたかく見守っていただければ幸いです。

Connection: close