日々の記録 RSSフィード

2012-08-01

ここはこのまま凍結

http://www.zuki-ebetsu.jp/blog/ へ移行。

2012-07-23

[] maven install でエラー "Some files do not have the expected license header" が発生する場合

mvn install -Dlicense.skip=true

2012-07-12

[] Solrサーバの検索

設定の肝は次の通りだった。

  1. <metadata>要素でPazpar2が内部で使用するメタデータを定義し、
  2. サーバの検索結果を settings/set[@name="pz:xslt"]で 指定するXSLTでこの要素名に変換する。
  3. サーバの検索方法は settings/set[@name="pz:cclmap:XXX"] でCCL形式で指定する。
  4. Solrサーバには settings/set[@name="pz:sru"][@value="solr"] を指定する。

で、こんな感じの設定でZ39.50サーバSolrサーバを同時に検索できた。

続きを読む

2012-07-10

[] Index Data社のPazpar2を調べる

Pazpar2は、Z3950クライアントとして動作して、複数のZ3950サーバの検索結果を1つの結果集合にまとめ、適合度によるランク付けやファセットの追加などをしてくれるミドルウェアである。対象がZ3950サーバだけでは興味はないが、Solrサーバも対象にできるということなのでちょっと調べることにした。とりあえず今日はインストールして動作確認まで行った。インストール先はUbuntu 10.04LTSサーバであるが、いろいろあって結局、Index Data社が提供しているUbuntu向けのパッケージをインストールした。

sudo vi /etc/apt/sources.list   # 以下の2行を追加
  deb http://ftp.indexdata.dk/ubuntu lucid main
  deb-src http://ftp.indexdata.dk/ubuntu lucid main
wget http://ftp.indexdata.dk/debian/indexdata.asc
sudo apt-key add indexdata.asc
sudo apt-get update
sudo apt-get install yaz libyaz4-dev pazpar2 pazpar2-js pazpar2-apache2 pazpar2-jsdemo

cd /etc/pazpar2/settings
sudo edu.xml edu_small.xml
sudo vi edu_small.xml
  # target を3つ (LC, Yale, Wisconsin) 残して残りを削除
sudo vi /etc/pazpar2/services-available/default.xml
  # -  <settings src="settings/testserver.xml"/>
  # +  <settings src="settings/edu_small.xml"/>
 
sudo ln -s /usr/share/pazpar2/jsdemo /var/www/pp2
sudo service pazpar2 restart

これで、http://baseurl/pp2/ にアクセスすると検索ができた。

途中で発生した問題は次の通り。

  • Ubuntu標準リポジトリにあるYAZはバージョンが古くてPazpar2では利用できなかった。
  • Pazpar2をソースからコンパイルしたらICU絡みのエラーが発生した。
  • pazpar2-test1 で導入できるテストクライアントは '%' を無限にURLEncodeして使用できなかった(ただし、深追いはしていない)。
  • 既存のsettingファイルでテスト用に使用できそうなものはedu.xmlだけだったが、対象サーバがテスト目的では多すぎたので対処サーバを減らしたものを使用した。

Solrについてはこれから調査する。

2012-07-04

[] NDL典拠データからNDCの一覧リストを作成

NDLSHはWeb NDL Authoritiesが使えるが、NDCは冊子体しかない。日本十進分類法新訂9版機械可読ファイル(MRDF9)というのが提供されていたようだが(修正追加分が提供されているので)、現在は提供されていない(「詳細は追って掲載」と日図協のページにはあるが、もう10版の検討をしているようなので提供されることはないだろう)。網羅的なデータがなければ実用的なツールは作れないが、国会図書館が公開している典拠データには典拠データに対応するNDCが付与されているので、これをNDCからまとめて、1000区分のNDC表に追加した一覧リストを作成した。ついでに典拠データを検索してNDCを表示する機能も付けた。

作成したツールは、こちら