お茶の水女子大学図書・情報チーム DSpaceインストール日記

2010-03-06

[]登録数が30,000件を突破しました

20,000件まであと少しと思っていたら、いつの間にか30,000件を突破しておりました。


現在の32,000件のうち、約24,000件が『幼児の教育』という雑誌なのですが、

創刊号(なんと1901年)から106巻(2007年)のものまで搭載されています。

ご興味のある方は、是非一度ご覧下さい。


http://teapot.lib.ocha.ac.jp/ocha/handle/10083/3705/bulletin/

2009-09-24

[]登録数が19,000件になりました


本日、TeaPotへの登録件数が19,000件になりました。


記念すべき19,000件目は『大学院教育改革支援プログラム日本文化研究の国際的情報伝達スキルの育成」活動報告書』の「Summary (in English)[The 3rd Public Lecture]」でした。


http://hdl.handle.net/10083/35095


20,000件まであと少しです。

2009-09-14

[]リポジトリランキングで、日本3位!?

京都大学様の図書館HPに、リポジトリ・ランキングの記事が掲載されていました。


[図書館機構 : KURENAI: リポジトリランキングで国内第1位/世界第24位の評価をいただきました]

http://www.kulib.kyoto-u.ac.jp/modules/bulletin/article.php?storyid=551


さて、それではお茶大の順位はと見てみると…

国内3位(世界では52位)の結果が!


正直な所、集計方法がどうなっているのか疑問ではあるものの、嬉しいお話でした。


f:id:ocha_repo:20090924180655p:image:left

2009-07-16

[] 平成20年CSI委託事業報告交流会(コンテンツ系)にて成果を報告


2009年7月9-10日に国立情報学研究所で開催された「平成20年CSI最先端学術情報基盤)委託事業報告交流会(コンテンツ系)」において、本学の成果を報告いたしました。


詳細はこちら。

【図書館ニュース】 お茶の水女子大学附属図書館

2009-05-26

[] タイトルが'表紙'や'目次'となっているデータの資源タイプ変更


5月中に、表紙や目次といったタイトルの資源タイプ変更を行う必要があったので作業を開始。

本来なら、1件ずつWebの編集画面から修正した方が確実なのですが、なにぶん件数が多かったので、SQLで一括変換することにしました。


まずは、該当データの抽出から。


SSHログイン後、psqlデータベースへ接続。

csvでファイル出力するように設定。

\pset format unaligned
\pset fieldsep ','
\o /home/dspace/hyoushi-mokuji.txt


次に、metadatavalueテーブルから、該当するデータを抽出。

item_id、タイトル、資源タイプ、URIを取り出します。


SELECT m1.item_id,m1.text_value,m2.text_value,m3.text_value
  FROM metadatavalue m1,metadatavalue m2,metadatavalue m3
  WHERE m1.item_id = m2.item_id AND m1.item_id = m3.item_id 
    AND ( m1.text_value Like '%目次%' OR m1.text_value LIKE '%表紙%' )
    AND m2.metadata_field_id = '86'
    AND m3.metadata_field_id = '35';

\o


TeaPotでは、資源Typeがfield_idの86、URIが35に登録されているため5行目、6行目のようになります。

特に変更していない場合は、66と25でしょうか。


抽出したデータをFTPで持って来て、EXCELで開いて目視確認。

タイトルに表紙という文言が入っている論文なども抽出されてますが、対象外になるので削除。

既に資源タイプがOthersになっている物も削除。


残ったデータから、item_id部分を利用してupdate用のSQLを作成。

item_idがA列に入っているとして、以下のような感じでセルに設定

="UPDATE metadatavalue SET text_value = 'Others' WHERE metadata_field_id = '86' AND item_id = '"&A1&"';"

列ごとをコピーして、テキストエディタへ貼付けて保存。


UPDATE metadatavalue SET text_value = 'Others' WHERE metadata_field_id = '86' AND item_id = 'xxxx';
…
UPDATE metadatavalue SET text_value = 'Others' WHERE metadata_field_id = '86' AND item_id = 'xxxx';


同様に、item_idを利用して、最終更新日をupdateするSQLも作成。

="UPDATE item SET last_modified = '2009-05-26 11:00:00.000+09' WHERE item_id = '"&A1&"';"


UPDATE item SET last_modified = '2009-05-26 11:00:00.000+09' WHERE item_id = 'xxxx';
…
UPDATE item SET last_modified = '2009-05-26 11:00:00.000+09' WHERE item_id = 'xxxx';


できたSQLFTPサーバに移動。再度ログイン後、psqlで接続しSQLを流し込み。


\i ファイル名


あとは、報告用に、Excelデータから、URIとidentiferの一覧を作成して終了。

identiferは、oai:host name:handleなので、URIをもとに、文字列置換で作成。

URIがB列にあるとすると、

=SUBSTITUTE(B1,"http://hdl.handle.net/","oai:teapot.lib.ocha.ac.jp:")