ブックリスト演算:データ更新


増井さんがファイルを更新してくれた*1ので,過去の反省をふまえて処理して,ユーザー名とISBNのリストを取得。*2
user-isbnの形式にして,行数にして30万行強。1年ちょいで1.5倍ほど増えたらしい。ちゃちゃっとテーブルを更新して,テーブルの最適化とかをちまちまやって,この通り。



http://myrmecoleon.sytes.net/book/enzan.php?isbn=4044292094


ファイル名からおそらく4月9日時点のデータ。さすがにもう『分裂』を登録した人は数名しかいなかった模様。なお,enzan.phpの方は著者名で仕分ける処理が重い関係で,適当にキャッシュ機構をつけたので二回目以降のアクセスは少し早いです。でも,これをはずしてるhondanaenzanの方でもまあまあ早いので,30万行でもそれほど無理はないらしい。


いまは著者名典拠をつっこんでしまったらどうだろうとか,最新のデータを取得する機構はどうしようかとか(でもその前に本棚.org以外への対応かな? 増井さんみたいにdumpデータ公開してませんし)いろいろ考え中。その前に「100冊」の方を仕上げたいですが。*3

*1:本棚演算のページのリンクが更新されてませんが,なんとなくファイル名を探ったらあったのでいただきましたー。ありがとうございます。

*2:Marshal→RubyYAMLに変換→PHP正規表現で各リスト抽出 とかなり迂遠な作業をしてしまいました。Rubyを使い慣れてれば直接CSV等に変換できたんだと思うんですけどねー

*3:なんかいろいろやってたらどんどん時間が無くなっている罠; 小分けにして公開するかな。