Hatena::ブログ(Diary)

備忘録(仕事と晩飯)

2017-09-12

近刊検索デルタとCcodeRR

8月末になってやるやる言っていた「近刊検索デルタ」、なんとか9月1日に公開。ボロボロだがエイヤッと公開してしまったほうがいいに決まっている。

もう初日からあちこちボロボロで直しまくり。openBDのAPIからのインポート(cronで定時に実行)ですら直す。問題が無ければ、検索・ランキング・CSVダウンロードに着手したいところだが、そうは問屋がおろさない。なんとかかんとか動いてる状態で維持。なかなか厳しい。

最初にはまったのが「日付」問題。キレイにYYYYMMDDで入ってるデータだけじゃないのは分かってたけど、予想以上に問題満載。かなり苦労しつつも強引な手段でなんとか解決、出来たと思う。次にはまったのが著者名なんだけど、これはもうすぐにお手上げ。分類も苦戦中。オリジナル分類そのものはうまく動いているけれど、本当にそれで良いのかはまた別問題。ライトノベルズも、サブタイトルでもレーベルでもシリーズでも分類できないものは無理。

大きくハマったのが「刊行中止」の扱い。openBDからは消えてしまうらしい。こちらの都合なんだけど、バルクインサートの過程でISBNが引き継げない状態があるので、結局「無いことがわからない」という状態に。かなり困った。複雑な仕組みで解決できるのはわかったけれど、それだとインポートの速度が遅くなる。どうしたものか。

サクラインターネットのcronは「プログラムの実行が60秒以内」という制限がある。そこに収めるのに四苦八苦。かなりいい線いってたけど、微妙に60秒を超える回数が増えてきた。ので、分割。「あんまり頻繁にcron動かすな」という制限もあるようなので恐る恐る動かしている。お金があればAWSとか使って解決するのだろうか。そのあたり、よくわからない。

稼働から一週間、9月9日にCcodeRR公開。以前動かしていたCcodeRの発展。案外良い(自画自賛)。

9月11日、検索機能運用開始。重み付けは次の課題にした。これも案外よいではないか(自画自賛)。

2001年9月11日は眠れずにずっとCNNを見ていた。二機目の衝突はほぼリアルタイムで見た。何か恐ろしいことが起こっていることに怯えながらも、どこか遠くの出来事に思えた夜。

2011年震災を経て、9月11日、近刊検索デルタの前身である「近刊検索β」の公開日。

投稿したコメントは管理者が承認するまで公開されません。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/TOSH/20170912/1505225714