*.eTr.ac/r 開発日誌

 

2007-05-06

五ヶ月遅れ 15:39

[Plagger]パイプラインというエントリを読んで、そうそう、掲示板とかをPlaggerスクレイピングするときに、トピック一覧ページと各エントリのページの2段階になってることがあるんだよな、と思った。

本を読む 多段のP::P::CustomFeed::Simpleを試作

言及されてたことに今ごろ気が付きました。ごめんなさい(?)。

[] それからどうしているかというと 15:39

結局シェルスクリプトyamlを動的に生成する、といった形で多段処理しています。

吐かせるyaml自体もPlaggerで生成して、さらにそのyamlを別のPlaggerプロセスに食わせて……という状態。

いまひとつエレガンスに欠けるやりかたですが……

2007-03-24

ひさびさにこっちにも 21:01

というわけで4ヶ月前のトラックバックを見逃してることに今気付く。(汗)

http://blog.sevenspirals.net/articles/2007/03/20/%E3%80%90web2-0-%E5%84%80%E5%BC%8F%E9%AD%94%E8%A1%93%E3%80%91%E6%AC%A1%E3%81%AE%E3%83%8D%E3%82%BF-%E9%81%85%E3%81%84%E3%82%8F:title=SEVENSPIRALS@Weblog : 【WEB2.0&儀式魔術】次のネタ%28遅いわ!!%29

大丈夫です、自分もここ2ヶ月放置してましたから!(ひどい)

え〜っとcwtg.jpの掲示板群のRSSですが、現在はPlaggerrubyクローン?のPraggerを使って作成しています。

レンタルサーバーの構成の関係でPlaggerを入れるのが面倒なんで。

ちなみに最初はHTMLパーサーと正規表現でガシガシやってました。

なるほどー。たしかにPlaggerは、root権持っててすらインストールが一苦労でした<それは手際が悪いだけです

Praggerも調査してみます。ざっと見では、YAMLの見通しがPlaggerよりいいかも。

[] てか 21:01

日記はmixiでいっぱいいっぱい、

作業的にはアイドレスでいっぱいいっぱいで

*.eTr.ac/rシリーズまで手が回らないていたらく。

アイデア"だけ"はあるんですがのー。

2007-01-13

あけましておめでとうございます 06:57

今さらですが。

[]復旧・復旧 06:57

昨年末の記事取りこぼしを復旧。

さらに、その作業中のミスでサービスダウンしたためそこからも復旧。

もう一週間も前ですが……

[]忙し 06:57

人手不足ー

2006-12-22

[G.at.eTr.ac/r] 調査中。 08:16

現在、検索可能な世界間掲示板記事は2422件。

ずれてるのやらずれてないのやら。

記事番号は2500くらいいってますが……

出勤してきます。

今日は忘年会入ってますので、

調査の続きは明日になるかも。

2006-12-21

[] すっかり放置 22:18

してしまった。

現状、世界間掲示板の記事をいくつか取り損なっている模様。

復旧作業に入ります。