2006-10-17
■[plagger]はてなアンテナをPlaggerで取得
主に絵師さんをアンテナに登録しているのですが、サイト毎にyaml書いてたらキリがないので、RSSからリンク先のHTMLを全文取得する試み。
config.HatenaAntenna.yaml
global:
assets_path: assets/
timezone: Asia/Tokyo
log:
level: debug
plugins:
- module: Subscription::Config
config:
feed:
- http://a.hatena.ne.jp/user/rss
- module: Filter::EntryFullText
config:
store_html_on_failure: 1
- module: Filter::BreakEntriesToFeeds
- module: Filter::ResolveRelativeLink
- module: Filter::Rule
rule:
module: Deduped
- module: Publish::Gmail
config:
mailto: hoge@gmail.com
mailfrom: hoge+plagger@gmail.com
mailroute:
via: smtp_tls
host: smtp.gmail.com:587
username: hoge@gmail.com
password: xxxxxx
一応解説
- module: Filter::EntryFullText
config:
store_html_on_failure: 1
これでリンク先のHTMLを全文取得、
- module: Filter::ResolveRelativeLink
相対リンクを修正して、
- module: Filter::BreakEntriesToFeeds
エントリをサイト毎に分割する(コレがないと縦に長過ぎて悲惨な事になります)。
まあ、サイト毎にyaml書いた方が断然見やすいのですが、こういうこともできます…ということで。
はてなアンテナはグループごとのRSSも出力しているので、実際には「絵師さん」とかグループを作って、feedの所を
- http://a.hatena.ne.jp/user/rss?gid=xxxxxx
とすると良いと思います。


