handle_force: http://www\.itmedia\.co\.jp/news/articles extract: <div class="newart">.*?<h1>(.*?)</h1>.*?<!--BODY-->(.*?)<!--BODYEND--> extract_capture: title body
miyagawa 2006/04/13 23:44 眞鍋かをりのは sixapart.pl でハンドルできてませんかね?(svn最新だといけるはずです)
manabou 2006/04/14 00:54 どもです。最新版にしてみました。しかし、やはりうまくとれないのもありました。ぱっとrdfをみたかんじでは、descriptionにCDATAがあるところが、全文取れないようにみえました。http://rss.rssad.jp/rss/nifty/manabe
miyagawa 2006/04/14 01:21 あぁ、rssad.jp だと広告でHTML載っちゃうからですね。handle_forceだといけるんだけどなぁ。
manabou 2006/04/14 01:36 なるほど。handle_forceならいけるんですね。
miyagawa 2006/04/14 12:09 handle_forceだと、はてなブックマークやdel.icio.usのフィードも全文化されるので、できればあまり使いたくないんですよね。
manabou 2006/04/15 01:21 あるケースのみ、handle_forceできるといいんですけどねぇ。。。
最新版にしてみました。
しかし、やはりうまくとれないのもありました。
ぱっとrdfをみたかんじでは、descriptionにCDATAがあるところが、全文取れないようにみえました。
http://rss.rssad.jp/rss/nifty/manabe