はてなブログ トップ
Web::Scraper
このタグでブログを書く
言葉の解説
ネットで話題
関連ブログ
Web::Scraper
(コンピュータ)
【うぇぶすくれいぱー】
Perlのモジュール。
Webサイトの任意の部分を簡単に切り出すことが出来る。
宮川達彦氏がRubyのライブラリ「scrAPI」というスクレイピングツールキットにインスパイアされて実装した。
このタグの解説について
この解説文は、
すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集
した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、
お問い合わせフォーム
よりご連絡ください。
解説の続きを読む
ネットで話題
もっと見る
212
ブックマーク
てきとうにクリックしたらてきとうにWeb::Scraperのコードを作ってくれるWebScraper IDE - bits and bytes
まえに作ったWeb::Scraperのjavascriptバージョンwebscraper.jsとXPathをてきとうに作ってくれる機能を追加したwebscraperp.jsにHTMLのドキュメントから繰り返し部分をみつけてSITEINFOをつくるAutoPagerize Iteration Detectorみたいなみためをくっつけて、取り出したい部分をクリックしたらてきとうにXPathを生成してW...
labs.gmo.jp
165
ブックマーク
Web::Scraper - naoyaのはてなダイアリー
naoya-2.hatenadiary.org
123
ブックマーク
ブログが続かないわけ | Web::Scraper 使い方(超入門)
en.yummy.stripper.jp
96
ブックマーク
Web::Scraperのjavascriptバージョンwebscraper.js - bits and bytes
perlのWeb::Scraperみたいな記述で、ページの中からデータを取り出すwebscraper.jsという小さなjavascriptのライブラリを書きました。 ブックマークレット データを取り出したいページでブックマークレットでwebscraper.jsを読み込んでFirebugコンソールで使います。 ブックマークレット webscraper コードwebscraper.js...
labs.gmo.jp
96
ブックマーク
Web::Scraperが便利すぎて困るの巻 (CodeZine編集部ブログ)
こんにちは、編集マンの久次です。 なんだかPerlのWeb::Scraperが便利すぎで、やばいです。 これまでWWW::Mechanizeでごにょごにょやっていたのですが、一気にいろんなものが解決しました。 それで、いろいろ書いていたら、HTML::TreeBuilderのlook_downというメソッドも強力なことにいまさらながら、気づいたので勉強が...
blog.codezine.jp
94
ブックマーク
Config::PitとWeb::ScraperとPlaggerで24時間365日のゲーム監視体制
序文 趣味のネットウォッチのために仕方が無く超便利なPerlを覚えようという感じの otsune です。そんなわけでコーディングの深い話はよくわからんので、今回はPerlとCPANを使ってネットウォッチを支援する手法について書きます。 ウォッチしたいWebページを機械的に監視できれば、あとはPlaggerなどの便利ツールを使っ...
perl-users.jp
86
ブックマーク
Web::Scraper を XML::LibXML で爆速にする hack! - woremacxの日記
id:miyagawa さんの Web::Scraper で、HTML::TreeBuilder::XPath の代わりに XML::LibXML を使うととても幸せになれそうなので実験してます。XML::LibXML に手を出す前に IRC で「tinyxpath とか htmlcxx とか使って xpath 周りを高速にしたい」とかボヤいてことがありました。そのときに、id:vkgtaro さんや id:tomyher...
d.hatena.ne.jp
65
ブックマーク
Web::Scraper で XPath と CSS セレクタを混ぜて使う例 - Tociyuki::Diary
tociyuki.hatenablog.jp
53
ブックマーク
WWW::Mechanize::AutoPager+Web::Scraperで複数ページにまたがるデータを扱う - bits and bytes
AutoPagerizeのSITEINFOに含まれている、次のページへのリンクを示すXPathはAutoPagerize以外の用途でも使うことができます。 CPANにこのSITEINFOをパースすめたるの HTML::AutoPagerize - Utility to load AutoPagerize SITEINFO stuff というモジュールがあるのは知っていたのですが、ページのロードと次のページのURL...
labs.gmo.jp