Perlは初心者に近いです。(入門サイトを読み終えた程度)
ですがPerlモジュールの選別と使い方、HTMLやXMLなどの基礎が書かれているのでPerlの実行環境があれば書いてあるプログラムがすぐにでも試せ、何をやっているのかが分かります。
資源収集系プログラミングのノウハウはインターネットで公開しているサイトも少なく、その情報も本当に簡易なものや、解説が全くなく「これ実行すればとりあえずできるよ」というものばかりです。というよりまず何を調べればいいのか分からない状態だと思います。
この本を読むとどういう方法でどのように収集すればいいのか、という基礎が分かるので解説の不足部分を調べる、というところまでレベルアップできます。
自分も最初まず何をすればいいのか分からないというところから、ここをこうするにはどうすればいいのか、というところまでレベルアップできました。(ここまで検索対象を絞り込むと情報も出てきます)
初心者で志はあるが、何をすればいいのかわからない人におすすめの本です。
¥4,383¥4,383 税込
無料配送 6月12日-13日にお届け
発送元: 令和書店 毎日発送中です!【安心の返金保証適用品】 販売者: 令和書店 毎日発送中です!【安心の返金保証適用品】
¥4,383¥4,383 税込
無料配送 6月12日-13日にお届け
発送元: 令和書店 毎日発送中です!【安心の返金保証適用品】
販売者: 令和書店 毎日発送中です!【安心の返金保証適用品】
¥220¥220 税込
ポイント: 2pt
(1%)
配送料 ¥330 6月16日-17日にお届け
発送元: 【公式】ブックオフ 販売者: 【公式】ブックオフ
¥220¥220 税込
ポイント: 2pt
(1%)
配送料 ¥330 6月16日-17日にお届け
発送元: 【公式】ブックオフ
販売者: 【公式】ブックオフ
無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
SPIDERING HACKS: ウェブ情報ラクラク取得テクニック101選 単行本 – 2004/5/1
{"desktop_buybox_group_1":[{"displayPrice":"¥4,383","priceAmount":4383.00,"currencySymbol":"¥","integerValue":"4,383","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"xgtKOzjYKd3ClvXeI2L07dG%2FygzfQnrGIe7ZdYaNy5NF6ELHLQSSA2lOxRSgqC0u7h2amZ%2FSOTok4NxuRlHRT0NlFKKFBewlnXu8XsaDRO0LTz6Y2Ivni4HYgsk51WO3Tfz1BYdtD%2BBYLy5ctDFuUOlJ87qeLGiI2PsXsm3UuMG91Mcz7mRkVw%3D%3D","locale":"ja-JP","buyingOptionType":"NEW","aapiBuyingOptionIndex":0}, {"displayPrice":"¥220","priceAmount":220.00,"currencySymbol":"¥","integerValue":"220","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"xgtKOzjYKd3ClvXeI2L07dG%2FygzfQnrGaVvecKnxHbmTw%2BL%2B%2F0f3AXeIXBlud9IKddpaTKX3T6vKOAqQsyZTttMBqnX2BZDQtkFt%2Fk6wz0CjkN0AWPomJjbzTBVxkEnpljHfFREE7Z7t2HwcwNon5HNAe5QG0UsNDXmmmBwn4RKkP%2FQSJt97yoDgOyrVNUzQ","locale":"ja-JP","buyingOptionType":"USED","aapiBuyingOptionIndex":1}]}
購入オプションとあわせ買い
毎日欠かさずチェックしているウェブページがありますか?ウェブ上のデータを二次利用したくありませんか?ウェブサービスを駆使してみたくないですか?そう思ったことがあるのなら、この本を読むべきです。本書は、ウェブを横断して情報を自動収集するプログラム、スパイダを自由自在に操り、目的の情報を取り出す方法を詳しく解説しています。また、各Hackを積極的に日本語化し、訳書版独自のHackや日本語処理の注意点(付録)を収録するなど、至れり尽くせりの内容です。スパイダ通のテクニックが満載!
- 本の長さ516ページ
- 言語日本語
- 出版社オライリージャパン
- 発売日2004/5/1
- ISBN-104873111870
- ISBN-13978-4873111872
商品の説明
内容(「MARC」データベースより)
ウェブを横断して情報を自動収集するプログラム、スパイダを自由自在に操り、目的の情報を取り出す方法を詳しく解説。各Hackを積極的に日本語化し、訳書版独自のHackや日本語処理の注意点も収録。
登録情報
- 出版社 : オライリージャパン (2004/5/1)
- 発売日 : 2004/5/1
- 言語 : 日本語
- 単行本 : 516ページ
- ISBN-10 : 4873111870
- ISBN-13 : 978-4873111872
- Amazon 売れ筋ランキング: - 958,993位本 (本の売れ筋ランキングを見る)
- - 18,089位電気・通信 (本)
- カスタマーレビュー:
著者について
著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。
著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう
著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう
カスタマーレビュー
星5つ中4.1つ
5つのうち4.1つ
全体的な星の数と星別のパーセンテージの内訳を計算するにあたり、単純平均は使用されていません。当システムでは、レビューがどの程度新しいか、レビュー担当者がAmazonで購入したかどうかなど、特定の要素をより重視しています。 詳細はこちら
11グローバルレーティング
虚偽のレビューは一切容認しません
私たちの目標は、すべてのレビューを信頼性の高い、有益なものにすることです。だからこそ、私たちはテクノロジーと人間の調査員の両方を活用して、お客様が偽のレビューを見る前にブロックしています。 詳細はこちら
コミュニティガイドラインに違反するAmazonアカウントはブロックされます。また、レビューを購入した出品者をブロックし、そのようなレビューを投稿した当事者に対して法的措置を取ります。 報告方法について学ぶ
-
トップレビュー
上位レビュー、対象国: 日本
レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。
2012年4月11日に日本でレビュー済み
Amazonで購入
2015年5月24日に日本でレビュー済み
Amazonで購入
数年前、仕事を引き継いだ時に当時の同僚からお勧め書籍として勧められ中古で購入。
WEB Scrapingの為のPERL Moduleのインストールに始まり、WWW Mechanizeの基本からWEB Scrapingの方法について書かれています。紹介されているソースコードはPERLになります。初版は2004年です。その当時主流だった 静的なWEB SITEや、クライアント側から検索リクエストをWEBサーバーに送信して(DBサーバーから取得した情報を)WEBサーバーからブラウザに返すタイプのWEBサイトへのWEB Scrapingの方法についてサンプルソースコードと合わせて書かれています。
しかしこの本が発売された1年後の2005年Jesse James Garrettがタイトル「Ajax: A New Approach to Web Applications」のBLOG記事を公開した辺りからAJAX等のフロントエンド Java Scriptの技術が急速に普及していって今に至るわけだけど、これ以降のweb関連技術をこの書籍ではフォローされてません。その結果jQueryとか使ってブラウザの下までスクロールされると続きのコンテンツがロードされるタイプのFront Endのイベントで動的な動きをするWEB SiteなどについてのScrapingのテクニックが掲載されて無く、内容に古さがあるのは否めません。基本的な考え方はこの本で吸収できるとは思いますので、内容が少々古くても良いという人にはいいかも知れません。
WEB Scrapingの為のPERL Moduleのインストールに始まり、WWW Mechanizeの基本からWEB Scrapingの方法について書かれています。紹介されているソースコードはPERLになります。初版は2004年です。その当時主流だった 静的なWEB SITEや、クライアント側から検索リクエストをWEBサーバーに送信して(DBサーバーから取得した情報を)WEBサーバーからブラウザに返すタイプのWEBサイトへのWEB Scrapingの方法についてサンプルソースコードと合わせて書かれています。
しかしこの本が発売された1年後の2005年Jesse James Garrettがタイトル「Ajax: A New Approach to Web Applications」のBLOG記事を公開した辺りからAJAX等のフロントエンド Java Scriptの技術が急速に普及していって今に至るわけだけど、これ以降のweb関連技術をこの書籍ではフォローされてません。その結果jQueryとか使ってブラウザの下までスクロールされると続きのコンテンツがロードされるタイプのFront Endのイベントで動的な動きをするWEB SiteなどについてのScrapingのテクニックが掲載されて無く、内容に古さがあるのは否めません。基本的な考え方はこの本で吸収できるとは思いますので、内容が少々古くても良いという人にはいいかも知れません。
2005年7月30日に日本でレビュー済み
Amazonで購入
中級者以上用。
洋書の役なので中級者以上でないと意味不明の訳が多い。
洋書の役なので中級者以上でないと意味不明の訳が多い。
2011年3月4日に日本でレビュー済み
Amazonで購入
最初はPerlよりも、Spideringという言葉につられてなんとなく購入してみました。(1年前)
仕事から帰って、Hackを少しずつこなすのはなかなか続けるのは大変です。
内容自体は少し古めなので、Hack対象のサイトが消えたり、アドレスが変わってたりはしょっちゅうです。
それでも、Hackのネタから今出来ることを自分なりに工夫して、ようやくHack50近くにたどり着きました。
確かに今では Web::Scraperをはじめとした、より便利なHackがあるかもしれません。
ですが、本当にスキルをあげようと思ったら自分の手を動かして、工夫して、それでもハマって、
それを乗り越えるしかないと思います。
その意味で、今こそこの本は買いの一冊といえるのではないでしょうか?
仕事から帰って、Hackを少しずつこなすのはなかなか続けるのは大変です。
内容自体は少し古めなので、Hack対象のサイトが消えたり、アドレスが変わってたりはしょっちゅうです。
それでも、Hackのネタから今出来ることを自分なりに工夫して、ようやくHack50近くにたどり着きました。
確かに今では Web::Scraperをはじめとした、より便利なHackがあるかもしれません。
ですが、本当にスキルをあげようと思ったら自分の手を動かして、工夫して、それでもハマって、
それを乗り越えるしかないと思います。
その意味で、今こそこの本は買いの一冊といえるのではないでしょうか?
2004年9月8日に日本でレビュー済み
Amazonで購入
WEBから特定の情報源を収集して、体系立てて保存したいと考えている人は、必読。
本書は文字列の処理に優れたPerlを中心に記述されているが、WEBアプリケーションに特化したPHPのサンプルが紹介されている。
収集したデータをブログで利用されているRSS(XML)形式にして再公開するための手法も紹介されている。
さらに、スパイダーを運用するに当たっての注意事項などにもページを割いている点は好感。
そして、原著は米国で記述されたものだが、翻訳をする際に日本独自の記述もあり、日本語処理などに戸惑うことは少ないだろう。
買って損なし。値段以上の価値がある。
本書は文字列の処理に優れたPerlを中心に記述されているが、WEBアプリケーションに特化したPHPのサンプルが紹介されている。
収集したデータをブログで利用されているRSS(XML)形式にして再公開するための手法も紹介されている。
さらに、スパイダーを運用するに当たっての注意事項などにもページを割いている点は好感。
そして、原著は米国で記述されたものだが、翻訳をする際に日本独自の記述もあり、日本語処理などに戸惑うことは少ないだろう。
買って損なし。値段以上の価値がある。
2004年5月28日に日本でレビュー済み
Amazonで購入
インターネットを使いこなす上で絶対必要な検索力、それを磨くには絶対必要な本、と言えるほど充実した内容になっています。
Google Hacks を持っている人にも超お勧めの本です。
Google Hacks を持っている人にも超お勧めの本です。
2008年4月23日に日本でレビュー済み
このHacksシリーズのよさは、テクニック100選にあるかもしれない。
技術を体系的に教えようとしたり、解説しようとすると、書きたいことが多すぎて、整理しきれないことがある。本書のように、100という制約を設けると、じゃ、何を書いて、何を削ろうという選択がしやすい。そのため、内容も厳選され、質も揃うことになるのではないかと推測できる。
ただ、本書だけは101になっている本当の理由はなんだろうかは興味がある。
Spideringという情報検索(収集)ロボットに関する技術紹介である。
自分のPCに取得した方がよいか、常にネットにつながるところで作業するかは、仕事の仕方によるかもしれない。
情報の機密性、価値などに対する考え方で、集めてくるのがいいかどうか。
情報の整理の仕方についても考えさせられる。
技術を体系的に教えようとしたり、解説しようとすると、書きたいことが多すぎて、整理しきれないことがある。本書のように、100という制約を設けると、じゃ、何を書いて、何を削ろうという選択がしやすい。そのため、内容も厳選され、質も揃うことになるのではないかと推測できる。
ただ、本書だけは101になっている本当の理由はなんだろうかは興味がある。
Spideringという情報検索(収集)ロボットに関する技術紹介である。
自分のPCに取得した方がよいか、常にネットにつながるところで作業するかは、仕事の仕方によるかもしれない。
情報の機密性、価値などに対する考え方で、集めてくるのがいいかどうか。
情報の整理の仕方についても考えさせられる。
2009年3月12日に日本でレビュー済み
「Perlをある程度勉強している」+「Webページから情報を抜き出すことに興味がある」
の二項目に当てはまれば持っていて損はない本だと思います。
もともとが洋書であるため、対象サイトが海外のものであるのもちらほらありますが、
翻訳する際にソースや内容も日本人向けに変更しているのでそこまで問題になりません。
翻訳もよく、難しくも面白い内容を取り扱っている本なので、
個人的には買ってよかったと思える本でした。
因みに、自分はスパイダリングに関する本を読んだのはこれが初めてですが、
初心者(Perlの知識はある程度必要)でも全く何が書いてあるのか分からないということはありませんでした。
の二項目に当てはまれば持っていて損はない本だと思います。
もともとが洋書であるため、対象サイトが海外のものであるのもちらほらありますが、
翻訳する際にソースや内容も日本人向けに変更しているのでそこまで問題になりません。
翻訳もよく、難しくも面白い内容を取り扱っている本なので、
個人的には買ってよかったと思える本でした。
因みに、自分はスパイダリングに関する本を読んだのはこれが初めてですが、
初心者(Perlの知識はある程度必要)でも全く何が書いてあるのか分からないということはありませんでした。