Hatena Blog Tags

Octoparse

(ウェブ)
おくとぱす

Octoparseは、視覚的に分かりやすくインターネット上に公開されているホームページ、ウェブシステムから、データを自動で取得できるWebスクレイピングツール/Webクローラーです。コードを書くことなく、スクレイピングの初心者でも、Octoparseを使ってWebサイトから大量の情報を手軽に抽出できます。取得ができるデータは、HTMLファイル、テキストファイル、PNGやGIFをはじめとした画像など幅広く対応できます。ビジネスシーンにあわせて、データをそのままのファイル形式で保存するだけでなく、ご指定の形式に変換してダウンロードできます。CSV、EXCEL、HTML、JSON、データベース(MySQL、SQL Server、Oracle)などさまざまな出力形式があります。

WindowsアプリケーションであるOctoparseは、Ajaxを使うWebページを含む静的および動的Webサイトに対応し、フォームを記入したり、テキストボックスに検索語を入力したりするなどで、人間の操作をシミュレートしてWebページとやり取りします。抽出プロジェクトは、自分のマシン(ローカル抽出)またはクラウド(クラウド抽出)で実行できます。

Octoparseは無料版と有料版は同じ機能を共有しています。無料版だと、一部機能に制限がありますが、ヘビーユーズでもしない限りは、十分すぎるくらいの機能があります。有料版だと、タスクの登録数や自動実行数が多くなり、クラウド上で動作させることもできます。

このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

関連ブログ