Octoparse

ウェブ

Octoparse

おくとぱす

Octoparseは、視覚的に分かりやすくインターネット上に公開されているホームページウェブシステムから、データを自動で取得できるWebスクレイピングツール/Webクローラーです。コードを書くことなく、スクレイピングの初心者でも、Octoparseを使ってWebサイトから大量の情報を手軽に抽出できます。取得ができるデータは、HTMLファイル、テキストファイル、PNGGIFをはじめとした画像など幅広く対応できます。ビジネスシーンにあわせて、データをそのままのファイル形式で保存するだけでなく、ご指定の形式に変換してダウンロードできます。CSVEXCELHTMLJSONデータベースMySQLSQL ServerOracle)などさまざまな出力形式があります。

WindowsアプリケーションであるOctoparseは、Ajaxを使うWebページを含む静的および動的Webサイトに対応し、フォームを記入したり、テキストボックスに検索語を入力したりするなどで、人間の操作をシミュレートしてWebページとやり取りします。抽出プロジェクトは、自分のマシン(ローカル抽出)またはクラウドクラウド抽出)で実行できます。

Octoparseは無料版と有料版は同じ機能を共有しています。無料版だと、一部機能に制限がありますが、ヘビーユーズでもしない限りは、十分すぎるくらいの機能があります。有料版だと、タスクの登録数や自動実行数が多くなり、クラウド上で動作させることもできます。