Octoparseは、視覚的に分かりやすくインターネット上に公開されているホームページ、ウェブシステムから、データを自動で取得できるWebスクレイピングツール/Webクローラーです。コードを書くことなく、スクレイピングの初心者でも、Octoparseを使ってWebサイトから大量の情報を手軽に抽出できます。取得ができるデータは、HTMLファイル、テキストファイル、PNGやGIFをはじめとした画像など幅広く対応できます。ビジネスシーンにあわせて、データをそのままのファイル形式で保存するだけでなく、ご指定の形式に変換してダウンロードできます。CSV、EXCEL、HTML、JSON、データベース(MySQL、SQL Server、Oracle)などさまざまな出力形式があります。
WindowsアプリケーションであるOctoparseは、Ajaxを使うWebページを含む静的および動的Webサイトに対応し、フォームを記入したり、テキストボックスに検索語を入力したりするなどで、人間の操作をシミュレートしてWebページとやり取りします。抽出プロジェクトは、自分のマシン(ローカル抽出)またはクラウド(クラウド抽出)で実行できます。
Octoparseは無料版と有料版は同じ機能を共有しています。無料版だと、一部機能に制限がありますが、ヘビーユーズでもしない限りは、十分すぎるくらいの機能があります。有料版だと、タスクの登録数や自動実行数が多くなり、クラウド上で動作させることもできます。