無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
Apache Lucene 入門 ~Java・オープンソース・全文検索システムの構築 大型本 – 2006/5/17
- 本の長さ352ページ
- 言語日本語
- 出版社技術評論社
- 発売日2006/5/17
- ISBN-104774127809
- ISBN-13978-4774127804
この商品をチェックした人はこんな商品もチェックしています
商品の説明
著者からのコメント
本書は6章構成になっており、第1章から第4章が前編、第5章と第6章が後編となっている。前編を「基本編」、後編を「応用編」と読み替えてもよい。Luceneのアプリケーションを書くためには「基本編」である第1章から第4章を通読しておくことが望ましい。「応用編」である第5章と第6章は余力があれば読むとよいだろう。
第1章は、全文検索とLuceneの基本知識の習得を目標とし、これらについて簡潔に述べている。Luceneに関しては、最初の全文検索のサンプルプログラムを作成し、その内容や動作を紹介している。サンプルプログラムの題材(全文検索のためのコンテンツ)には、日本でもっとも有名なファミリーである「サザエさん一家」を使用している。
第2章は、Analyzer(アナライザー)について説明している。Analyzerは、全文検索の対象となるドキュメントテキストを分析し、単語を取り出す働きをするものである。本章では特に日本語のテキストの分析に重きを置き、JapaneseAnalyzerの解説にページ数を割いている。その後、CJKAnalyzer、StandardAnalyzerおよびその他のAnalyzerを紹介する。
Luceneは全文検索に「転置索引方式」を採用している。そのため、検索の前にあらかじめ「インデックス」を作成しておかなければならない。第3章では、その「インデックス」の作成方法について説明している。その後、第4章で「インデックス」の検索方法について説明している。全文検索のサンプルデータとしては、サンプルプログラムの内容と動作の理解が進むよう、読者にとって親しみやすいと思われる「技術評論社の書籍データ」と郵便局の「大口事業所等個別番号データ」を用いた。
後編の第5章では、前編で習得した知識を使って、全文検索機能を持ったWebアプリケーションを作成する。このWebアプリケーションの検索機能は、「データベース」、「HTMLファイル」、「XMLファイル」、「PDFファイル」および「Mocrosoft Wordファイル」といった「異種ドキュメント」を透過的に検索し、表示する。
第6章では、「セキュリティ」、「検索質問語の強調表示」、「Ajaxを使用したインクリメンタルサーチ」等々といった、より応用的・発展的な内容を取り上げている。読者のLuceneアプリケーションにいろいろな機能を追加する際のヒントとなるだろう。
なお、Appendix AにはLuceneはじめ、その他の関連ツールおよび本書のサンプルプログラムのインストールと実行方法を掲載している。
出版社からのコメント
抜粋
本書は6章構成になっており,第1章から第4章が前編,第5章と第6章が後編となっている。前編を「基本編」,後編を「応用編」と読み替えてもよい。Luceneのアプリケーションを書くためには「基本編」である第1章から第4章を通読しておくことが望ましい。「応用編」である第5章と第6章は余力があれば読むとよいだろう。
■第1章
第1章は,全文検索とLuceneの基本知識の習得を目標とし,これらについて簡潔に述べている。Luceneに関しては,最初の全文検索のサンプルプログラムを作成し,その内容や動作を紹介している。サンプルプログラムの題材(全文検索のためのコンテンツ)には,日本でもっとも有名なファミリーである「サザエさん一家」を使用している。
■第2章
第2章は,Analyzer(アナライザー)について説明している。Analyzerは,全文検索の対象となるドキュメントテキストを分析し,単語を取り出す働きをするものである。本章では特に日本語のテキストの分析に重きを置き,JapaneseAnalyzerの解説にページ数を割いている。その後,CJKAnalyzer,StandardAnalyzerおよびそのほかのAnalyzerを紹介する。
■第3,4章
Luceneは全文検索に「転置索引方式」を採用している。そのため,検索の前にあらかじめ「インデックス」を作成しておかなければならない。第3章では,その「インデックス」の作成方法について説明している。その後,第4章で「インデックス」の検索方法について説明している。全文検索のサンプルデータとしては,サンプルプログラムの内容と動作の理解が進むよう,読者にとって親しみやすいと思われる「技術評論社の書籍データ」と郵便局の「大口事業所等個別番号データ」を用いた。
■第5章
後編の第5章では,前編で習得した知識を使って,全文検索機能を持ったWebアプリケーションを作成する。このWebアプリケーションの検索機能は,「データベース」,「HTMLファイル」,「XMLファイル」,「PDFファイル」および「Mocrosoft Wordファイル」といった「異種ドキュメント」を透過的に検索し,表示する。
■第6章
第6章では,「セキュリティ」,「検索質問語の強調表示」,「Ajaxを使用したインクリメンタルサーチ」等々といった,より応用的・発展的な内容を取り上げている。読者のLuceneアプリケーションにいろいろな機能を追加する際のヒントとなるだろう。
なお,Appendix AにはLuceneはじめ,そのほかの関連ツールおよび本書のサンプルプログラムのインストールと実行方法を掲載している。
著者について
登録情報
- 出版社 : 技術評論社 (2006/5/17)
- 発売日 : 2006/5/17
- 言語 : 日本語
- 大型本 : 352ページ
- ISBN-10 : 4774127809
- ISBN-13 : 978-4774127804
- Amazon 売れ筋ランキング: - 984,487位本 (本の売れ筋ランキングを見る)
- - 654位情報学・情報科学全般関連書籍
- - 735位開発技法
- カスタマーレビュー:
著者について
著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう
-
トップレビュー
上位レビュー、対象国: 日本
レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。
この本のおかげでかなり救われてます。
この本に出会うまではハイライト表示がどうしてもうまく行かずずれてしまっていたのですが
その原因と対処方法が分かり、ハイライト表示がちゃんとできるようになりました。
あとサンプルですが、バージョンが違うと動きません。
特にLuceneのバージョンは本の通りに1.9.1にしないとだめでした。
その他、ツールはjarの名前が変わっているものがあるので
バージョンが違うものを使用する場合はbuild.properties中の名前を変えないとだめです。
私はwebアプリケーションのサンプルは不要だったので試してないですが
たぶんバージョンをそろえれば動くのではないかと思います。
日本語の処理で気になる構文解析についても詳しく説明がされている。
入門書というだけあって、サンプルのプログラムを一通り動かすと、Luceneを
こういう風に使えばいいんだ、ということがわかるが、サンプルを動かすには、
tomcatやantなどの最低限の知識が必要となる。
実際のシステムで利用する場合のヒントが散見的に書いてあるが、もう少し具体的に書いて
もらえるとよかった。続編に期待したい。