日本語情報処理の続編である。
CJKV(Chinese, Japanese, Korean and Vietnamese)の東アジア言語処理を詳細に説明している。
日本語情報処理は、日本人によらない、日本人のための、日本語によらない日本語の本だった。
英語でこの本がでたときは衝撃的だった。日本人は、EUCだとシフトJISだのについてつまらない議論をしているときに、日本人以外の人により本質的な解説をされてしまったような気がした。
本書でも、芝野耕作らの日本語文字コードの標準化を担当している方々に謝辞を送っているように、綿密な調査を行っている。
文字コードと、コード化(エンコーディング)とを分けて記述するようにしているため、実際にファイル上に存在しているコードと、コードの飜訳処理の関係をより厳密に理解できると思われる。
また、日本語の漢字表現と意味と読み方について記述しているため、日本語を理解してもらうためのよい技術書としても利用できる。
ps.
その後の展開としては、日本人による日本人のための漢字のフォントである文字鏡フォントがでて、日本の先進性が確保された。中国に対しても先行していた。中国、韓国、ベトナムの標準化活動をされている方々に紹介していただけると嬉しい。
無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
CJKV日中韓越情報処理 単行本 – 2002/12/24
- 本の長さ1128ページ
- 言語日本語
- 出版社オライリージャパン
- 発売日2002/12/24
- ISBN-104873111080
- ISBN-13978-4873111087
この商品をチェックした人はこんな商品もチェックしています
ページ 1 以下のうち 1 最初から観るページ 1 以下のうち 1
商品の説明
商品説明
欧米のアプリケーションを日本で販売するためには、英数字による情報処理に加えて日本語処理の機能を追加する必要がある。同様に、巨大市場への成長が期待される中国、韓国、ベトナムなどの東アジアにおいても、各々の国の言語処理が、アプリケーションビジネス参入の1つの壁となっている。
本書は、中国語、日本語、韓国語、ベトナム語の情報処理について詳細に解説したものである。1993年に出された、同著者の『日本語情報処理』の続編にあたる。1998年に出版された原書の翻訳のため、各国における言語処理の最新情報は網羅されてはいないが、それでも数少ない4か国語対応の言語処理のバイブルである。総ページ数1100のなかに、広範なトピックと各項目の詳細な解説を掲載している。
主な内容は以下のとおりである。
- 各言語のテキストを構成する文字の表記体系
- 各言語において国家規格と国際規格の2種類に分類された電子文字集合と非電子文字集合の歴史的背景や文字集合規格間の比較
- 文字集合がコンピュータ上で符号化される方式
- 文字入力方法と具体的なキーボード配列の紹介
- ビットマップフォントやアウトラインフォントなどのフォントフォーマット
- テキストをページ上の適切な位置に配置して印刷するタイポグラフィ
- 出力に関する情報
- コード変換やテキスト処理のテクニックに関するアルゴリズムや詳細な情報
- 1つ以上の言語に対応するOSやエディタ
- ワープロに関する情報
- 辞書と電子辞書に関する情報や索引の効率的な使用法
- 電子メールやニュースで各言語のテキストを効率良く処理する方法や各言語に対応するインターネットドメインの情報
- Webブラウザを使って各言語のテキストを表示する方法
- HTML、XMLを書く場合の命令の紹介
付録には、コード変換表やコード表、本書で取り上げたソフトウェアとドキュメントの問い合わせ先、Perlのプログラム例などが掲載されている。東アジア諸国へのアプリケーションのローカライズや開発に携わる技術者に必須のバイブルである。(大塚佳樹)
メディア掲載レビューほか
*CJKV日中韓越情報処理*
日本語を中心に中国語,韓国語,ベトナム語という東アジアの言語をコンピュータで処理する方法について包括的に解説する。1998年に原著が出版されて以来,マルチバイト言語処理の教科書として広く利用されている名著である。文字集合や符号化方式にはじまり,フォント形式やタイポグラフィにいたるまで言語処理に必要なあらゆる事柄に言及している。原著者が米AdobeSystems社で和文フォント制作に従事していた関係で,PostScriptフォント(OCFフォントやCID-keyedフォント)については他書ではなかなか得ることのできない貴重な情報が得られる。
日本語を中心に中国語,韓国語,ベトナム語という東アジアの言語をコンピュータで処理する方法について包括的に解説する。1998年に原著が出版されて以来,マルチバイト言語処理の教科書として広く利用されている名著である。文字集合や符号化方式にはじまり,フォント形式やタイポグラフィにいたるまで言語処理に必要なあらゆる事柄に言及している。原著者が米AdobeSystems社で和文フォント制作に従事していた関係で,PostScriptフォント(OCFフォントやCID-keyedフォント)については他書ではなかなか得ることのできない貴重な情報が得られる。
(日経Linux2003/3/1Copyright©2001日経BP企画..Allrightsreserved.)
-- 日経BP企画
内容(「MARC」データベースより)
各言語の表記体系の概略から文字集合の歴史的背景と現状、符号化方式の詳細、出力方式など幅広く解説。コード変換やテキスト処理のためのサンプルプログラムも多数掲載。ソフトバンク社1995年刊「日本語情報処理」の続編。
登録情報
- 出版社 : オライリージャパン (2002/12/24)
- 発売日 : 2002/12/24
- 言語 : 日本語
- 単行本 : 1128ページ
- ISBN-10 : 4873111080
- ISBN-13 : 978-4873111087
- Amazon 売れ筋ランキング: - 1,059,812位本 (本の売れ筋ランキングを見る)
- - 697位情報学・情報科学全般関連書籍
- - 18,245位電気・通信 (本)
- カスタマーレビュー:
著者について
著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。
著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう
著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう