Hatena::ブログ(Diary)

もじのなまえ このページをアンテナに追加

2009-01-18

試案における最大の問題点は「頰、塡、剝、𠮟」

安岡さんの日記でも触れられていますね。

この問題については同じく安岡さんの日記「(新)常用漢字と携帯電話」へのコメントでも書いたことがあります。

これについて詳しく書きたいところですが、今ちょっと時間がないので来月に出る予定の『論集文字 新常用漢字を問う』(勉誠出版)に寄せた原稿*1の註をベースに書くことをお許しください。



試案にある追加191字はほとんどがJIS X 0208で表現できるが、4文字だけJIS X 0213でないと符号化できない文字がある。「頰、塡、剝、𠮟」だ。新しい常用漢字表が現実に運用されるようになれば、もっとも大きな問題になるのはこの4字ではないか。

なぜならば、現状ではまだJIS X 0213の文字セットは完全に普及したとは言えず、携帯電話におけるシフトJISや、インターネットメールやウェブにおけるISO-2022-JPなど、文字セット中の漢字レパートリはJIS X 0208だけという符号化方法が広く使われているからだ。

これらの符号化方法を実装している処理系(情報機器に搭載されるフォント等)は、新常用漢字表への対応をどうするか難しい対応を迫られることになる。

ただし、さすがに抜かりのない文化庁/漢字ワーキンググループは、2008年12月16日配布の資料2「「追加字種・字体」についての基本的な考え方(案)」の〔表の見方〕にある付則で、以下のように書いている。

〈付〉情報機器に搭載されている印刷文字の関係で、本表の掲出字体とは異なる字体(掲出字体「頰、賭*2、剝」に対する「頬、賭*3、剥」など)しか使用できない場合については、当該の字体の使用を妨げるものではない。

つまり、この付則によりJIS X 0208で表現できない文字は、無理に置き換えなくてもよいと読めるが、問題は「当該の字体の使用を妨げるものではない」という中途半端な文言だ。

ここで焦点になるのは、この「頰、塡、剝、𠮟」は、いずれも包摂分離によりJIS X 0213で追加された字であるということだ。つまりこれらに関する限り、じつはJIS X 0213JIS X 0208は非互換なのだ。

JIS X 0208では「剝、𠮟」は包摂の範囲内だから、規格の上からは例えば28-24に「𠮟」を割り当てても適合する。しかしその実装環境は、JIS X 0213との間で文字化けを発生させる。JIS X 0213は「叱」と「𠮟」を区別しているのに、「叱」が表示されるべきところで「𠮟」が表示されてしまうのだ。

こうした実装について、試案はどのように考えているのだろう。先の引用部分では「当該の字体の使用を妨げるものではない」とあるから、どちらでもよいとも読める。つまり、28-24に「𠮟」を割り当ててることを推奨しない代わりに、否定もしていない。ならば常用漢字ではない「当該の字体」などより、印刷標準字体である「𠮟」を使用したくなるというものではないか。これが「最大の問題点」だ。

話はこれだけですまない。さらに呪われていることに、「塡、頰」はJIS X 0208箇条6.6.4「過去の規格との互換性を維持するための包摂規準」(通称互換規準)に含まれる。これにより「塡、頰」を15-56、43-43に割り当てた場合、「鷗、瀆」など83JISで問題となった29字までが、対応する元の区点位置に実装可能になる。それをした場合(もちろんJIS X 0208には完全に適合するのだが...)、JIS X 0213との非互換がその分だけ拡大してしまう。

この問題を回避するには、前掲のような曖昧な文言ではなく、明確に「頬、填、剥、叱」を表内字として許容すると規定するより方法がないと思える。さもなければ、JIS文字コードは救いようのない混乱に陥るだろう。

*1:これについては、もう少しはっきりしたら改めて書こうと思います。

*2:引用者註:点あり

*3:引用者註:点なし

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証