ブログトップ 記事一覧 ログイン 無料ブログ開設

Mac OS Xの文字コード問題に関するメモ このページをアンテナに追加 RSSフィード

2013-11-06

CJK統合漢字拡張Fがヤバイ


  • 日本がCJK統合漢字拡張F1/F2に提案している文字には、すでにUCSに入っている漢字と見分けがつかない例がいくつもある。これらは、提案書*1に「Similar and Variation」として既存の文字の符号位置が記載されているものの一部であり、つまり、似ている漢字の存在は百も承知で提案しているわけだ。
  • 以下、そのような例を拾ってみた。左右に並べた文字のうち「UCS」欄に符号位置が入っているほうが、既存のもの。個々の文字について述べることはしないが、要するに「別字の衝突であれば、形が同じでも別の符号を与える」ということだろう。
  • だが、ちょっと待ってほしい。それって実はものすごく根本的な方針転換じゃないですか? 「機」の簡体字の「机」も「つくえ」の「机」も、形が同じである以上、同じ符号位置(U+673A)に包摂・統合するというのがCJK統合漢字の大原則であったはず*2。ここでいきなりそれをひっくり返しますか?
  • この項追記。「戸籍統一文字は行政システムが使用している文字であるから、そこで区別されている文字はUCSでも区別するべきだ」という主張であれば、(賛成はしないが)それは包摂の原則とは異なるレベルの話だから、まだ理解はできる。しかし、今回の拡張F1/F2への提案は、戸籍統一文字を一律に区別しようというものではない。たとえば以前のエントリ(石井茂吉はおっぱいの夢を見るか)で取り上げた画数違いの「雌」などは提案されていないし、他にもこれに類する例は「紫」などいくつもある。「雌」や「紫」の例については、画数は違っても「別字」ではないから提案していないということだろう。そうであればやはり、今回の提案はCJK統合漢字の大原則をひっくり返そうとするものであると考えざるをえない。

  • CJK統合漢字拡張F1/F2に日本が提案している文字すべてのリストは、以下。

日本ソースのCJK統合漢字拡張F1候補・その1

日本ソースのCJK統合漢字拡張F1候補・その2

日本ソースのCJK統合漢字拡張F2候補・その1

日本ソースのCJK統合漢字拡張F2候補・その2

日本ソースのCJK統合漢字拡張F2候補・その3

日本ソースのCJK統合漢字拡張F2候補・その4

日本ソースのCJK統合漢字拡張F2候補・その5

*1IRGN1882AttributesAttributes_NoEvidence

*2:「机」は日中間の例だが、JIS X 0208における別字衝突の例としては、「芸亭」の「芸(ウン)」と「芸術」の「芸(ゲイ)」の包摂などがよく知られている。

KoichiYasuokaKoichiYasuoka 2013/11/07 09:39 これ、「脧」と「朘」に関する提案は、さすがにちょっと変で、U+8127とU+6718にすべきだと思うの。http://slashdot.jp/~yasuoka/journal/557516/ 書いた時に連絡したつもりだったんだけど、届いてないのかしら?

KoichiYasuokaKoichiYasuoka 2013/11/07 09:44 でも、それ以外は、UCS追加が蹴られれば「タダ」でIVSに載せることができるので、そこ狙いもアリってことで。

NAOINAOI 2013/11/07 12:44 なるほど、ありがとうございます。でも、IVSっていうのも(あれこそ「見た目」にフォーカスした枠組みのはずなので)違う気が……。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/NAOI/20131106/1383711274