Hatena::ブログ(Diary)

Cafe Babe RSSフィード

2006-10-19

[] Windows Vistaの登場で顕在化する問題

C#言語JIS改訂作業の委員会に出ていて,もうすぐWindows Vistaリリースされるために現在各社で懸命に検証作業をおこなっているが,その中で見つかったという興味深い問題の話を某氏に聞いた.なお,私自身はまだ使っていないので,伝聞の話として読んでほしいし,間違いがあれば指摘して欲しい.

Windows VistaJIS X 0213に対応することは,みなさん聞いているかもしれない.これは一体どういうことかというと,使う側から見たらより多くの文字を表示できるようになるだけでなく,仮名漢字変換の段階で,それらの文字を含んだ候補が提示されるということだ.また,開発者の側から見ると,プログラム内部でEUC符号化やシフトJIS符号化で扱うことができなくなるのでUnicodeとして扱えるように移行していくだろうこと,そしてUnicodeを採用したシステムであっても,仕様に忠実な文字の扱い…たとえば一部の文字は複数のUnicode符号位置で表したり,UTF-16の可変長符号単位…つまり16ビット符号単位を2つ合わせて1文字を表現したりすることが必要になるのだ.現在主要なシステムは対応しているものの,ユーザの使っているプログラムが正しく実装されているとは限らないので注意して欲しい.

それで,今回指摘された問題は前者に関するものである.Microsoftは,JIS X 0213を意識しないで活用できるように設計した結果,逆にユーザJIS X 0213で初めて導入された新しい文字かそうでないかを簡単には区別できないようになっている.つまり,知らないうちにどんどん使われてしまうようになるのだ.たとえば,丸数字を受け入れざるをえなかったと同様に,これらの新しい文字も早急に受け入れざるをえないだろう…しかも今回は独自拡張ではなくJIS規格なのだから.私がいろいろな場所でこの問題について発言してきたが,ついに顕在化しようとしているわけである.

ただし,現状ではまだJIS X 0213に対応しているシステムばかりではないわけなので,何らかの移行段階における暫定的な措置が必要である.某氏が指摘したのは,IMEの入力を従来のコードページ932に制限する方法がないことである.たとえば,IMEJIS第一水準と第二水準に制限する機能があるらしいが(私自身は未確認),これでは(当然)丸数字などの独自文字が通らないらしい.さて,開発者はこの問題にどう対処するべきか?…この問題は,特にWindows Vistaが登場したらホットな話題になるかもしれない.

moriyamamoriyama 2006/10/20 14:14 Windows98 の時点で、JIS X 0212 の文字は Unicode アプリで使えていました。MS-IME の辞書にも、それらの文字が使われるようになり、「おうがい」という読みで「[区鳥]外」以外にも「[區鳥]外」が登録されるようになっていた事を確認しています。
この事が問題になるかと心配していたのですが、当時、それほど問題になる事はなかったと記憶しています。
Vista RC2 では、「[区鳥]外」が第一候補で表示されます。候補一覧表示で「[區鳥]外」は、「環境依存文字」と表示されていました。
[区鳥] と [區鳥] は、包摂分離されているので、「鴎」が入ったテキストを Vista に持ってきても、自動的に字体の変更が行なわれるわけではありません。一方、「噂」などの包摂分離されていない文字は、字体が変更されてしまいます。
このように、コードポイントが追加になる文字と、コードポイントは同じで包摂規準内での字体変更になる文字なのかを区別して考える必要があるでしょう。
見た目だけで判断すると混乱する事になるので注意が必要です。

kimuchikimuchi 2006/10/20 21:50 「丸数字などの独自文字が通らないらしい」は、「丸数字などの独自文字が変換候補に表示されない」というのが正確なところです。vistaのimeで、プロパティ→変換→詳細設定→JIS X 0208 の単語/文字のみ変換候補に表示するをチェックすると、「丸数字1」が変換候補に表示されなくなります。IME の設定をそのままに、「丸数字1」を入力しようと思ったら、どっか(文字コード表とか)から copy and paste することになります。面倒です。できれば、Windows XP の IME 互換モードが Vista の IME にほしいところです。ちなみに、私が試したのは Pre-RC1 build 5536 です。RC1 でも同じようです。

kimuchikimuchi 2006/10/20 22:00 追加です。IME の入力パットからも「丸数字1」は入力できますね。

tree3yamatree3yama 2006/10/20 22:04 「印刷標準字体で構成された単語のみ変更候補に表示する。」というオプションがあり、(推奨:オフ)となっていました。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

Connection: close