ブログトップ 記事一覧 ログイン 無料ブログ開設

Mac OS Xの文字コード問題に関するメモ このページをアンテナに追加 RSSフィード

2011-04-13

SafariからEUC-JPのページに書き込むと「鷗」などが化ける


  • 原因は、Safariの採用しているEUC-JP用の変換テーブル(IBM-33722)のフォールバック。下図は、UnicodeEUC-JPに変換する際の、IBM-33722における漢字のフォールバックをまとめたもの*1。単に「EUC-JPにない文字」であれば、EUC-JPのページへは数値文字参照で送信されるので化けることはないのだが、フォールバックが定義されているために字体が変わってしまう。

f:id:NAOI:20110413181405p:image

  • ところで、素朴な疑問なのだが、このIBM-33722のフォールバックって、どういう基準で設定しているのだろう。「IBM-33722に入ってなくてUnicodeに入っている異体字」なら、他にもありそうなので(たとえば「吞(U+541E)→呑」とか)、何かしら基準があるのだろうけれど。

*1IBM-33722では漢字以外のフォールバックも定義されているが、話が複雑になるので今回は漢字のみを扱う。