Unicode 世界のほとんどの文字は基本多言語面 (第0面, U+0000~U+FFFF) に収録 マイナーな漢字や絵文字などのは第1面~第16面 (U+10000~U+10FFFF) に収録 UTF-8/16/32は、Unicodeをバイト列で表すエンコードの仕方の違い いずれにしても、シフトJISコードのようなダメ文字問題は発生しない UTF-8 1文字1~4バイトの可変長 英数字(ASCII文字) は1バイト、ASCIIコードと互換性がある その他の欧文は2バイト メジャーな漢字や日本語の文字は3バイト (全角英数字、半角カナ含む) マイナーな漢字や絵文字は4バイト Webページなど、…