ブログトップ 記事一覧 ログイン 無料ブログ開設

B-) の独り言

2008-05-14 ツールは多言語対応だが使う私は未対応

CodePage 50420

EnCaseでは任意のコードページ(Code Page)を指定することができるのですが、Code Page の一覧に「50420」など謎のコードページが表示されます。

f:id:hideakii:20080514125040j:image

コントロールパネルの「地域と言語のオプション」で「詳細設定」ではそんな番号を持つコードページは表示されないわけですが、恐らく は単純に OS からリスト取り出して表示しているだけと思われるので、そいうのが内部的には?定義されているんだろうと考えています。

まぎらわしいのは、ISO 2022-JP と書かれているので、いわゆる電子メールで使われている ISO-2022-JP と勘違いするケースがあるということでしょうか。*1

50420への変換

謎な CodePage 50420 がどういった文字列パターンが調べてみようと思い、Unicode(UTF-16LE)なファイルを用意して、wiconv でコンバートを試みたわけですが、案の定?、コンバートがサポートされていません。

C:\WICONV-0.2>wiconv.exe -f 1200 -t 50420 sample.txt > 50420.txt

Convert 1200 to 50420 is not supported.

Shift_JIS というか 932 からの変換も試してみましたがそちらもダメみたいですね。

どんなパターンになるのか謎ですが、とりあえずこのコードページを指定して検索かけると、検索結果の CodePage としてこまた謎な番号 50560 なんてので自動識別されてきます。そんな番号は一覧にもなかったりするわけで、なかなか面白い?ことになります。

そもそも、こんな謎な CodePage を指定して検索することが間違っている気がしますが・・・*2

*1:ISO-2022-JPは 50220 を指定することになります

*2:一応補足しておくと、EF6.10.2でこれを指定して実際に検索すると検索ヒットの表示で変な現象が発生するようです。適当にコードページを選択して検索するのは無しの方向で。

hasegawayosukehasegawayosuke 2008/05/15 00:39 Vista/IE7な環境ではレジストリにもMLang.DLL内にも50420というのは見つからないので、OSから取り出して…というのは考えにくいのですが…。