Hatena::ブログ(Diary)

shouhの日記

2016-01-16

Microsoft IME(2010) のシステム辞書をテキストで開く試み(失敗)

動機

「きごう」で変換するとたくさんの記号が出てくる。こいつらをリストアップしたい。「きごう」の変換データはシステム辞書として登録されてるものだから、システム辞書の中身を取り出せればいけるはず。だから取り出したい。

結果

取り出すことはできませんでした。

以下、試したことなどをつらつら書いておきます。

試す前に 登場人物

システム辞書:
主要な単語が何千何万と登録された、IME に元々搭載されている辞書。辞書ファイルの実体は C:\Windows\IME\IMEJP10\DICTS あたりに保存されているが、.dic ファイルというバイナリファイルであるため、テキストエディタでは開けない(開いても内容が読み取れない)。

ユーザ辞書:
利用者が登録した単語。必要に応じて自由に追加、編集ができたり、テキストファイルにエクスポートすることができる。実体がどこにあるかは知らないが、エクスポートすれば手に入るので問題無い。テキストファイルなので、もちろんテキストエディタで開ける。

試したこと1 辞書ツールを使う

IME には辞書ツールというツールがあり、ユーザ辞書の登録やエクスポートはここから行うようになっている。辞書を扱う機能だから、システム辞書も扱えるのではないかと考えた。

具体的には、辞書ツールでユーザ辞書のデータをテキストファイルとしてエクスポートできることを利用する。つまりシステム辞書をユーザ辞書のデータとしてインポートできればよいのだ。

幸いにも「システム辞書からインポートする」みたいな機能があるので、試しに使ってみたのだが、エラーが出た。

Microsoft IME 辞書からの登録

指定されたファイルは Microsoft IME のシステム辞書です。オープンすることはできません。

ふええ。

試したこと2 何とかオープンさせたい

調べてみると、システム辞書ファイル(何とか.dic)をバイナリエディタで開き、所定の位置をいじることで、オープンできるようになるらしい。

しかし、いずれも IME2002 の方法であり、IME2010 には当てはまらなかった(バイナリ構造が根本から違っていた)。