Hatena::ブログ(Diary)

GANAwareはてな版 RSSフィード Twitter

2010-02-13

Python 2.7a Unicode → CP932 Patch

http://dl.dropbox.com/u/1340991/cp932_roundtrip/Python-2.7a3-cp932-patch.txt

Python 2.7a3 用に、UNICODE → CP932 の変換時に Windows とは異なる文字へ変換される部分を Windows と一致させるパッチを作ってみました。

Python は昔から PyJUG の ML日本語関連のパッチが作られていたりしているので、未だに CP932 の変換表が Windows とは異なっているのは何か理由があるような気がするのですが、MLログを眺めてもよくわかりません。

パッチML に投げるべきなのかどうか?

(2/22 追記)

http://dl.dropbox.com/u/1340991/cp932_roundtrip/Python-2.7a3-cp932-patch2.txt

Unicode ⇒ CP932 で、Javaglibc が行う変換と互換になるようにいくつか文字を追加したパッチ*1

(2/22 追記2)

報告してみた。 http://bugs.python.org/issue7983

*1:この変換表を作るのは結構めんどくさい...

Connection: close