人類みんなごくつぶし

2013-01-13

Java7では"・"が使えない

テストケースなどのメソッド名で使ってるとエラーになる

http://johtani.jugem.jp/?eid=73

Java6ではUnicodeのバージョンが4.0です。Java7ではUnicodeのバージョンが6.0に変更されています。

今回の問題は「・」(0x30FB)の文字列のCharacter.getType()がCONNECTOR_PUNCTUATIONからOTHER_PUNCTUATIONに変更されたのが原因です。(この変更自体はUnicode 4.1で変更されたみたい)

カタカナ文字種の判別をlucene-gosenのnet.java.sen.tokenizers.ja.JapaneseTokenizerのgetCharClass(char c)メソッドで行なっています。

トラックバック - http://d.hatena.ne.jp/muimy/20130113/p2
リンク元