適当なとこからウェブページをダウンロードして、とりあえず全部 UTF-8 にしてローカルに保存してある。
で、それを
def parser = new XmlSlurper(new SAXParser()) def page = parser.parse(file_path)
でパースすると化ける。
ちょっとよく分からないけどmeta要素のcharset指定を見てる?
よく分からないけど次のようにすると良いっぽい。
def page = parser.parse(new File(file_path).newReader("UTF-8"))