|
|
||
ruby, programming | |
text2vec() 関数はこんな感じ?
$KCODE="u"
require 'rexml/document'
require 'open-uri'
def text2vec(text)
appid = 'YahooAPIのappid'
uri = 'http://jlp.yahooapis.jp/MAService/V1/parse'
result = {}
body = open("#{uri}?appid=#{appid}&results=uniq&sentence="+URI.encode("#{text}"))
doc = REXML::Document.new(body).elements['ResultSet/uniq_result/word_list/']
doc.elements.each('word') { |item|
case item.elements['pos'].text
when '名詞', '動詞', '形容詞', '副詞'
result[item.elements['surface'].text] = item.elements['count'].text.to_i
end
}
result
end
続きは後で。
Windows7が悪いのか64bit版なのが悪いのかわからないけど、configure中に刺さったりファイルのパーミッションがいつの間にか000になったり不便すぎた。
こんなときこそ Windows7 Professional の売りであるところのXPモードだろう、と思って使ってみた。VirtualPCとXPモードのイメージをマイクロソフトのサイトからダウンロードしてインスコして、Cygwin入れたらふつうに動いた。
不便な点としては、せっかくVirtualBox上に入れたUbuntu64が同時に動かないこと。VirtualPCは32ビットモードしかないみたいなのでVirtualPCに統一するわけにもいかないし…
programming, c++ | |
いろいろテーブルルックアップを最適化した。C記述ではたぶんこれ以上は劇的に速くはならないと思う。テーブル引きとXORの単なる繰り返しになっちゃいました。
programming, c++ | |
なんとなく書いてみたSHA1とSHA256のコードをコミットしてみました。SHA1だけのバージョンは夏に上げてたんだけど、SHA256が必要になったので対応したタイミングで昨日再び上げたのでした。