単語の読みまで推定してくれるテキスト解析ツール KyTea
ひとまず試してみた。
以下の環境はSnow Leopardです。
wget 'http://www.phontron.com/kytea/download/kytea-0.1.0.tar.gz' tar xvfz kytea-0.1.0.tar.gz cd kytea-0.1.0/ ./configure make sudo make install
make uninstallで削除も可能。
echo "原理は単純を構造は複雑を極め人は最も人らしく" | kytea -out part 2> /dev/null 原-理/げんり|は/は|単-純/たんじゅん|を/を|構-造/こうぞう|は/は|複-雑/ふくざつ|を/を|極-め/きわめ|人/ひと|は/は|最-も/もっとも|人/ひと|ら-し-く echo "2chダウン問題で、データセンター運営企業はFBIに資料提出したことを明らかにした。" | kytea 2> /dev/null 2/UNK ch/UNK ダウン/だうん 問題/もんだい で/で 、/、 データ/でーた センター/せんたー 運営/うんえい 企業/きぎょう は/は FBI/UNK に/に 資料/しりょう 提出/ていしゅつ し/し た/た こと/こと を/を 明らか/あきらか に/に し/し た/た 。/ echo "攻殻機動隊" | kytea 2> /dev/null 攻殻/こうかく 機動/きどう 隊/たい
ニコニコ動画のAPIがバグってる件
Nearchで取得してるデータが激しくオカシイので調査中。
再生数が突如として減っております。
・http://www.nearch.jp/watch/sm6217066/counter
カウンタは以下のAPIからデータ取得してるので目視監視してたら、実際に変な値が出てきた。
・http://www.nicovideo.jp/api/getthumbinfo/sm6217066
うーうーうー。
追記
環境、経路問題を疑って友人に試して貰っても同じような現象が起こるよう。
再生数が減るというより、再生55402というデータがリロードしてると時々でるみたいな。
追記3
駄目だったー。
・http://www.nearch.jp/watch/sm6231060/counter
・http://www.nicovideo.jp/api/getthumbinfo/sm6231060
追記4
webの1台のmemcachedにうまいこと値が入っていなくてなってたみたいです。んで、さっきは手動で1個更新してもらったんですけれど、まだあるっぽかったので、再起動させて全更新しておきました。
http://twitter.com/eigo_s/statuses/1245333394
直して頂けたようです。ありがとうございます。
明らかに変なデータをそのまま保存するNearchも問題だなぁ・・・。
気まぐれにデザインを変更
リキッドなデザインに変更しました。
「コード貼り付けるには、こっちの方が良いかなー」という意図。
本文が見難いような気もするけど、とりあえず。
ニコニコ動画プレミアムキャンペーンに当選した
チャンネル、コミュ動画の情報がAPIから取得できない件
困ったのでメモ。
ニコニコ動画の表示と情報取得してるアプリがずれてしまう。
・ http://www.nicovideo.jp/api/getthumbinfo/so5483604
・ http://www.nicovideo.jp/api/getthumbinfo/1228705664
制限してる意図もわからんのだけど。
久しぶりにNearch関係
・DBサーバ入れ替え。速くなったような、ならないような。
・推移、新着監視がなくなったので、そのあたりのバッチを停止。新着監視は自力で強化しようか。
・昨夜に発生した動画情報が更新されない障害の原因部分を修正。
与謝野氏が消費税「3年内に23%上げ」 by Googleニュース
画像はGoogleニュースのキャプ。
以下は該当記事。
現行5%の消費税を「3年以内に2─3%上げる。その道筋をつける。
http://jp.reuters.com/article/businessNews/idJPJAPAN-33707520080911
見事にGoogleニュースに釣られた。ハイフンは取り除かれるのな。