Hatena::ブログ(Diary)

あまつぶ@はてなダイアリー RSSフィード

あまつぶWikiあまつぶ過去ログMacソフトWinソフト掲示板
<カレンダー>
2003 | 09 | 10 | 11 | 12 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 03 | 04 | 05 | 06 | 07 | 09 | 11 |
2011 | 02 | 07 | 08 | 11 |
2012 | 04 | 11 |
2013 | 07 | 09 | 10 |
2014 | 11 |
2015 | 11 |

<< 2007/05 >>
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

<最近の見出し>




POPFile の Mac OS X(Panther/Tiger/Leopard/Snow Leopard/Lion/Mountain Lion/Mavericks/Yosemite)用インストーラをお探しの方は、POPFile プロジェクトのダウンロードページへ。
 | 

2007-05-31 iTunes Plus 重すぎ……

[]iTunes Plus 重すぎ…… iTunes Plus 重すぎ……を含むブックマーク

アップグレードできるアルバムと曲があったので試してみたのだけど、ダウンロードがほとんど進まない。しかもエラー 504 で止まってしまう。サービス開始で混んでいるのだろうか……?

全然終わる気配なし。このままでは、ダウンロードしながら寝るという、ISDN 時代に逆戻りみたいなことをしなければならないのか。。。「起きたらエラーで止まってた」なんて落ちになりそうで嫌だけど。

amatubuamatubu 2007/06/01 06:59 うわ、ほんとに終わってない!(汗)
停止して再開したら何曲かダウンロードできたけどまた止まってしまった。途中で止まってしまったらはまってしまうというパターンなんだろうか。
アップグレードした場合、元のファイルは自動的にゴミ箱に移動されるらしい。ちゃんとアップグレードできているか確認できたら捨ててかまわないよってことなのかな。

2007-05-24 分かち書きプログラムの違いによる精度比較

精度のグラフ

[]分かち書きプログラムの違いによる精度比較 分かち書きプログラムの違いによる精度比較を含むブックマーク

以前からそのうちしようしようと思っていた比較にようやく挑戦。データとテストプログラムを用意するのに手間取ってなかなかできていなかった。

昨晩 POPFile Documentation Project を久しぶりに少しメンテナンスしていたところ、xmltraintest.py というプログラムを発見した。プロジェクトのメンバーである Joseph が TOE と TA の比較のために作った Python のスクリプトだ。少し見てみたところ、今回のテストにも使えそうなな感じだ。ただ、ドキュメントにも書かれているように POPFile 0.22.4 のアーカイブには対応していないのでスクリプトを少し編集する必要があった。

データは、POPFile のアーカイブ機能(受信したメールをバケツごとにフォルダにわけて保存しておく機能)を使って保存しておいたものが使えるようなので、それを使うことにする。そのうち何かに使うかもしれないと溜め込んであったのだ。アーカイブのうち、ひとつのバケツには 20,000 通あまりのメールがあり、これはあまりにも多すぎるだろうということでそのバケツを除いた 17 のバケツに分類された 22,351 通のメールをサンプルとして用いた。

テストは何も学習していない状態から、サンプルのメールを順に分類させ、分類が誤っていれば(あるいは分類できなければ)再分類していくという流れ。まず 0.22.5RC3 で Kakasi のテストを行い、0.22.4 に日本語パッチをあてたもので MeCab と文字種による分割(以下 simple と表記)をテストした。バージョンは異なるが、メールの分析部分での変更は行われていないので影響はないはずである。

事前の予想では、MeCab が一番精度が高く、次いで Kakasi、simple の順になるのだろうと漠然と考えていたのだが、結果は思っていたのとは違い、Kakasi(21,833 通を正しく分類。精度 97.68%)、MeCab(21,817 通を正しく分類。精度 97.61%)、simple(21,794 通を正しく分類。精度 97.51%) の順となった。なぜこのような順番になったのかはわからないが、分かち書き後の POPFile の分析部分との相性なのかもしれない。あるいは、MeCab を使った場合のコーパスが他の 2 つよりも若干小さかったことから、ひらがな 1 文字の助詞や助動詞が分かち書きの際に正しく分割されて分類に利用されなかったことなどが関係しているのかもしれない。

しかし実際には、差があると言っても、最も高かった Kakasi と最も低かった simple で 0.17% しか差がなかった(10,000 通あたりで 17 通)。これを小さな差と見るか大きな差と見るかは意見が分かれるところかもしれないけれど、文字種だけで分割するという非常にシンプルな方法と、辞書を使った本格的な分かち書きとで 0.17% の差というのは小さいと思う(10,000 通あたり 17 通を余計に再分類しなければならないと思うとちょっと面倒だが)。速度面で有利なことや、辞書やプログラムが不要なことを考えれば有効だ。これはぜひとも次のバージョンで選択できるようにしたい。

グラフを見ると、POPFile の学習速度もよくわかる。300 通(24 通再分類)で 90%、900 通(44 通を再分類)で 95%、5,700 通(141 通を再分類)で 97.5% の精度を達成している。バケツ数が 17 もあることを考えれば十分速いのではないだろうか。

グラフでもうひとつ気になるのは、あるところをピークに徐々に精度が下がっているように見えることだ。13,500 通(271 通を再分類。精度 97.99%)がピークで、そこからだんだん下がってしまっている。単に今回のデータの特徴なのかもしれないが、ちょっと気になる。コーパスが大きくなったことによる弊害なのだろうか……?

(追記:だんだん精度が下がってしまっていたのはテストに使ったデータの精度が低かったためだった。データを精査して再度テストした結果は、id:amatubu:20070702 に掲載)

2007-05-07 2007盛岡

御所湖地図2

[]2007盛岡 2007盛岡を含むブックマーク

id:zakai 氏といつもの盛岡行き。

  • 初日(5/2〜5/3)

伊勢道〜東名阪〜湾岸道〜東海環状〜中央道〜長野道〜上信越道〜北陸道〜磐越道〜東北道というルートで盛岡を目指す。天気もよく(長野あたりではちょっと霧っぽかったこともあったが)、渋滞もほとんどなくスムーズ。盛岡も思ったほど寒くなくてよかった。というか日が当たっていると暑いくらい。

紫波SAで id:crossingpoint 氏(以下 KAZE 氏)と合流。zakai 氏はそこから北海道へ。盛岡に着いてからはなぜか側溝の発掘作業(?)の見学やら雑談やらでだらだらと過ごす。こういう過ごし方も旅ならでは。その後は食事と風呂で終了。風呂は最近できたという喜盛の湯(名前が思い出せなくて geko のウェイポイント名を調べたのは内緒だ)というところ。休日は680円とちょっと高めだが、快適だった。夜は KAZE 氏の事務所にお邪魔に。3 時くらいまであれこれとしゃべりながら過ごした。

  • 2 日目(5/4)

自転車を借りて朝から市内を散策。地図を持っていないので ALPSLAB でミニ地図帳を作成して印刷してもらった。ポケットに入れておいても邪魔にならない大きさで、自転車で移動するにはちょうどよさそうな感じ(結果的には地図の範囲外まで移動してしまったこともあってあまり使わなかったけれど)。これと geko があればどこへでもいけそうだ。geko が固定できないのでどうしようかと思ったのだけれど、胸ポケットに入れてアンテナが上を向くように調整したらうまいこと測位できた。これで準備は万端。

さてどこへ行ったものか。そういえば昨日、地図を見ながら御所湖の話をしたのを思い出し、サイクリングロードを探しつつとりあえず西へと向かう。10km くらいらしいから、時速 10km でも 1 時間。時間はたっぷりあるし、遅くても昼前にはたどり着けるだろう。久しぶりの長距離(ってほどでもないけれど)移動だし、まだ身体も起きていないのでゆっくりマイペースで移動する。印刷してもらった地図には御所湖までは載っていなかったのだが、以前登録したポイントもあるし、きっと近くまでいけば表示も出ているだろうから何とかなるはずだ。

朝はまだ肌寒いくらいの気温だったが、走っているうちに背中に日の光も浴びてだんだん暑くなってきた。上着を脱いで身軽に。暑くもなく、寒くもなく、いい感じの気候だ。

ダムの手前に結構な坂があった。これがちょっと難関。以前は車で来たのであまり覚えていなかったらしい。苦労してなんとかのぼる。御所湖には、カヌーの練習をしているらしい人たちがたくさんいた。途中、体験できるようなことも書いてあったけれど、今回(って次回があるのかどうか知らないけど)はパス。このあたりはちょっと見覚えがあるような。

そういえばどこまでいくか考えていなかった。ここまでかかった時間や疲れなどを考えるとまだしばらくはいけそう。ちょっと休憩したところで御所湖全体の地図を見ることができたので、まずは目標を御所湖一周に設定。半周くらいのところで昼になるだろうから、そこで食べるために、とコンビニで食料を調達。湖沿いは、だいたい道の湖側に自転車も通れる歩道が作ってあって快適に走ることができた。走るのに慣れてきてペースもあがっていたかもしれない。

ちょうどを半周したあたりのところで、旅行者らしい人から道を聞かれた。が、残念ながら私は地元の人間ではないのだ。「すみません、地元の者ではないので……」とお断りしたが、荷物もほとんどなく自転車に乗っている姿を見れば、「どこが地元の人間でないのだ」と思われたかもしれない。

半周をちょっとすぎた(改めて地図で見ると 2/3 くらいのところかな)野菊公園というあたりで昼食。遊歩道があるということなのでそこをしばらく歩いて……と思ったのだけれど、自転車を置いて歩くとまた戻ってこなくてはいけない。あまり遠くまで歩く訳にもいかず、適当なところで昼食となった。その帰り、遊歩道に蛇が横たわっていてかなりびっくりした。行きには気がつかなかったが、景色を見ているうちに通り過ぎたのだろうか……?

遊歩道を歩いた先に桜並木があるらしいので、その方向に自転車で走ってみることにした。ちょっと寄り道だが、自転車でならそれほど時間はかからないはずだ。が、走ってみたら、並行して走っているはずの遊歩道をあっさり見失う。おそらく途中で違う道に移らないといけなかったのだと思うが、まったく気がつかなかった。しかも、走っているうちに突然雨が降ってきた。

天気予報では、この 3 日間は晴れの予報だった。現に、朝からいい天気だったし。結構山の方に来たせいかなどと思いつつ、雨をしのげる場所を探す。幸い、少し走ったところで「雫石駅」という標識を見つけ、そちらに向かって走る。が、次に見た標識(看板?)は「雫石銀河ステーション」。えーっと、それって駅のことですかね。ちょっと不安になりつつも、雨もひどいことだしとりあえずその方向へ。無事駅に着くことができた。駅には「銀河ステーション」の表示。うーん、それはいいけれど、標識は誰にでもわかるように作ってほしいものが……。

駅前には「雫石名物よしゃれそば」という非常に気になる名前のお店があった。昼食後でなければ寄ったのになぁ。これもまた次回(?)のお楽しみ。しばらく駅にいたが雨はやみそうになく、少し小降りになったところで再出発。雨となるとあまりゆっくりもしていられない。できるだけ早く市内に戻らなくては。ほどなくして雨はやんだが、空ははっきりしない。降ったりやんだりの天気になりそうだ。

行きに地図を見たときに湖の北側に植物園(尾入野湿生植物園)があるということだったので、そこは寄っておきたかった。植物園というくらいだから人がいていくらかかかるのかと思ったのだけれど、群生地らしきところを区画整理して歩けるようにした、という感じだった。ちょっと季節が早すぎてほとんど花が咲いていない状態だったけれど、今月末か来月くらいになれば結構きれいそうだ。お金もいらないし。

そこから少し行ったところに、曲り屋という昔の建物があった。馬と同じ建物の中で生活できる構造になっていたんだとか。なるほどな〜と思っているとまた雨が降ってきた。建物の中に入れるようなので、ちょっと雨宿りをさせてもらう。

さて、もうすぐ一周だ。違う道を通ってまっすぐ帰るか、ダムを見ていくかちょっと迷ったのだけれどせっかくここまで来たのでダムに寄っていくことにした。ダムの上には人の姿が見えるものの、入り口には車止め。自転車で入ってもよいのかどうかわからなかったが、車止めの脇を通って入っていく人がいたので、私も入らせてもらった。ちょうど放水しているダムの上を通り、元来た道に戻った。

そこからはできるだけ無駄がないようにまっすぐ市内へ戻る。岩手公園で桜を見(しだれ桜がちょうど見頃だった)、それから過去にポイントした地点を巡ったり、今頃見つけたサイクリングロードを走ったり。気がつけばもう 5 時を回っている。 KAZE 氏と合流し、近所のスーパーで購入した総菜で夕食。

今日走ったログをカシミール 3D に取り込んで距離を測ってもらったら、なんと 79km 弱。ログが途切れているところもあったのでおそらく 80km くらいは走った(&歩いた)のだろう。50km くらいかなと思っていたのに、見事にはずれだった。久しぶりに走った割にはそれほど身体が痛いということもなくてよかった(両手の肘から下の筋肉が痛かったが)。まだ結構走れるのかもしれない。やられたのはいつの間にか顔と手を日焼けしていたこと。手は結構赤くなっていて痛い。5 月とはいえ、日差しは強かったようだ。

疲れていて風呂に行く気力もなく、そのまま KAZE 氏宅でぐったり。あまつぶむらの花に水をやったくらいで今日は終了。ちなみに右上の地図は、ProAtlasX2 にログを取り込んだもの(御所湖近辺)。パソコンとつなぐケーブルが見つからず、geko→Palm Vx(GPilotS)→iBookHotSync でデータベース取り出し)→Palm T|X(HotSync)→iBook(GPilotS の Host mode で Bluetooth 経由で ProAtlasX2 の GPS データ通信機能で取り込み)という複雑な流れでの取り込みとなってしまった。もっと楽にならないものかなぁ(ケーブルを探すか買ってくればすむのだけど)。

  • 3 日目(5/5〜5/6)

雨。寝ている間から雨や雷の音がするなぁと思っていた(というか何回か音で起きた)のだけど、朝になっても相変わらず雨。連休中は天気が良いと言っていた天気予報はなんだったのだろう。雨が昨日でなくてよかったが、まいったなぁ。

雨と疲れのせいでぐったりした気分だが、とりあえずは風呂だ。朝早くから開いていた記憶がある、百万石まで車で送ってもらう。朝から温泉。贅沢だなぁ。日焼けした手の甲はかなり痛くて湯船にはつけられなかったけれど。

風呂に入ってちょっと回復。次は飯。昨日気になったよしゃれそばのお店へ向かうが、お休み(じゃなくて開店前だったんだっけ?)。仕方なく市内へ戻って KAZE 氏おすすめのお店へ向かうも、お休み。結局 KAZE 氏宅近くに新しくできたスーパー(だっけ?)に入り、店内のパン屋で食事。結構よかった。

雨はまだ降ったり止んだり。あまり遠くまでいく気力もないので、近場の子ども科学館へ。昨日も(自転車で)前を通っていてちょっと気になっていたのもあって。KAZE 氏によると、中の展示物のほとんどは十数年前と変わっていなかったそうだ。それでも、大人になってから見ると逆に不思議に思えたりして(子どもの頃は純粋に見てしまうからかも)おもしろかった。驚いたのは AIBO がいたこと。こういうところでの需要があったんだなぁ。

その後もそのあたりでぶらぶら。すぐ近くにある遺跡の学び館にも行ってみた。ここについてから気がついたのだけど、科学館で共通入館券というのを買えば少し安くなったらしい。まあ、最初からそういうつもりではなかったのだから仕方ないけど。で、こちらも結構おもしろかった。土器とか大量に。「どうやってこれとこれがつながるってわかるんだ?」なんて話しつつぶらぶらと見学。これもあとからわかったのだけど、施錠したあった保管展示室も受付でお願いすれば入れてもらえたらしい。ガラス張りになっていて大量の土器やらが見えていたのでかなり気になっていたのだけど、残念。

(まだ続く)

[]掲示板 spam は相変わらず続く 掲示板 spam は相変わらず続くを含むブックマーク

終わらないなぁ……。

連休前に何件かやられたので気にはなっていたのだけれど、旅行中にますますひどくやられてしまった。しかも、名前と本文がまったく同じ、「coloradvbn」という書き込み。その前は「pablopicasso」。パブロピカソ?? 一体何がしたいのやら。

試しにこの名前で検索してみると、あちこちの掲示板やブログに書き込んでいることがわかる。そしていずれも URL が大量に貼付けられている。うちは URL が入力されたらはじくようにしているので、URL があれば書き込みできない。それで本文=名前という無意味な嫌がらせ書き込みを行ったのだろうか……?

URL が書き込まれるよりはましだが、これはうっとうしい。今回のケースでは、本文=名前という大変わかりやすい特徴があるので、本文=名前では書き込めないように制限をかけた(かなりむなしい制限だが)。それから、本文がアルファベットと空白、引用符のみで構成されている場合は書き込めないようにした。普通の文章ならカンマやピリオド、改行なんかが含まれているはずだから大丈夫なはず……。さて、これでうまくいくかどうか。

KAZEKAZE 2007/05/08 07:46  いやー、本当にお疲れ様でした。改めてログを見直すと凄い走ってますね(笑)。盛岡の友人に見せたらかなり驚いてましたよ、走りすぎだって(^-^;)
 またおいで下さいませ。そして「よしゃれそば」食いに行きましょう。

amatubuamatubu 2007/05/08 21:06 >KAZE さん

確かに走りましたね〜。
おそらく、土地勘がないから距離感覚がわからなかったってのもあるんだと思います。最初から「80km〜」とか思ったら走れなかったですよ(笑)
ういー、ぜひいきましょう!

zakaizakai 2007/05/08 21:18 連日お疲れさまでした、今年も無事お付き合いいただき本当にありがとうございました。
盛岡も変化が著しいですから、次回は盛岡でダラダラ過ごすのも良いかも知れませんね。今後もよろしくお願いします!!

amatubuamatubu 2007/05/08 23:07 > zakai さん

おつかれさまでした〜。そしてこちらこそありがとうございました。
そうですね。ゆっくり過ごすのもよさそうです。私はまた自転車で旅行したくなってきましたよ(笑)

ブルースターブルースター 2007/05/27 00:22 こんにちは、ブルースターです。
今更こんなこというのも遅いですが、旅行は楽しかったでしょうか?
自分も今年の10月に修学旅行に行きます。場所は確か長崎と広島だと思います。

2日目の自転車旅行1日で80キロ結構走りましたね。
雨が降ってしまったのは残念ですが。

アホな考えが浮かび上がったのですが、「タクシー」旅行っていうものもどうでしょうか?
自転車の代わりにタクシーで旅行するという形で。

何がともあれ、Kaze・zakai・Amatubuさん旅行お疲れさまでした。

それでは

amatubuamatubu 2007/06/03 12:37 > ブルースターさん

楽しかったですよ。リフレッシュできましたし。
修学旅行ですか。楽しんできてくださいね。
長崎っていうと私がまだ上陸(?)したことがない唯一の県ですね。どんなところなのか気にはなっているのですが。

雨はそれほどひどかった訳ではないので、今思えばよかった
かなとも思っています。
タクシーはお金がかかりすぎてつらいでしょうね。
自転車のいいところは、お金がなくても時間と体力さえあればどこへでも行けることですから(笑)

 | 
470415