Hatena::ブログ(Diary)

あまつぶ@はてなダイアリー RSSフィード

あまつぶWikiあまつぶ過去ログMacソフトWinソフト掲示板
<カレンダー>
2003 | 09 | 10 | 11 | 12 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 03 | 04 | 05 | 06 | 07 | 09 | 11 |
2011 | 02 | 07 | 08 | 11 |
2012 | 04 | 11 |
2013 | 07 | 09 | 10 |
2014 | 11 |
2015 | 11 |

<< 2007/06 >>
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

<最近の見出し>




POPFile の Mac OS X(Panther/Tiger/Leopard/Snow Leopard/Lion/Mountain Lion/Mavericks/Yosemite)用インストーラをお探しの方は、POPFile プロジェクトのダウンロードページへ。
 | 

2007-06-25

amatubu2007-06-25

風林火山? 風林火山?を含むブックマーク

らしいです(何)

2007-06-19 続・分かち書きプログラムの違いによる精度比較

[]続・分かち書きプログラムの違いによる精度比較 続・分かち書きプログラムの違いによる精度比較を含むブックマーク

id:amatubu:20070524 で書いた精度比較の続き。

あるところをピークに精度が下がってしまっていることがやはり気になり、テストに使ったデータを調べてみたところ、元のデータ自体に分類が誤っているものが多数見つかった。POPFile のアーカイブ機能(受信したメール本体をアーカイブしておく機能)を使ってためておいたメールをテストデータとして使用したのだが、バケツを途中で増やした際にそれまでの受信したメールの分類を変更していなかったため、現在分類すべきバケツとは異なるバケツに部類されたままになっていたメールがあった。あるいは、分類ミスをしていたのに(私が)見逃してしまっていたものや、分類分けの判断にぶれがあったものなど。20,000 通あまりのメールのうち、200 通〜 300 通くらいは分類が正しくなかった。これをひとつひとつ確認して修正し、再度テストを行った。

テストしているうちにまだ分類ミスが見つかり、なかなか思うようにすすまない。1 回のテスト(分かち書きのプログラム 1 つあたり)で 3 時間くらいかかるので、何度もやり直しているとそれだけで膨大な時間がかかってしまう。テストしては修正、テストしては修正でなんとかほぼ正しそうなデータを作ることができた。

テストは何度も修正しながらだったので最終的な比較はまだできないものの、現在の最新の状態では、 22,340 通のメール(前回より数が減ったのは、本来今回のテストに使用したバケツ以外のバケツに分類されるべきメールが混じっていたので、混乱を避けるために取り除いたため)を分類させ、Kakasi 249 通、MeCab 269 通、simple 259 通の分類ミスであった(精度ではそれぞれ 98.89%、98.84%、98.80%)。精度はすべて 1% 以上あがり、差は縮まった。最も成績のよかった Kakasi と、最も悪かった MeCab の差はたった 0.09%。これはもう誤差だろう。しかも、形態素解析などいっさいしていない文字種による分割と Kakasi の差は 0.05% である。これは「もうこれで十分ではないか」と思える。

これは私の環境でのテスト結果であって、一般的にそうかどうかはわからない(比較的英文のメールが多いことも、差を縮める要因になっているかも知れないし)が、十分有用であることは確実だと思う。

詳細については、再度最終的なデータでテストを行い、後日書く予定(なんせ 3 種類のプログラムでテストすると 9 時間もかかるのだ……(汗))。

[][]0.22.5 へのバージョンアップ 0.22.5 へのバージョンアップを含むブックマーク

POPFile 停止(UI から)、アーカイブの内容を POPFile のプログラムフォルダへ unzip で展開、POPFile 起動(sudo /etc/init.d/popfile start)で完了。

結局、稼働時間は 322.92545393518518518518 日であった。ほぼ 323 日。

2007-06-18 POPFile 0.22.5 リリース!

[]POPFile 0.22.5 リリース! POPFile 0.22.5 リリース!を含むブックマーク

POPFile 0.22.5 がリリースされました。日本語での変更内容。→ダウンロード

今回のバージョンは細かい修正やバグフィックスを行ったマイナーバージョンアップだが、Windows 版のインストーラの改善などが行われている。

個人的に大きいと思っているのは、SSL モジュール関係の改善だ。ひとつは、認証の必要なプロキシ環境でも SSL モジュールがダウンロードできるようになったこと。これは日本語フォーラムで要望いただいたものを、改善方法も含めて本家に提案して実現したものだ。これはうれしかった。もうひとつは、ダウンロードされる SSL モジュールと POPFile の互換性が保たれるようにパッチをオンラインで提供するようになったことだ。これまでは、POPFile がリリースされたあとに SSL モジュールがバージョンアップしたことによって(POPFile がバージョンアップするまで)互換性が保たれなくなってしまうことがあった。今後は、パッチもオンラインで提供することになり、より素早い対応が可能となった。

日本語関係では、文字コード変換処理を変換が不要な場合はスキップすることによって若干の速度改善が行われた。日本語のメールでもヘッダ部分などの処理に効果があると思われる。全体から見れば数%の改善だが、できる改善はできる限りしていくという方針で。他は細かいバグ修正ばかりであるが、分類誤りにつながる可能性のあるものもあるため、重要性は高いと思う。

あとは、Windows Vista 関係でも改善がはかられているようだが、私は使用していないため詳細については不明。おそらく、スタートアップでの起動時にアクセス権がらみの警告が表示される問題等が改善されているのではないかと思うのだが。

細かいところでは、Message Capture utility のショートカットがスタートメニューに追加された。これは不具合が起こったときの対応等に役立ちそうだ。

[]今日のあまつぶむら39 今日のあまつぶむら39を含むブックマーク

トリケラトプスの化石をほしがっていた住人に化石をあげたら、「すごいゴッドハンドだね」とか言われた。黒い。

[]Battle for Wesnoth 1.2.5 リリース! Battle for Wesnoth 1.2.5 リリース!を含むブックマーク

Battle for Wesnoth もバージョンアップ。なんかバージョンアップラッシュだ(ってほどでもないか)。

メンテナンスリリースながら、日本語翻訳がひとつのシナリオを除いて 100% になっている久しぶりのバージョン。今回はバージョンアップに向けての string freeze 情報を見てから翻訳ファイルの更新に着手し、なんとか間に合わせることができた。

来週には 1.3.4 もリリース予定らしい。こちらは更新も早くてまだまだ追いつけていない。本体はユニット説明などを除いて、遊ぶのに支障となりそうなところは翻訳完了。シナリオは、チュートリアル(これはシナリオではないか)と、Heir to the Throne(王位継承者)と The South Guard(南部防衛隊)の翻訳が完了。開発バージョンについてはまだまだ変更も多いようなので、この辺りでいったん作業を中断して、1.4 が近くなった頃にまた作業開始する感じかな。

久しぶりに王位継承者の続きを遊んでみている。うまくなったのか難易度が低くなったのかわからないが、結構楽に進められた。捨て駒を使ったりとテクニック的には向上した部分もあるのかなぁとは思う。地形やユニットの配置とかも気にするようになったし。チュートリアルとか南部防衛隊とかでいろいろと教えてくれるのも結構役に立っているのかも。

ちなみに日本語フォント(さざなみゴシック)を追加でインストールしないと日本語が表示できないのは相変わらず。ちょっと面倒だが、ご勘弁を。

[][]TeraStation の方のバージョンアップは…… TeraStation の方のバージョンアップは……を含むブックマーク

今日は疲れたので明日かな。さっき届いた稼働情報によると、連続稼働時間 362 日と 16 時間ほどらしいので、POPFile の稼働時間は 352 日あたりと思われる。残念ながら(?)稼働 1 年は達成できない模様。これを気にファームウェアのバージョンアップをしようかなとも思うのだけど、今の環境が動かなくなってしまっても困るし、するとしたらそれは週末かな。

amatubuamatubu 2007/06/19 19:32 今日も同じこと言われた。正確には「すごいすごい!ちょっとしたゴッドハンドじゃん!」だった。

k-ryoshak-ryosha 2007/06/19 22:52 初心者ですみません。POPFile非常に重宝しているのですが、使い方へのたどり着き方がよく分かりません。新バージョンができて、それをダウンロードしたはいいものの、そこから先、どこに放り込んだらいいのでしょうか。

zakaizakai 2007/06/19 23:07 ゴッドハンド...そ、それは、西の都のアノ男!(笑)確かに黒いわー(^^;
今は借金返済のため、釣りと拾い物で過ごす日々です...。

amatubuamatubu 2007/06/19 23:44 > k-ryosha さん

どうも。
Mac OS X 版なら、ダウンロードしたファイルを展開して展開されたファイル(ディスクイメージ)を開くと中にインストーラ(POPFile-0.22.5ub.pkg)が入っていますので、それを実行すればインストールできます。
インストールが完了したら、新しいバージョンに更新されてますのでそれ以上することはありません。これまで通りお使いください。
(ダウンロードしたファイル自体は捨ててしまってもかまいません)

amatubuamatubu 2007/06/19 23:46 > zakai さん

でしょでしょ。これまででいちばん黒い台詞かも、と思いました(^^;
うちはフルーツを売りまくったりして一時期がんばっていましたが、今は化石を2、3売って少しずつ募金状態です。しかし化石より釣りの方が儲かりそうですね。

k-ryoshak-ryosha 2007/06/20 00:05 どもです。いんすとーらー? いや、フォルダ内にファイルがいくつか(.pmというのがいくつかと、リードミーと)展開されたのが出てきたので、ちょっと困ったのですが……

amatubuamatubu 2007/06/20 00:16 > k-ryosha さん

あれ? もしかして「クロスプラットフォーム版」をダウンロードされましたか? それでも動かないことはないですが、ちょっと面倒です。
Mac OS X 版は、
http://sourceforge.jp/projects/popfile/files/
の「POPFile-0.22.5ub.dmg.gz」をダウンロードしてみてください。これにインストーラが入ってます。

k-ryoshak-ryosha 2007/06/23 23:37 あ、できました。お手数かけました。

2007-06-13 ルートの無限入れ子クイズ

[]ルートの無限入れ子クイズ ルートの無限入れ子クイズを含むブックマーク

ルートの無限入れ子クイズを解いてみる。

  • とりあえず普通に

¥{a_n¥} は、問題より a_1=¥sqrt2,a_n=¥sqrt{2a_{n-1}} (n>2) という漸化式であらわすことができる。

次に、 a_1,a_2,a_3,... をそれぞれ計算して傾向を調べてみる。

a_1=¥sqrt2=2^{¥frac1 2},

a_2=¥sqrt{2¥sqrt2}=¥sqrt2¥sqrt{¥sqrt2}=¥sqrt2¥sqrt¥[4¥]2=2^{¥frac1 2}2^{¥frac 1 4}=2^{¥frac1 2+¥frac 1 4},

a_3=¥sqrt{2¥sqrt{2¥sqrt2}}=¥sqrt2¥sqrt{sqrt2}¥sqrt{¥sqrt{¥sqrt2}}= ¥sqrt2¥sqrt¥[4¥]2¥sqrt¥[8¥]2=2^{¥frac1 2}2^{¥frac1 4}2^{¥frac1 8}=2^{¥frac1 2+¥frac1 4+¥frac 1 8},

a_4=¥sqrt{2¥sqrt{2¥sqrt{2¥sqrt2}}}=¥sqrt2¥sqrt{sqrt2}¥sqrt{¥sqrt{¥sqrt2}}¥sqrt{¥sqrt{¥sqrt{¥sqrt2}}}= ¥sqrt2¥sqrt¥[4¥]2¥sqrt¥[8¥]2¥sqrt¥[16¥]2=2^{¥frac1 2}2^{¥frac1 4}2^{¥frac1 8}2^{¥frac1{16}}= 2^{¥frac1 2+¥frac1 4+¥frac1 8+¥frac1{16}}

であるから、一般に、

a_n=¥underbrace{¥sqrt{2¥sqrt{2¥sqrt{2¥sqrt{...¥sqrt2}}}}}_{n}= ¥sqrt2¥sqrt¥[4¥]2¥sqrt¥[8¥]2...¥sqrt¥[2^n¥]2=2^{¥frac1 2}2^{¥frac1 4}2^{¥frac1 8}...2^{¥frac1 {2^n}}=2^{¥frac1 2+¥frac1 4+¥frac1 8+...+¥frac1 {2^n}}=2^{1-¥frac1{2^n}}

と言えそうである。

上記の式が最初の漸化式を満たすことを検証する。

まず、

2^{1-¥frac1{2^1}}=2^{1-¥frac12}=2^{¥frac12}=¥sqrt2=a_1

で、満たしている。次に、

¥sqrt{2a_{n-1}}=¥sqrt2¥sqrt{2^{1-¥frac1{2^{n-1}}}}=¥sqrt2¥sqrt{2^{1-¥frac1{2^{n-1}}}}= 2^{¥frac12}¥({2^{1-¥frac1{2^{n-1}}}¥)^{¥frac12}=2^{¥frac12}{2^{¥(1-¥frac1{2^{n-1}}¥)¥frac12}= 2^{¥frac12}2^{¥frac12-¥frac1{2^n}}= 2^{¥frac12+¥frac12-¥frac1{2^n}}= 2^{1-¥frac1{2^n}}=a_n

で、こちらも満たしている。

したがって、 a_n の一般式は、 a_n=2^{1-¥frac1{2^n}} であることがわかった。

問題の ¥lim_{n¥to¥infty}a_n については、

¥lim_{n¥to¥infty}a_n=¥lim_{n¥to¥infty}2^{1-¥frac1 {2^n}}=2

となり、答えは 2 である。

  • 一瞬(?)で解く

ある正の値の収束すると仮定してもよい場合。

その値を a とする。

a^2=2¥sqrt{2¥sqrt{2¥sqrt{2¥sqrt2...}}}=2a

であり、 a>0 より両辺を a で割って、 a=2 が求められる。

「正の値」という条件でなければ、a が非 0 であることを証明しなければならず、これは案外面倒そう。最初「ある値に収束すると仮定してもよい場合」だと思い込んで、 a¥(a-2¥)=0 となったところではたと困ってしまった。

  • どんな値になりそうかを勘で考える

最初に作った漸化式を見ると、 a_n=¥sqrt{2a_{n-1}} となっているが、これは、 2a_{n-1} の相乗平均である。次々に 2 との相乗平均を計算していくということは、最初が 0 でない限りは、限りなく 2 に近づいていくと思われる。

収束した状態を考えれば a_¥infty=¥sqrt{2a_¥infty} であるから、これを解いて a_¥infty=2 と考えてもよさそうである。

2007-06-09 Battle for Wesnoth 近況

[]Battle for Wesnoth 近況 Battle for Wesnoth 近況を含むブックマーク

来週、1.2.5 という新しいバージョンがリリースされるらしいので、久しぶりにビルド&翻訳。一応、utbs のシナリオ以外は100% となった。他の方が訳されたシナリオで fuzzy になっている部分なども修正。話の流れがわかっていないのでニュアンスをつかむのが難しいなぁ。たまには他のシナリオも遊んでみないといけないな。

開発バージョンの方は、いつの間にか 1.3.3 までバージョンがあがっている。正式リリースまではまだかかるのだろうけれど、シナリオも増えているみたいだしそろそろ追いかけていかないといけないかな。とりあえずは本体、チュートリアル、httt、tsg あたりを翻訳していくつもり。1.2.x では公式シナリオから外れていた sotbe も復活しているみたいなのでそこもできたら。

[]poedit 不調 poedit 不調を含むブックマーク

Battle for Wesnoth の翻訳に使っていた poedit だけど、非常に調子が悪い。ファイルを開こうとすると、ダイアログが表示される前に落ちてしまう。最近開いたファイルの履歴から開けば一応大丈夫だけれど、そのあと少し作業しているとやはり落ちてしまう。うーむ……。

仕方がないので再び mi で作業中。未翻訳のところも fuzzy のところも検索で簡単に見つけられるからそれほど困ることもないが、やはり専用のソフトの方が元のシナリオファイルなんかを簡単に参照できる機能とかがついていて便利だ。なにか代わりになるソフトはないかな……?

2007-06-07 POPFile 0.22.5 RC4 が公開

[]POPFile 0.22.5 RC4 が公開 POPFile 0.22.5 RC4 が公開を含むブックマーク

POPFile の次のバージョン(0.22.5)のリリース候補版である、POPFile 0.22.5 RC4 が公開されたMac OS X 版(universal binary)も公開中)。特に問題がなければ、RC5 を経て正式リリースとなる見込み。

今回のバージョンは主にバグ修正などのメンテナンスリリースで、日本語関係の変更点は以下のとおり。

  • 処理速度の向上

文字コード変換処理で、変換不要な場合は処理をスキップすることによってパフォーマンスを向上。ヘッダ部分や英文で書かれたメールなど、文字コード変換が不要な場合に効果がある。

  • HTML エンティティが含まれている場合に正しく処理できないことがある問題を修正

HTML エンティティの中には、EUC-JP のコードと競合する文字に変換されるものがある。これらを無視することによって文字化けによる分類ミスを防ぐ。

  • キャラクタセットを 1 メール処理するごとにリセットするように修正

メールにキャラクタセットの指定がされていない場合、その前に処理したメールのキャラクタセットが使われるようになっていた。再使用しないように修正した。

  • Windows 環境で使用している際に 'uninitialized value' の警告が表示される問題を修正

コンソールを表示しているときにしか見ることのない警告だが、気になるので修正した。

  • バケツタブの単語表で、単語のリンクが URL エンコードされていない問題を修正

単語のリンクがエンコードされていなかったため、リンク切れになってしまっていた。

その他、Windows 版では含まれている Perl のバージョンアップや、ダウンロードされる SSL モジュールが POPFile と互換性のあるバージョンにダウングレードされるように修正されるなどの変更が行われている。

[]0.23 に向けて日本語関係で考えていること 0.23 に向けて日本語関係で考えていることを含むブックマーク

今回のバージョンでは見送ったが、次のメジャーバージョンアップには実現したいと思っていること。

  • Kakasi がなくても動くようにする

id:amatubu:20070524#p1 で書いたように、文字種による分割というシンプルな分かち書きでも高い精度が実現できることがわかったので、この機能を組み込みたい。MeCab については保留。

  • UI の履歴タブでの細かい文字化けを修正する

履歴の表示において、件名や宛先などが長い場合途中までが表示されるようになっているが、EUC-JP の 1 バイト目と 2 バイト目の間で切れてしまって文字化けしてしまっていることがある。細かいが、修正したい(手元では修正済み)。

CP932 への対応とか、マイナーなバグへの対応については微妙。あまり効果がなさそうなのと、副作用もありそうなので。

最近 Word 文書などの添付ファイルがついたメールを学習させたときに半角カタカナの「ハハハハ」というような単語が大量に登録されることを発見して何か対処した方がよいかどうか考え中。これもマイナーな問題と言えばマイナーな問題だけれど。本格的にやろうと思ったら Word 文書の中身を調べられるように……という話にもなりそうだけど、実際のところ Word 文書を添付した spam とかがあらわれない限りはあまり効果はなさそうだし。処理速度も含めて考えれば今の形で十分なような気もしてしまって。

2007-06-06 Camino 1.5

[]Camino 1.5 Camino 1.5を含むブックマーク

Camino 1.5 がリリースされた。RSS 対応とかいろいろ変わったみたい。

個人的には、ズームボタンの動きが変わってしまったのがちょっとなじめない。デュアルスクリーンになってから iBook 側のディスプレイでフルスクリーンにして使っていたのだけど、それがしにくくなってしまった。表示されているページにあわせて大きさが変わるみたいだけど、なんだか違和感が。

ブルースターブルースター 2007/06/06 23:16 ブルースターです。
Caminoですか。MacOSX専用に作られているブラウザですね。
自分は使った事がないので、使い心地などは分かりませんが、かなり使いやすいそうですね。
Firefoxなどと比べると拡張機能は少ないみたね。

P.S
来週の日曜日英検があります。
前回準2級落ちてしまいましたが、今回は何としてでも準2級受かりたいです。正直不安です・・・

では〜

amatubuamatubu 2007/06/07 21:11 > ブルースターさん

そうですね。Firefox に比べると拡張性は低いですが、その分シンプルで軽快ですよ。

英検がんばってくださいね。私もあまり偉そうなことは言えませんが、がんばっていれば結果はついてくると思います。

2007-06-05 今日のあまつぶむら38

[]今日のあまつぶむら38 今日のあまつぶむら38を含むブックマーク

虫の季節になったみたい。コンプリートへの道はまだ遠い。

ローン完済。長かった。これからは募金でもしてみますかね。

zakaizakai 2007/06/05 21:07 なぬーーーーーーーー、ローン完済が有るんですか!! こ、これは頑張らねば...(^^;

amatubuamatubu 2007/06/06 21:21 完済してしまいましたよ〜!
かなり長かったですが(^^;

2007-06-03 Gmail の未読が 11111 件だった

[]Gmail の未読が 11111 件だった Gmail の未読が 11111 件だったを含むブックマーク

たまたま見たときに「Inbox (11111)」だった。未読たまりすぎ。まあ、普通にメールクライアントでも読んでるので未読のままにしてあったり、メーリングリスト関係で未読のままだったりという感じなのだけど。

使用容量は 291MB と、いつの間にか 10% を超えていた。メールをためるようになってから 2 年と 5 ヶ月くらいだから、単純計算であと 21 年 9 ヶ月は大丈夫と。

[]Windows で使ってるソフト Windows で使ってるソフトを含むブックマーク

たまには何かに役に立つかもしれない情報とか。

  • ActivePerl

Perl がないと生きていけない。Ruby も気になるのだけど……。

  • MinGW + MSYS

なにかビルドしなければならないときのために。

  • NSIS

インストーラ作成ソフト。POPFile のパッチインストーラとか、Battle for Wesnoth のフォントインストーラとか作成のため。

  • MKEditor

テキストエディタ。タブ機能がお気に入り。

  • Devas

一括検索、置換ソフト。置き換え対象をチェックボックスでオン/オフできるので安心。

画像ビューワ。簡単な編集もできる。軽快だし、スライドショー機能なんかもあったり結構便利。一括サイズ変更とかも。

  • Namery

ファイル名一括変更ソフト。ファイル名を連番にしたり、拡張子を変更したり。これも変更対象をチェックボックスでオン/オフできるのがポイント。

  • AlphaCalc

計算式を入力する形式の計算機。電卓よりも安心感がある。

  • CmdSpace

Alt+Space で日本語入力を切り替えられるソフト。一度入れたら手放せない。

  • F1ブレイカー

F1 でヘルプ呼び出しを無効にしてくれるソフト。Excel とかで F2 と間違って F1 を押してしまって不幸になることが防げる。

ファイルの内容を比較するソフト。見やすい。

あとは、ブラウザに Grani、ウィルス対策ソフトに avast!、遠隔操作に UltraVNC とかを使用。

[]iTunes Plus 504 エラー頻発のその後 iTunes Plus 504 エラー頻発のその後を含むブックマーク

昨日再挑戦してみたらようやくダウンロードできた。途中で止まってしまっていたものも無事。やはり単純に混んでいただけだったのか。

 | 
468737