Hatena::ブログ(Diary)

ny23の日記 このページをアンテナに追加 RSSフィード

2010-05-31 autopager を電子書籍で実装する

パラパラからスルスルへ

|  パラパラからスルスルへを含むブックマーク  パラパラからスルスルへのブックマークコメント

技術と利便性は相関せずを読んでいて思ったが,電子書籍をブラウザ上で表示すれば,一応,autopager でスラスラ読める.しかしそもそも,Web ページでもテキストが離散的にチャンクされているのは何故なのだろうか.通信単位の問題だろうか.動画ではストリーミングがあるのだから,テキスト文書でもできて然るべきだが,それが無いのは結局読むスピードを手がかりなしで最適化する方法がないから,という理由になるだろうか(ブラウザの自動ページ送りなんかを使ってみると,自分の読むスピードが一定でないのがよく分かるし,連続的にスクロールされると動体視力的にも辛い).あるいは,表示するディスプレイの単位の制約にまだ縛られているということだろうか.

漫画の様に,物理的な制限に強く縛られて構成(表示単位)が決まっているものは,しょうがないが,論文のようなテキストなら表示単位(一行)が物理的に小さいのでもっと細かい粒度で表示・移動できて良いはずだ(そうすると,果たして一画面中に見えて欲しい範囲というのはどれぐらいだろうか?).adobe acrobat は連続的な表示ができるので,論文を読むには便利だけど,一般的な2カラムの論文なら,tofu のような viewer の方がありがたい(数式が表示されないので,残念ながら使えないが).

結局どこかで物理的な制約に縛られているということなのだろうなぁ.autopager はそういう意味で,ページの単位と個人個人の読むスピードのズレを吸収する優れた UI だと思う(無かった時代にはもう戻れない).

2010-05-29 後はコップかな

念願のコーヒーバネットを手に入れたぞ

|  念願のコーヒーバネットを手に入れたぞを含むブックマーク  念願のコーヒーバネットを手に入れたぞのブックマークコメント

送料無料の店を見つけたので,念願のユニフレームのコーヒーバネットcuteを購入した.コーノ式より少しまろやかになる感じ.緩やかに注ぐのが良さそう.付属のバネットケースに,ペーパーフィルタも入れられるので,後は豆を容れる容器と,カップをどうするか.バネットは,実測でバネット本体が 42g, バネットケースが 10g と軽いので,他も軽量に済ませたい.ちなみに,ポーレックスのセラミックミルは 265g.重さはともかくサイズは最軽量クラスだと思う.

海外で入れたてのコーヒーを飲むパターンは以下の二つ.なお,熱湯に関してはホテルや学会会場で手に入れられることを仮定.

  • ミルを持参し,豆も持参する,あるいは現地で購入して挽いて飲む.
  • 挽いた豆を持参する,あるいは現地で挽いた豆を購入して飲む.

ミルは重いので二つ目の選択肢の方が現実的だが,どうせなら前者でいれたいところ.豆を持参する場合はフィルムケース等に入れるか,袋に詰めてミル・あるいはカップに入れておくかどちらかかな.

軽量チタンカップ

|  軽量チタンカップを含むブックマーク  軽量チタンカップのブックマークコメント

後は,カップだけど,ホテルに仮にあったとしても,ポット代わりに使う選択肢を残しておきたいので,カップは持参したいところ.ミルが重い分,軽いカップが良いということで,軽量チタンカップを探してみた.

この辺りかな.バッグの容量が 11L なことを考えると,外にカラビナ等で引っ掛けられるのが良い.とすると,持ち手が閉じてるタイプじゃないとだめだなぁ.

2010-05-28 取り敢えず一安心

(第一著者として)論文アクセプト

|  (第一著者として)論文アクセプトを含むブックマーク  (第一著者として)論文アクセプトのブックマークコメント

さっきメールをチェックしたら採否の通知が来ておった (5/29; 05:16).共著の論文が通った会議にギリギリで間に合わなかった自分の論文は,無事もう一つのトップ会議で日の目を見ることとなりました.Recommendation は 5-5-4 なので,(今度こそ?)ほぼ満点かな (違うかも.こんなに簡単に 5 がもらえるはずはない).oral なので,158/815 (19%) となかなかの競争率.poster が同数ぐらい 181/815 (22%) 通っているようだが,こちらは紙では publish されないそうなので,oral > poster という扱いっぽい.とはいえ,ちょっと採択し過ぎじゃないのかなぁ.

論文のフォーマットが変更されていなかったことに気がつかなったのもあったり,結果はともかく論文の構成は練りきれていない感じだったので,通るにしてももう少し厳しく採点されるかと思っていたが (4-4-3 とか),やや査読が温い感じ.ちゃんと読まれて理解されているようなのは良かったけど.他に査読した論文がよっぽど酷かったのかな.こんなにスンナリ通ってしまうと,この会議にはもったいなかったかなとも思ったり.

取り敢えず一安心.去年の身の回りの状況を考えれば,これ以上望んではいけない充分過ぎる結果と言えよう.来年は本命の方に間に合うよう頑張ろう.

またフォーマットが変わっとる

|  またフォーマットが変わっとるを含むブックマーク  またフォーマットが変わっとるのブックマークコメント

マージンが微妙に変わって,テキストの幅がほんの僅か大きくなっていた.8p に収めるためにほとんどの文末は右下ぴっちりで詰まっていたが,バラバラになってしまった orz

1p 増えたし (本文 8p + 参考文献 1p),しょうがないから根本的に書き換えよう.

出しそこねた会議のスタイルファイルでフォーマットしてみたら,7.5p になった.テキストの幅が僅かに広いのと,上部のマージンの差のようだ.しかし,論文中のほとんどの数式にごつい加算記号が含まれるせいか,横幅の制限がかなりしんどい.いっそ euler 辺りでも使いたい気分だけど,ダメだろうから,現実的な線は Σ のサイズを小さくするという線か.

この論文とかやたらシグマが小さいけどどうしてるのかな. \textstyle\sum\limits かな?とりあえず,この方法 で 0.95 倍ぐらいにしておこう.\usepackage{helvet} も 0.95 倍にする scaled オプションあるし,これぐらいはいいかな.

2010-05-20 実装しても良いかな

Online Passive-Aggressive Algorithms on a Budget

|  Online Passive-Aggressive Algorithms on a Budgetを含むブックマーク  Online Passive-Aggressive Algorithms on a Budgetのブックマークコメント

AISTATS という学会で出てた論文.Projectron の更新の遅さを解決している模様.より正確には,Forgetron や Random Budget Perceptron と更新が同じ計算オーダ (O(B); BPA-NN) で O(B^2) の Projectron++ と同程度の精度が出るとのこと.パッと見たところ,mistake bound の analysis は無いようだ.あと,hinge loss を ramp loss にして精度改善 (訓練例のマージンが小さい時だけ更新する PA-I という感じの更新式). ramp loss と active learning の関連に言及している辺りが面白い.以前聴いた Learning with Annotation Noise も関係してるかな (後で確認しよう).

Exact Passive-Aggressive Algorithm for Multiclass Classification Using Support Class

|  Exact Passive-Aggressive Algorithm for Multiclass Classification Using Support Classを含むブックマーク  Exact Passive-Aggressive Algorithm for Multiclass Classification Using Support Classのブックマークコメント

こちらは SDM の発表.マルチクラス向けの PA の精度改善.去年の研究会に出てた話と同じかな.ようやく PDF が公開.

さらっと眺めただけなので,後でちゃんと読もう.

2010-05-18 夏休み恐るべし

スウェーデン行きの飛行機を調べてみた

|  スウェーデン行きの飛行機を調べてみたを含むブックマーク  スウェーデン行きの飛行機を調べてみたのブックマークコメント

行くつもりではあるが,色々事情があってしばらく予約ができないでいるのだけど,往路 7/10 復路 7/17 で調べてみたらもうかなり埋まっているみたい.というか,往路・復路とも土曜発の関係で,それぞれ+2万円ぐらい高くなるので割高.前後少しずらすのが良さそうだ.今回はややイマイチな Tutorial を外すのが現実的かな.

そろそろ Workshop 系の採否も出てさらに席は減りそうだけど,大丈夫かな・・・

日付間違った orz

きくの IFC コーヒー スペシャルブレンド

|  きくの IFC コーヒー スペシャルブレンドを含むブックマーク  きくの IFC コーヒー スペシャルブレンドのブックマークコメント

5袋84円で購入.これはウマイ.コンビニで買えるインスタントコーヒーとは比べ物にならない.一人前で豆10gとすると,豆だけと考えても 168円/100g と考えられない安さ.少し入れにくいがこれはオススメ.

コロンビアブレンドとロイヤルブレンドも買った.楽しみだ.

2010-05-06 遅くて良かった

やっと出たのか

|  やっと出たのかを含むブックマーク  やっと出たのかのブックマークコメント

1月に試した liblinear-poly2 の論文 Training and Testing Low-degree Polynomial Data Mappings via Linear SVM が JMLR でも公開されてた.少し内容が変わってる?気のせいか.

liblinear-poly2 は組み合わせ素性の重みが配列で実装されている関係で,素性数が多いデータで実験するとえらいことになる.論文ではハッシュを使う方法を提案してるけど,良いハッシュ関数を使うほど完全なランダムアクセスになるので,「ちゃんと実装した」動的ダブル配列を使った方が良い(頻度降順で素性番号をバイトコーディングしてループで組み合わせ素性を列挙すると,ほとんどキャッシュに載った配列アクセスと同じになるため).また全展開してしまうと,ハッシュを使っても,3次(以上)で動かすのは大変.この問題を解決した論文(今年の某全国大会)を出したときにこの論文を参照しておけば良かったかな.

[追記] 配列 v.s. (静的/動的)ダブル配列 v.s. ハッシュ(トライ)

2次の組合せ素性の列挙で実験してみた.配列 (0.222s) < (静的)ダブル配列 (0.326s) < (動的)ダブル配列 (0.370s; 0.385s; 0.395s; 0.417s) < ハッシュ(トライ) (0.543s; 0.673s; 0.724s; 0.788s) だった.ただし,重みDBの構築時間は含んでおらず,値を取得するだけで追加/更新はなし,また(静的)ダブル配列は darts-clone (0.32f-rc2) で列挙に別コード(分類器のライブラリ)を利用.キャッシュ効率を改善するために,動的ダブル配列とハッシュ(トライ)では最初に列挙する素性ごとに別のトライを作った場合 (|f|~2^16),16 のトライに振り分けた場合 (ceil log_2 f),3つのトライに振り分けた場合 (ceil (log_128 f)) の結果も載せた(一つ目,二つ目,三つ目の結果).しかし配列速いな〜.

2010-05-04 アメリカの珈琲は薄過ぎる

珈琲の本場

|  珈琲の本場を含むブックマーク  珈琲の本場のブックマークコメント

日本に帰国して久々に珈琲を豆からひいて入れて飲んだ.うまいなぁ.紅茶の本場は英国だけど,珈琲の本場はどこなのだろう.輸入量で言えば,アメリカ,ドイツ,日本の順だが,アメリカで美味しい珈琲を飲んだ記憶がない.ドイツはメリタがあるぐらいだから美味しくても良さそうだけど,ビールの印象が強過ぎる.案外日本が一番美味しかったりして.

ベトナムやイタリアは独特の珈琲文化がありそうなので,今度行ったらじっくり飲んでみたいところ.豆の本場の南米は,行く機会がなさそうだ・・・

海外でも自分でいれるか

|  海外でも自分でいれるかを含むブックマーク  海外でも自分でいれるかのブックマークコメント

うーむ,学会出張で安定して美味しい珈琲を飲むのはやはり難しそうなので,手持ちのポーレックスのコーヒーミルに,ユニフレームのコーヒーバネットcuteとペーパーを学会出張に持っていくことにしようか.学会出張用の鞄は普段の通勤カバンと同じARC'TERYX の Quiver (11L)なので,容量的に少し厳しいかも知れないが・・・(コップはホテルにありそう,豆をどう携帯するか.一日一杯飲むとして,豆10gx5=50gぐらいだが,ミルに詰め込むのがいいのかなぁ.酸化が心配だ.)ポーレックスのミルの粉を受ける側の部品を,コップとして使いまわすという手もあるな.これだけ考えてお湯が確保出来ないとヘコむが・・・

2010-05-01 学会出張@アメリカ6日目

朝0時起き

|  朝0時起きを含むブックマーク  朝0時起きのブックマークコメント

予約したスーパーシャトルが,04:45-05:00 に来るというので朝0時起き.しんど.04:30 ほどに来て,何人か乗せて空港についたのは05:00過ぎ.飛行機の時間まで3時間以上あるよ・・・その後ヒューストンで乗り換えて日本着.帰国時税関では,(荷物が少ないですが)アメリカにお住まいですか?と言われて面食らった.11L のデイザックと学会でもらったサイドバッグだけだったからだと思うが,実際はこれでもサイドバッグ分荷物は増えてるんだけれども.

今回はコンチネンタル航空だったが,お酒は有料なもののその他は良いエアラインだった.ご飯の美味しさはシンガポール航空ほどではないものの,比較的美味しめで間食としてハンバーガー/ホットドッグにアイス(復路はハーゲンダッツ)という組合せで,タイミング的に寝てスキップする可能性はあるものの丁度良かった.後,映画も200本弱から選べるオンデマンド映画で,往路はひたすら iphone に入れていた相棒を見続けていたのでスキップしたけど,帰りの飛行機では,"Good Will Hunting" と "Harry Potter and the Half-Blood Prince" を見た(どちらも日本語吹き替えあり).

一方,宿泊した Days Inn は,smoking room で嵌め殺し窓だったからか,タバコの臭いが強烈に充満していて肺がおかしくなるかと思った.二週間前に予約した関係で,空きがなかったとは言え最悪だった.

学会を振り返る

|  学会を振り返るを含むブックマーク  学会を振り返るのブックマークコメント

まず Raleigh について.この街はスーパーもレストランも見所も殆どなく,これまで自分が参加した学会の開催都市の中で最も魅力のなかった Silicon Valley よりさらに輪をかけて魅力のない街だった.気候は快適で誘惑がない分,学会に集中できたのは良かった.それでも空き時間に博物館を二つ見るぐらいは出来た.North Carolina Museum of Natural Science には恐竜の化石もあって,まあ良かったかなと思う.

学会のホスピタリティや施設,アメニティなどはかなり充実していて,何より周りにレストランが無いだけに,ワークショップ+本会議の計4日のうち,ワークショップと本会議の最終日の夕飯を除いて全て食事が提供されたのは助かった(朝食は宿泊したホテルにも付いていたが,学会の朝食の方が充実していた).特に昼は,Google/Yahoo/MS のスポンサーで毎日違う国の料理がビュッフェスタイルで提供されていて,ない店に食べに行くよりよほど良かっただろう.その分,参加者のチェックは相当厳しく,あっちこっちで学会の参加証をチェックする人が立っていた.その他では,スタバと Oyster Bar ぐらいしか行かなかったけど,Oyster Bar に行って,アメリカの学会での唯一の楽しみはローカルビールだな〜と思った.学会で配布されたバッグはロゴが入ってなくてデザインもよく,ロゴ入りボトルも付いていた.プロシーディングは,512MB のロゴ入り USB に入っていた.極めつけは学会ロゴの入ったTシャツまで全員配布だった点.参加費が10万円超えるだけのことはあるなと.

発表の方は,人が集まるアプリ系の話にはその場限りの面白さしかないことが多いので,言語データが関与する研究で,かつ技術寄りの発表を中心に聴いたのだけど,どちらかというと洗練された技術を提案するというよりは,Web データのサイズにスケールするシンプルな手法の発表が多かった.そういう意味で,新しい重要なタスクを提案したり,他に無いデータを使って結果をしっかり分析したり,基礎技術の研究ならスケーラビリティのあるシンプルな手法に昇華させたりするのがポイントなのかな.Google/Yahoo/MS は研究者の発表も多かったけど,インターン系の発表もかなり目についていて,他にないスケール・タイプのデータを持っているというのはこの学会ではやはり大きいアドバンテージだなと感じた.ただ,個人的にはデータサイズが小さくてもキラリと光るところがある大学の研究者の発表の方が面白かったかも.

来年はインド.例によってハイデラバードなので,インドにしては面白くないと思うけど,今年より面白い場所であることは 100% 間違いなさそう.