Hatena::ブログ(Diary)

DTAL(旧RCEAL)留学記録 RSSフィード

2016-06-12

ウェブサイトを開設しました

ご無沙汰しております。本ブログへの最後の投稿から随分と時間が経ってしまいましたが、私個人のウェブサイトを以下に開設しました。ブログも再開しています。今後ともよろしくお願い致します。

http://www.akira-murakami.com

2014-07-20

Congregation

昨日はケンブリッジに戻り、Congregation(卒業式・修了式)に出席しました。以前も述べたように、ケンブリッジ大学では学位確定後、正式にはCongregationに出席又は欠席して修了する意思を表明して初めて学位が授与されます。Congregationへの出席は基本的にはいつでも良い(学位確定の数年後でも良い)ようですが、特に引き延ばす理由もないと思い、このタイミングで出席することにしました。


当日の流れは以下のようなものでした。まず午前中に予めレンタルしておいたガウン、フード、蝶ネクタイ、バンドを受け取ります。これらを所有していればレンタルの必要はありませんが、私は一度きりのことですし特に何も購入せず、全てをレンタルで済ませました。昨日は一年を通しても相当に暑い一日で、スーツの上にガウンを羽織り、蝶ネクタイやバンドを着用しているのは辛かったです。どのようなガウンやフードを着るかについてはケンブリッジ大学からの学位を既に有しているか否か等で変わり、細かな規定があります(参考)。


13時からCollegeで卒業生・修了生と彼等のゲストのための昼食があり、その後13時45分から式のリハーサルがありました。と言っても式自体は後述する一人数十秒の儀式的な部分のみなので、リハーサルも時間はかからず、30分ほどで終了しました。


学位授与式はSenate Houseという所で行われるのですが、全卒業生・修了生が一度に式に臨むわけではなく、基本的にはCollege単位です。卒業生・修了生がそれほど多くない場合は複数のCollegeの合同での式となります。そしてこれは、ロイヤルカレッジ(King's、Trinity、St. John's)→その他のCollegeの設立年順で行われるため、ロイヤルカレッジの卒業生・修了生は午前中に式を終える一方、私が所属していたHughes Hallのように比較的新しいCollegeは19時頃の式となります。


通常はCollegeからSenate Houseまで全員で行進するのですが、昨日は午後から雷雨の予報であったため、急遽現地集合となりました。18時半に集合し、18時40分にSenate Houseに入る予定でしたが、当日の進行が全体的に遅れていたため実際に入館したのは19時前でした。


Senate Houseでは特に来賓者の挨拶などはなく、(割と厳しい)服装チェックの後は、学位の授与のみを行います。学位を授けるのは副学長(学長はケンブリッジ大学では名誉職のようです)あるいはその代理人(Collegeの長など)です。実際のプロセスはここに詳しいですが、大雑把には以下の手順で進みます。

  1. 四人一組となり、Praelectorと呼ばれる人の指を右手で掴む
  2. Praelectorが「彼・彼女はPhDの学位に相応しい」という旨をラテン語で宣言する
  3. 卒業生・修了生が一人ずつ呼ばれるので、名前を呼ばれたら副学長(やその代理人)の前まで進み、ひざまずき、両手を合わせて前に出す
  4. 副学長(やその代理人)がそれを両手で握りしめ、「神の名の下にPhDの学位を授与する」という旨をラテン語で宣言する
  5. 立ち上がり、一歩下がり一礼し、Senate Houseから退館する。退館時に学位記を受け取る。

3-5は一人当たり数十秒程度でしょうか。上の学位(PhDなど)から始まるので、私は19時20分頃には退館していました。退館後は学位記を入れるフレームや学位授与時の写真を購入する場所があります。学位授与式の最中は撮影禁止なので、写真が欲しければここで購入するしかありません。それを通り抜けるとSenate Houseの庭があり、そこで友人らと写真を撮ったりすることができます。私は学科(DTAL)、College(Hughes Hall)、卓球部の友人らとそこで会い、記念撮影を行いました。


----

本ブログは約5年間に亘り、「留学記録にしたいブログ」→「留学記録になる予定のブログ」→「留学記録」として記してきましたが、それもこれで最後になります。今後は新たなブログを立ち上げる予定でいますが、細部は決めていません。その際はこちらでもお知らせします。これまでご愛読くださりありがとうございました。

古田 京古田 京 2014/07/21 02:37 おめでとう?Z
お盆に会えるのを楽しみにしてるよ

mrkm-amrkm-a 2014/07/21 06:35 ありがとう。また来月ね。

RudyRudy 2014/08/23 18:07 数年前に検索でヒットしてから定期的に読んでいたのでなんだか寂しいです。今後も研究者としてのご健闘をお祈りいたします。ご卒業おめでとうございます。

mrkm-amrkm-a 2014/08/24 16:54 ありがとうございます。近々新規ブログを立ち上げ、こちらでも案内しますので、そちらもよろしくお願いします。

2014-05-18

Michael McCarthy先生へのインタビュー

今年度の『英語教育』には「言語教育研究の最前線」という、日本国外の著名研究者にインタビューを行う連載がありますが、現在発売中の6月号では私が語彙研究やコーパス研究で著名なMichael McCarthy先生にインタビューを行っています。

英語教育 2014年 06月号 [雑誌]

英語教育 2014年 06月号 [雑誌]

研究を始められたきっかけ、現在の研究上のご関心、English Profileの英語教育への貢献などについて伺っています。ご興味がおありでしたら是非ご一読ください。

2014-05-13

対数変換と一般化線形モデル

免責事項

以下は私がここ一ヶ月強ほどで学習した内容ですので、誤っている可能性があります。誤りを発見された方はご指摘を頂けると嬉しいです。


主旨

Rで以下の二者は同一のモデルを構築すると思っていたのが、間違っていましたという話です。

1. lm(log(y) ~ x)
2. glm(y ~ x, family = gaussian(link = log))

背景

必要があり、指数関数(E(y) = c + ae^{bx})あるいは冪関数(E(y) = c + ax^b)に従う二変量(xとy)をRでモデル化する方法について調べていました。


私のこれまでの理解は、以前は変数変換を施すことにより誤差を正規分布に近づけ、それに最小二乗法に基づく線形モデルを当てはめていたのが、近年では一般化線形モデルを用いることにより正規分布以外の誤差も扱えるようになり、そちらを使うことが多い、というものでした。つまり一般化線形モデルが変数変換に取って代わったと思っていました。しかしこれは大きな誤りで、実際は二者は異なる前提を持つモデルで、どちらを用いるかはデータ(の前提)に依るということを学びましたので、備忘録を兼ねて以下にメモしておきます。


以下の指数関数を考えます。

E(y) = ae^{bx}

但しeはネイピア数(¥approx 2.718)、aとbをデータから推定します。ポイントは平均がゼロで正規分布に従う誤差項(¥epsilon)はどこに入るか。


1. ¥epsilonが指数内に入る場合

Rでは単純に従属変数に対数変換を施した、lm(log(y) ~ x)という式がこれに当たります。


y = ae^{bx + ¥epsilon}


以下のようにも変形できます。logは自然対数(底はe)です。

log(y) = A + bx + ¥epsilon (但しA = log(a)

E[log(y)¥] = A + bx


二つ目の式では線形予測子(A + bx)とlog(y)の二乗和が最小となるようなAとbが推定されます。さてここでは¥epsilonがyではなく、yの対数スケールでの誤差を吸収します。このため、最小二乗法を用いて最小となるのは対数スケールでの実測値と予測値の差の二乗和であり、オリジナルスケールでのそれではありません。誤差項(¥epsilon)が表すのは通常の最小二乗法のように実測値と予測値の差の二乗ではなく、実測値と予測値の比です。従ってこれを乗法的(multiplicative)な誤差構造と呼びます。


また対数スケールでの加算はオリジナルスケールでの乗算になるので、¥epsilonが正規分布すると、e^¥epsilonここにある図のように対数正規分布(正の歪みがある分布)します。


そして誤差を乗算で算出する結果、このモデルは正の方向の誤差には(負の方向の誤差と比較して)影響を受けづらく、そちらの方向の外れ値には頑健です。


さて対数正規分布は正規分布とは異なり、分散が平均に依存します。厳密には変動係数が一定である、すなわち分散は平均の二乗に比例するようです。つまり、誤差はyの予測値が大きいほど大きいと仮定します。


2. ¥epsilonが線形に入る場合

Rでは対数リンク関数+正規分布の一般化線形モデルを用いた、glm(y ~ x, family = gaussian(link = log))という式がこれに当たります。


y = ae^{bx} + ¥epsilon

E[y¥] = ae^{bx}

log(E[y¥]) = A + bx

あるいは

y + ¥epsilon = ae^{bx}(単純に移行すると-¥epsilonですが、平均ゼロの誤差ですので符号を変えなくても影響は同じです)

log(y + ¥epsilon) = A + bx


四つ目の式が分かりやすいと思うのですが、この場合、¥epsilonが吸収するのはオリジナルスケールでの実測値(y)と予測値(ae^{bx})の差です。このため、aとbはオリジナルスケールでの二者の差が最小となるように推定されます。つまり誤差項が表すのはオリジナルスケールでの二者の差であり、従ってこれを加法的(additive)な誤差構造と呼びます。誤差構造は通常の回帰モデルと同様に分散が一定の正規分布で、従って乗法的な誤差構造と比較すると正の方向の外れ値に影響を受けやすいとも言えます。


また三つ目の式と1での記述から、E[log(y)]とlog(E[y])が異なる意味を持つことがわかります。


どちらを用いるべきか

乗法的な誤差構造を仮定するなら対数変換、加法的な誤差構造を仮定するなら一般化線形モデル、というのが指針になります。一般的に冪関数や指数関数は乗法的な誤差構造を持つことが多いようですが、図などを見て決めることが推奨されているようです。


参考文献

主に以下の書籍、論文、ウェブサイトを参考にしました。Venables and Dichmont (2004)は私にとって馴染みのない分野での統計手法の話ですが、少なくとも一般化線形モデルに関しての記述はわかりやすく、とりわけ参考になりました。

2014-03-23

PhDの学位取得が決定しました

標題の通りです。博士論文周りは一ヶ月半ほど動きがありませんでしたが、修正が認められたので製本したものを提出してくれとの連絡を3月3日に受けました。翌日(4日)に製本を依頼し、香港から帰英後の11日にそれを受け取り、即日ケンブリッジ大学に送付、13日にPhDの学位取得が決定したとの連絡を、14日に受けました。


11月に審査(viva)に通り、余程のことがない限り大丈夫だとは思っていましたが、実際にこうして大学から連絡を頂き安心しました。学位授与自体は年に複数回ある修了式で行われますが、今後数年内でいつ修了式に出席しても良いという制度ですので、いつになるか未定です。

f:id:mrkm-a:20140323230028p:image

f:id:mrkm-a:20140323230029p:image