工場統計力学(建設中!) このページをアンテナに追加 RSSフィード

いまだ輝かざる暁の数は、げに多かり    (リグ・ヴェーダ)

2017-01-19

[][]ベイズの確率論の勉強(1) ベイズの確率論の勉強(1)を含むブックマーク ベイズの確率論の勉強(1)のブックマークコメント

知人からこの本

を貸してもらい、今、ベイズの理論というのを勉強しています。

ベイズの理論を今までにも勉強しかけたことがあったのですが、普通の確率の話と何が異なるのかよく分かりませんでした。読んでいても当たり前のことが書いてあるだけで、どこがすごいのか理解出来ませんでした。

この本も私は半分ぐらいまでは、ああ、もう知っている話だ、と思いながら読んでいきました。しかし、以下に示す例題を読んだ時にはおお、これは!!」と驚きを覚えました。常識と異なる結果が出てきたからです。

だからベイズの理論がどうすごいのか、まだ、私には人に説明するだけの理解は出来ていませんが、とりあえずこの例題のことをご紹介したいと思います。


それは以下の例題です。

ある病気を発見する検査Tに関して、次のことが知られている。

  • 病気にかかっている人に検査Tを適用すると、98%の確率で病気であると正しく判定される。
  • 病気にかかっていない人に検査Tを適用すると、5%の確率で誤って病気にかかっていると判定される。
  • 人全体では、病気にかかっている人と病気にかかっていない人との割合はそれぞれ3%、97%である。

母集団より無作為に抽出された1人に検査Tを適用し、病気にかかっていると判定されたとき、この人が実際に病気にかかっている確率を求めよ。

最初これを読んだ時、「病気にかかっている人に検査Tを適用すると、98%の確率で病気であると正しく判定される」し「病気にかかっていない人に検査Tを適用」しても誤診になるのは5%と低いので、この検査によって病気にかかっていると判定されたならば、ほぼ間違いなく本当に病気なんだろうなあ、と思いました。


ところが、この本の記述を読んでいくとそうでないことが分かります。それは、3番目の記述

「人全体では、病気にかかっている人と病気にかかっていない人との割合はそれぞれ3%、97%である。」

が関係してきます。こんなことがどうして分かっているんだ、というツッコミは可能だと思うのですが、ここでは素直にこの記述を認めてしまいましょう。


さてここに10,000人の人がいるとすると、この記述から、病気にかかっている人は10,000人の3%で、300人ということになります。この300人が検査Tを受けると、300人の98%で、294人が病気と判定されます。


一方、病気にかかっていない人は10,000人の97%なので、9,700人です。この9,700人が検査Tを受けると、5%の割合で病気と判定されるので、それを計算してみると、485人が病気と判定されることになります。


するとこういうことになります。

  • 本当に病気であって、検査Tでも病気と判定された人、294人
  • 本当は病気ではないのに、検査Tで病気と判定された人、485人

なんと、誤判定の人のほうが数が多いのです!。その結果、最初の問題である

  • 「検査Tを適用し、病気にかかっていると判定されたとき、この人が実際に病気にかかっている確率」

というのは

  • ¥frac{294}{294+485}=0.38

つまり、実際に病気にかかっている確率というのは38%でしかないのです!。この検査Tはあてにならない、ということでしょうか?


ここで上記の解法を振り返ってみると、どうも「人全体では、病気にかかっている人と病気にかかっていない人との割合はそれぞれ3%、97%である。」というところが、この結果に影響していることが見えてきます。ベイスの理論ではこれを事前確率と呼んでいるとのことです。そして先ほど求めた38%というのは事後確率と呼んでいるとのことです。事前とか事後とかいっているのは、この例題に関して言えば、検査Tの前か後か、ということです。

そしてベイズ理論の枠組みでは、「ある人が病気である事前確率が3%であったが、検査Tで病気と判定された(陽性だった)ことによって、その確率が変化し、事後確率が38%になった」、と、とらえる、とのことです。


ベイズの理論については、やはり私はまだうまく説明出来ないので、それは今後の勉強として、今は上の例題をいろいろ変形して理解を深めてみたいと思います。

たとえば、

  • 病気にかかっている人に検査Tを適用すると、98%の確率で病気であると正しく判定される。

というのを

  • 病気にかかっている人に検査Tを適用すると、100%の確率で病気であると正しく判定される。

に変えてみたら、どんな結果になるでしょうか? つまり、

  • 病気にかかっている人に検査Tを適用すると、100%の確率で病気であると正しく判定される。
  • 病気にかかっていない人に検査Tを適用すると、5%の確率で誤って病気にかかっていると判定される。
  • 人全体では、病気にかかっている人と病気にかかっていない人との割合はそれぞれ3%、97%である。

です。


さて、同じように計算をしていきましょう。


また、10,000人に登場してもらいます。

病気にかかっている人は10,000人の3%で、300人ということになります。この300人が検査Tを受けると、(100%正しく判定されるから)300人全員が病気と判定されます。


一方、病気にかかっていない人は10,000人の97%なので、9,700人です(最初の例題と同じ結果です)。この9,700人が検査Tを受けると、5%の割合で病気と判定されるので、485人が病気と判定されることになります(これも最初の例題と同じ結果です)。


するとこういうことになります。

  • 本当に病気であって、検査Tでも病気と判定された人、300人
  • 本当は病気ではないのに、検査Tで病気と判定された人、485人

病気の人を100%正しく判定出来るというのに、やはり、病気でない人のほうが多い結果になりました。ですので、この検査を受けて「病気です」と判定されても、病気でない確率のほうが大きいのです!  不思議ですね。(よく考えると不思議ではないのですが・・・)


どうも、「病気にかかっていない人に検査Tを適用すると、5%の確率で誤って病気にかかっていると判定される。」というところに、この検査があてにならない原因がありそうです。そして、病気にかかっていない人の数のほうが、かかっている人の数より圧倒的に大きいというところも、原因のようです。

トラックバック - http://d.hatena.ne.jp/CUSCUS/20170119

2017-01-15

TED:ケヴィン・ケリーAI第二次産業革命をもたらすことが出来るようなやり方(Kevin Kelly: How AI can bring on a second Industrial Revolution) TED:ケヴィン・ケリー:AIが第二次産業革命をもたらすことが出来るようなやり方(Kevin Kelly: How AI can bring on a second Industrial Revolution)を含むブックマーク TED:ケヴィン・ケリー:AIが第二次産業革命をもたらすことが出来るようなやり方(Kevin Kelly: How AI can bring on a second Industrial Revolution)のブックマークコメント

https://www.ted.com/talks/kevin_kelly_how_ai_can_bring_on_a_second_industrial_revolution

最近、英語の勉強のために聞いている動画です。

ここの部分が興味深かったです。

So let me talk about those three different aspects. The first one is: our own intelligence has a very poor understanding of what intelligence is. We tend to think of intelligence as a single dimension, that it's kind of like a note that gets louder and louder. It starts like with IQ measurement. It starts with maybe a simple low IQ in a rat or mouse, and maybe there's more in a chimpanzee, and then maybe there's more in a stupid person, and then maybe an average person like myself, and then maybe a genius. And this single IQ intelligence is getting greater and greater. That's completely wrong. That's not what intelligence is -- not what human intelligence is, anyway. It's much more like a symphony of different notes, and each of these notes is played on a different instrument of cognition.

There are many types of intelligences in our own minds. We have deductive reasoning, we have emotional intelligence, we have spatial intelligence; we have maybe 100 different types that are all grouped together, and they vary in different strengths with different people. And of course, if we go to animals, they also have another basket -- another symphony of different kinds of intelligences, and sometimes those same instruments are the same that we have.


それら3つの異なる局面について話をさせて下さい。最初のものは、私たち自身の知性は、知性とは何か、ということについて非常に理解が足りない、ということです。私たちは知性というものを1次元であると考えがちです。ちょうど、どんどん大きくなる1つの音符のようなものであるというふうにです。それはIQ測定のようなものからきています。それはたぶんネズミの単純な低いIQから始まって、たぶん、チンパンジーではより多く、そしてたぶんおろかな人ではもっと多く、そして私自身のような平均的な人ではと、そして天才では・・・というふうに。そしてこの1つのIQ知性はどんどん大きくなっていく。こんなのはまったくの間違いです。それは知性というものではなく、とにかく、人間の知性と言うものではない。それはむしろさまざまな音符からなる交響曲のようなものであって、これらの音符はそれぞれ認識というものの異なる楽器によって奏でられます。

私たち自身の心には多くのタイプの知性があります。私たちには演繹的推論があります。感情的知性があります。空間的知性があります。私たちにはたぶん一緒になっている100もの異なるタイプの知性があり、それらは人によってさまざまな強さに変わります。そしてもちろん、動物のことを考えれば、それらも異なるバスケットを、つまりさまざまな種類の知性による別の交響曲を持っており、時には同じ楽器が、私たちの楽器と同じでしょう。

EmmausEmmaus 2017/01/15 10:06 明けましておめでとうございます。知性への洞察。いいですね。交響曲、希望を感じます。

CUSCUSCUSCUS 2017/01/15 17:07 下川さん、明けましておめでとうございます。
人の知性を測るのに、一つの尺度では測れない、ということは、大切な洞察だと思います。我が身をかえりみて、いろいろ腑に落ちるところがあります。
 この人の話は、その後、機械(AI)の知性は人間の知性とは別のものであり、だからこそ、人間はAIの発達に脅威を感じるべきではなく、AIと共存する努力をすべきだ、というふうに論旨を展開していきます。

トラックバック - http://d.hatena.ne.jp/CUSCUS/20170115

2016-12-13

[]皇帝マルクス・アウレーリウス「自省録」からの抜書き 皇帝マルクス・アウレーリウス「自省録」からの抜書きを含むブックマーク 皇帝マルクス・アウレーリウス「自省録」からの抜書きのブックマークコメント

何か自分に対するおまじないになるかもしれないと思い、書き写します。

覚えておくこと。

我々の指導理性が難攻不落になるのはどういう時かというと、これが自分自身に集中し、自己の欲せぬことは行わずに満足している場合である。これはたとえその拒絶が理性的なものでない時でもそうであるが、ましてあることに関し理性をもって、よく見極めた上で判断する場合にはどんなであろう。

それゆえに、激情から解放されている精神というものは、一つの城砦である。ひとたびそこへ避難すれば以後絶対に侵されることのない所で、人間にこれ以上安全堅固な場所はないのである。

ゆえにこれを発見しない者は無知であり、これを発見しておきながらそこへ避難しない者は不幸である。


自省録 (岩波文庫)

自省録 (岩波文庫)

2016-11-06

[]関数の勾配ベクトルと等高線は直交する。 関数の勾配ベクトルと等高線は直交する。を含むブックマーク 関数の勾配ベクトルと等高線は直交する。のブックマークコメント

このタイトルでは、突然何のことか、と思われてしまいますが、サポートベクターマシン(SVM)という機械学習の勉強を始めたら「ラグランジュの未定乗数法」というのが登場しました。これは以前も見たことがある手法ですが、よくよく考えてみるとなぜこれでうまく計算できるのか私にはさっぱり分からないことに気付きました。Wikipediaに解説が載っていたので読んだのですが、いまひとつ理解できません。いろいろ考えているうちに「関数の勾配ベクトルと等高線は直交するんだろうか?」という疑問が出てきました。そして、このことが正しければWikipediaに出ているラグランジュ未定乗数法の説明は理解出来る、と思いました。そこでさらに、「関数の勾配ベクトルと等高線は直交する」ということをネットで調べたら、いい説明に出会いました。

以下、そこの記事そのままではなく、自分の理解に従っての書き方ですが、自分へのメモ用にこのことの証明を以下に記します。


証明

関数fのグラフz=f(x,y)z=ccは定数)とすると、

  • c=f(x,y)・・・・(1)

となり、これは高さcの等高線となる、この等高線の中の任意の1点を選び、これを(a,b)で表す。すると(1)より

  • c=f(a,b)・・・・(2)

である。一方、z=f(x,y)の点(a,b)における接平面は、以下のように書ける。

  • z=f(a,b)+¥left¥[¥frac{¥partial{f}}{¥partial{x}}¥right¥]_{(a,b)}(x-a)+¥left¥[¥frac{¥partial{f}}{¥partial{y}}¥right¥]_{(a,b)}(y-b)・・・・(3)

ただし、¥[¥partial{f}/¥partial{x}¥]_{(a,b)}は、点(a,b)における¥partial{f}/¥partial{x}の値、¥[¥partial{f}/¥partial{y}¥]_{(a,b)}は、点(a,b)における¥partial{f}/¥partial{y}の値を表す。この接平面の高さcの等高線は(3)から

  • c=f(a,b)+¥left¥[¥frac{¥partial{f}}{¥partial{x}}¥right¥]_{(a,b)}(x-a)+¥left¥[¥frac{¥partial{f}}{¥partial{y}}¥right¥]_{(a,b)}(y-b)

となる。ここで(2)を用いると、

  • ¥left¥[¥frac{¥partial{f}}{¥partial{x}}¥right¥]_{(a,b)}(x-a)+¥left¥[¥frac{¥partial{f}}{¥partial{y}}¥right¥]_{(a,b)}(y-b)=0・・・・(4)

となる。ここで図形的に考えると、接平面の等高線(3)は、f(x,y)の等高線(1)の点(a,b)における接線になっていることが分かる。(x,y)は接線上の点であるから、ベクトル

  • ¥left¥[¥begin{array}x-a¥¥y-b¥end{array}¥right¥]

は、点(a,b)から点(x,y)へのベクトルであり、つまりこれは等高線(1)の点(a,b)における接ベクトルである。一方、

  • ¥left¥[¥begin{array}¥[¥partial{f}/¥partial{x}¥]_{(a,b)}¥¥¥[¥partial{f}/¥partial{y}¥]_{(a,b)}¥end{array}¥right¥]^T

は点(a,b)における勾配ベクトルである。式(4)からこの接ベクトルと勾配ベクトル直交していることが分かる。よって、点(a,b)において、等高線(1)と勾配ベクトル直交している。


このように書いたものを改めて読んでみると、図を追加しないとあまり意味が分からないことに気付きました。しかし、3次元の図を描く(曲面を描く)よい方法を私はまだ知りません。これは私の課題です。

トラックバック - http://d.hatena.ne.jp/CUSCUS/20161106

2016-10-30

[]菅島(すがしま) 菅島(すがしま)を含むブックマーク 菅島(すがしま)のブックマークコメント

今度は、菅島(すがしま)という島に行ってきました。それまで、私の菅島への印象はあまりよくありませんでした。それは、この島には採石場があり、山がかなり削られて大変な姿になっているからです。鳥羽駅からは幸いその姿は見えないのですが(見えたら観光客には興ざめな光景)、安楽島(あらしま)のほうへ行くとその痛々しい姿が見えてしまいます。手っ取り早い話、Google マップでその姿が見えてしまいます。

そんなことで、私は菅島に行こうという気が起こらなかったのですが、行って見ると随分印象が異なりました。島の北側に集落があり、定期船の港もそこにあります。そこは島でいうと採石場とは反対側なので、採石場の姿は見えません。

この日はよく晴れていましたが陸でも風が強い日でした。

f:id:CUSCUS:20161029084858j:image:left


港はこんな感じ


上陸した時に初めて聞いた音が、船着場近くの道路工事のドリルの音でした。どうも、離島というよりか、工場、という雰囲気がしてしまいました。しかし、少し歩くと雰囲気は一変し、見どころのある風景が広がりました。細い道を進むと険しい岩場になり、上にはトンビが何羽も旋回し、私が近づいたのに驚いたカラスが十数羽、岩陰からどっと飛び出してきました。

f:id:CUSCUS:20161029082627j:image

f:id:CUSCUS:20161029082618j:image:left



伊勢湾フェリー


f:id:CUSCUS:20161029083743j:image

岩場と岩場に囲まれて孤立した砂浜があり、ここは「しろんご浜」というところです。ここで海女(あま)のお祭である「しろんご祭り」が行われます。

f:id:CUSCUS:20161029083023j:image

毎年7 月11 日、菅島の白浜(しろんご浜)で行なわれる「しろんご祭り」は、700 年ほど昔、菅島にあらわれた白蛇を竜神の使いとあがめて、大漁と海上安全を祈願したのが始まりと言われています。ホラ貝の音を合図に海女全員が海に入り、鮑(あわび)のつがいの初捕りを競うもので、雌雄つがいの鮑を最初に捕った者が海女頭となり、一年中尊敬されます。白浜は通常は禁漁区ですが、この日のみ漁が許され、この鮑は菅島の守り神とされる白髭神社奉納されます。世界でも韓国と日本だけとされる海女文化が島の人々により引き継がれています。(市の無形民俗文化財)(国土交通省の島の宝100景に選定)


鳥羽市のホームページより

f:id:CUSCUS:20161029083125j:image:left




中央、遠くに見えるのが神島。その向こうは渥美半島。


私は、そこがおごそかな場所に感じられました。そう感じたのは、その時、人が誰もいなかったせいもあるかと思います。

トラックバック - http://d.hatena.ne.jp/CUSCUS/20161030