2014-09-04

マカロック・ピッツの式

$y=1\left(\Bigsum_{i=1}^ns_ix_i-h\right)$ ・・・・(1)

に従う１個のニューロンがあるとする。「パターン認識（４）」で説明した線形分離可能なパターン群が与えられたとして、このニューロンをそのパターン群を識別出来るようにするために（人が外部からシナプス荷重 $s_i$ やしきい値 $h$ を設定するのではなくて）学習によって自動的にシナプス荷重 $s_i$ やしきい値 $h$ を調整することは出来ないだろうか？　つまり、このニューロンにパターン（＝全ての $i$ についての $x_i$ の値の集合 $\{x_i\}$ ）を与えて出力 $y$ を観察する時にあるパターン群に属する時だけ $y=1$ となり、そのパターン群に属さない時には $y=0$ となるように自動的に $s_i$ や $h$ を調整することは出来ないだろうか？　出来ればこのニューロンは脳の機能に少し近づくことになる。

ニューロンの学習を実現ために、パターン $\{x_i\}$ をニューロンに与えて出力 $y$ を得た後に、外部から正解を示しその正解によって $s_i$ や $h$ を調整する方法を考える。これを次のように考える。正解を示す信号を教師信号と呼び、 $r$ で表すことにする。

出力が教師信号と等しかった場合、つまり $y=r$ である場合は、 $s_i$ や $h$ の値を変えない。
出力が教師信号と等しくなかった場合は次の２つに分けて考える。
- 教師信号が１なのに出力が０だった場合、つまり、だった場合は、このパターンでよりが１になり易いように
  - $h$ の値を減らす。
  - $x_i=1$ であるような $i$ については、 $s_i$ の値を増やす。（この結果 $x_is_i$ の値が増える。）
  - $x_i=0$ であるような $i$ については、 $s_i$ の値を変えない。（ $x_i=0$ なので $s_i$ の値が何であっても $x_is_i$ の値はゼロで変わらない。）
- 教師信号が０なのに出力が１だった場合、つまり、だった場合は、このパターンでよりが０になり易いように
  - $h$ の値を増やす。
  - $x_i=1$ であるような $i$ については、 $s_i$ の値を減らす。（この結果 $x_is_i$ の値が減る。）
  - $x_i=0$ であるような $i$ については、 $s_i$ の値を変えない。（ $x_i=0$ なので $s_i$ の値が何であっても $x_is_i$ の値はゼロで変わらない。）

上記で登場したこれらの増やす値、減らす値に全て同じ値を使うと仮定する。そしてそれを $a$ で表すことにする。 $a$ は正の定数である。そうすると上記は以下のように表すことが出来る。

- 、の場合
  - $h{\leftar}h-a$ と置換える。
  - $x_i=1$ であるような $i$ については、 $s_i{\leftar}s_i+a$ と置き換える。
  - $x_i=0$ であるような $i$ については、 $s_i$ の値を変えない。
- 、の場合
  - $h{\leftar}h+a$ と置換える。
  - $x_i=1$ であるような $i$ については、 $s_i{\leftar}s_i-a$ と置き換える。
  - $x_i=0$ であるような $i$ については、 $s_i$ の値を変えない。

これらのことは以下の式にまとめることが出来る。

$h{\leftar}h-a(r-y)$ ・・・・(2)
$s_i{\leftar}s_i+a(r-y)x_i$ ・・・・(3)

確かにこの式(2)(3)によれば、ニューロンの出力が正解の場合（ $r=y$ の場合）は、 $h$ と $s_i$ は変化せず、不正解の場合（ $r{\neq}y$ の場合）でも $x_i=0$ の場合は $s_i$ は変化しない。そして、 $r=1$ 、 $y=0$ の場合、 $h{\leftar}h-a$ 、 $x_i=1$ であるような $i$ については、 $s_i{\leftar}s_i+a$ 、逆に $r=0$ 、 $y=1$ の場合、 $h{\leftar}h+a$ 、 $x_i=1$ であるような $i$ については、 $s_i{\leftar}s_i-a$ となる。式(2)(3)はローゼンブラットが1958年に提案した学習アルゴリズムである。これは標準デルタ則と呼ばれている。

工場統計力学（建設中！）

１個のニューロンの学習（１）