2006-04-12

何故、データ分布の主軸を求める問題が相関係数行列の固有ベクトルを求める問題になるのか？　

良く教科書に書いてあるように、ラグランジュの未定係数法なんかで説明をされても、なんか判ったような判らないような感じである。一方で固有ベクトルで出来た行列は方向を変えない変換を意味するから、・・・と考えると、まあ「何となくそうだろう！」と直感的にはわかるが・・・でも「もやもやした感じ」という状態である。そこで、なんとか頭スッキリの理解が出来ないかと、再度考えてみようというわけである。

既定となっている座標を変換するんだ！　という考え方で理解してみればきっとスッキリするのではないかという期待をもっている。とりあえず整理してみよう。

準備

まずは色々と定義をして準備にとりかかることにしよう。上の図のように２つの変数の分布が得られたとする。つまり身長と体重などのように、変数 $x_1$ と $x_2$ の２つの測度に関する $n$ 組のデータが得られているわけである。

この時、得られたデータ配列を以下のように行列 $X$ で表すとする。

$X=\left( \begin{array}{ccc}x_{11} & x_{21} & \\x_{12} & x_{22} & \\ \vdots & \vdots & \\ x_{1n} & x_{2n} &\\ \end{array} \right)$

ここで、新しい座標軸として $y_1$ と $y_2$ が出来たと仮定しよう。強引だが仮定するのである。この $y_1$ と $y_2$ も $x_1$ と $x_2$ と同様には直交していると考えるのは順当と思う。この新しい座標軸での値を持ってきて下のように行列 $Y$ で表すとする。

$Y=\left(\begin{array}{cc}y_{11} & y_{21} \\y_{12} & y_{22} \\\vdots & \vdots \\y_{1n} & y_{2n} \\\end{array}\right)$

さらに強引かもしれないが、 $X$ を $Y$ に変換する一次変換があって、それは行列 $A$ で以下のように表せるとしておく。

$A=\left( \begin{array}{ccccc} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{array} \right)$

つまり、以下のように表せるとするのである。

$Y=AX$

どうなっていたら嬉しいの？

さて、準備した所で・・・つぎにどうなっていたら良いのかを考えることにする。

まず、元のデータの相関行列（正確には分散・共分散行列）はどのように表せるか？

$X^TX=\left( \begin{array}{cccc}x_{11} & x_{12} & \cdots & x_{1n}\\x_{21} & x_{22} & \cdots & x_{2n}\\ \end{array}\right)\left( \begin{array}{cc}x_{11} & x_{21} \\x_{12} & x_{22} \\ \vdots & \vdots \\x_{1n} & x_{2n} \\ \end{array}\right)=\left(\begin{array}{cc}s_{x_1^2} & s_{x_1,x_2} \\s_{x_2,x_1} & s_{x_2^2} \\ \end{array}\right)$

それに対して、勝手に仮定した新しい座標での相関行列（正確には分散・共分散行列）はどうなるか？

$Y^TY=\left( \begin{array}{cccc}y_{11} & y_{12} & \cdots & y_{1n}\\y_{21} & y_{22} & \cdots & y_{2n}\\ \end{array}\right)\left( \begin{array}{cc}y_{11} & y_{21} \\y_{12} & y_{22} \\ \vdots & \vdots \\y_{1n} & y_{2n} \\ \end{array}\right)=\left(\begin{array}{cc}s_{y_1^2} & s_{y_1,y_2} \\s_{y_2,y_1} & s_{y_2^2} \\ \end{array}\right)$

ここで、望ましいのは新しい座標軸上では２つの変数のデータが無相関であるのが嬉しいのである。つまり、 $s_{y_1,y_2}$ と $s_{y_2,y_1}$ が $0$ となるようになっていれば嬉しいはずである。

つまり、相関行列（分散・共分散行列）を対角化してやればいいのである。

うん？　しかし・・・これじゃ、全然スッキリしない・・・・失敗ですね。

コンテキストをマイニングするツールを作る

相関係数行列と固有行列の関係

準備

どうなっていたら嬉しいの？