最小二乗法の復習(4)

最小二乗法でxの値からyの値を推定する(最良の)式」と「yの値からxの値を推定する(最良の)式」は異なることを示す簡単な例を見つけましたので紹介します。
データは以下の4つです。

これらのデータからはxが増加するとyが増加するのか減少するのかさっぱり分かりません。逆にyが増加するとxが増加するのか減少するのかさっぱり分かりません。まず、xの値からyの値を推定するには、yの値はxの値と無関係なので、yの値にだけ注目してyの値の平均であるy=0と推定しておけば、最良の近似ということになります。一方、yの値からxの値を推定するのも、同様に考えることが出来てx=0となります。つまり

  • xの値からyの値を推定する(最良の)式」はy=0
  • yの値からxの値を推定する(最良の)式」はx=0

となり、両者はまったく異なることが分かります。

    • 緑の線が「xの値からyの値を推定する(最良の)式」を表し、赤の線が「yの値からxの値を推定する(最良の)式」を表している。