例えば、身長と体重の順序列のデーターを思い浮かべてください。そのようなデーターが \(n\) 個あります。
\( \left(\ x_1,\ y_1\ \right)\ ,\ \ \ \left(\ x_2,\ y_2\ \right)\ ,\ \ ……\ \ \left(\ x_n,\ y_n\ \right) \)
\(x_n\) と \(y_n\) との間には正の相関があり、このデーターたちを2次元座標係にプロットしていくと、回帰直線 \( y\ =\ ax+b \) の近くに分布しています。
\(a\) と \(b\) とを求めるには、次の2変数関数の最小値を求める必要があります。最小2乗法というやつです。 \[ \begin{flalign} \ \ \ \ \ \ \ f\left(a,b\right)=\sum_{i=1}^{n}\left(\ y_i-ax_i-b\ \right)^{2}&& \end{flalign} \] この関数の \(a\) の偏微分 と \(b\) の偏微分 をとってそれらの値が0になるような \(a\) と \(b\) の値を求めていくわけですが、途中は省略して結果だけを言うと次のようになります。
\( a\ =\ \large\frac{共分散}{\ x\ の分散\ } \)
\( b\ =-\frac{共分散}{\ x\ の分散\ }\ ×\ x\ の平均\ \) + \( \ y\ の平均 \)
では、具体的に回帰直線を求めてみましょう。
身長 体重
140 43
145 46
150 50
155 53
160 56
165 60
170 64
175 67
180 71
185 75
身長の平均: 162.5
体重の平均: 58.5
身長の分散: 206.25
体重の分散: 103.85
共分散: 146.25
以上のデーターより、回帰直線 \( y\ =\ ax+b \) の \(a\) と \(b\) の値を求めると次のようになります。
\(a\) = 0.709090909090909 \(b\) =−56.7272727272727
ここまでのプロセスは次の十進BASIC のプログラムを参考にしてください。
Desmos を使って回帰直線を求めるのはチョー簡単です。
\(a\) = 0.709091 \(b\) = −56.72727
このたびの身長と体重のペアは BMI を用いた理想的なものになっているので、理想的な体重を 身長2( m2 )× 22 で求める以外に、次の式から求めることもできそうであることが分かりました。
理想体重 = 0.71 × 身長( cm )− 56.7
統計学 へ戻る