回帰直線
統計学 へ戻る
大学生のための数学 へ戻る
2026.01.13


 例えば、身長と体重の順序列のデーターを思い浮かべてください。そのようなデーターが \(n\) 個あります。
   \( \left(\ x_1,\ y_1\ \right)\ ,\ \ \ \left(\ x_2,\ y_2\ \right)\ ,\ \ ……\ \ \left(\ x_n,\ y_n\ \right) \)

 \(x_n\) と \(y_n\) との間には正の相関があり、このデーターたちを2次元座標係にプロットしていくと、回帰直線 \( y\ =\ ax+b \) の近くに分布しています。

 \(a\) と \(b\) とを求めるには、次の2変数関数の最小値を求める必要があります。最小2乗法というやつです。 \[ \begin{flalign} \ \ \ \ \ \ \ f\left(a,b\right)=\sum_{i=1}^{n}\left(\ y_i-ax_i-b\ \right)^{2}&& \end{flalign} \]  この関数の \(a\) の偏微分 と \(b\) の偏微分 をとってそれらの値が0になるような \(a\) と \(b\) の値を求めていくわけですが、途中は省略して結果だけを言うと次のようになります。
   \( a\ =\ \large\frac{共分散}{\ x\ の分散\ } \)
   \( b\ =-\frac{共分散}{\ x\ の分散\ }\ ×\ x\ の平均\ \) + \( \ y\ の平均 \)


では、具体的に回帰直線を求めてみましょう。

 身長 体重
  140  43
  145  46
  150  50
  155  53
  160  56
  165  60
  170  64
  175  67
  180  71
  185  75

  身長の平均: 162.5
  体重の平均: 58.5
  身長の分散: 206.25
  体重の分散: 103.85
  共分散: 146.25

 以上のデーターより、回帰直線 \( y\ =\ ax+b \) の \(a\) と \(b\) の値を求めると次のようになります。
   \(a\) = 0.709090909090909   \(b\) =−56.7272727272727

 ここまでのプロセスは次の十進BASIC のプログラムを参考にしてください。
Desmos を使って回帰直線を求めるのはチョー簡単です。  以上をテーブル( 表 )にして、\(y_1\) をクリックしてから、設定で 回帰直線 を選択すると、次のような数値を打ち出してくれます。
   \(a\) = 0.709091   \(b\) = −56.72727

 このたびの身長と体重のペアは BMI を用いた理想的なものになっているので、理想的な体重を 身長2( m2 )× 22 で求める以外に、次の式から求めることもできそうであることが分かりました。
   理想体重 = 0.71 × 身長( cm )− 56.7