こんにちわ!このサイトでは回帰分析のための内容となっております。
前回は、基本的な概念と回帰モデルについてやりました。
前回の記事
前回やったモデルパラメータの推定する最小二乗法についてやります。
最小二乗法を使うメリット
- 回帰モデル式の係数と定数項が推定できる
- 回帰直線のズレが小さくなる
実績値:実際のデータ
理論値:回帰直線による予測で求められた数値(今回に限り)
実績値から理論値を引いた値を残差
残差の2乗の合計を残差平方和
残差平方和
最小二乗法への道のり
最終変形
これらの式は最小二乗法がどのようにして表せられるかという原理になっているので、
これをExcelを使い簡単に求める。
例題(Excel使います)
ゾーン | 人口(人) | 発生交通量(トリップ) | ゾーン | 人口(人) | 発生交通量(トリップ) | |
1 | 2000 | 1500 | 7 | 6000 | 4000 | |
2 | 3000 | 2000 | 8 | 5000 | 3500 | |
3 | 4000 | 2500 | 9 | 5000 | 3000 | |
4 | 5000 | 3000 | 10 | 4000 | 2500 | |
5 | 6000 | 3500 | 11 | 3000 | 2000 | |
6 | 7000 | 4000 | 12 | 2000 | 1500 |
- 理論値は回帰係数×人口+発生交通量で求める。
- 残差は発生交通量ー理論値
- 残差平方は残差の2乗
- 回帰係数は残差平方和でソールバーを使い、上手く求める。
上の4つのことを意識すれば簡単に求めれる。
ゾーン | 人口 | 発生交通量 | 理論値 | 残差 | 残差平方 |
1 | 2000 | 1500 | 1488.376 | 11.62379251 | 135.1125523 |
2 | 3000 | 2000 | 2029.072 | -29.072443 | 845.2069417 |
3 | 4000 | 2500 | 2569.769 | -69.7686785 | 4867.668499 |
4 | 5000 | 3000 | 3110.465 | -110.464914 | 12202.49723 |
5 | 6000 | 3500 | 3651.161 | -151.1611495 | 22849.69312 |
6 | 7000 | 4000 | 4191.857 | -191.857385 | 36809.25618 |
7 | 6000 | 4000 | 3651.161 | 348.8388505 | 121688.5436 |
8 | 5000 | 3500 | 3110.465 | 389.535086 | 151737.5832 |
9 | 5000 | 3000 | 3110.465 | -110.464914 | 12202.49723 |
10 | 4000 | 2500 | 2569.769 | -69.7686785 | 4867.668499 |
11 | 3000 | 2000 | 2029.072 | -29.072443 | 845.2069417 |
12 | 2000 | 1500 | 1488.376 | 11.62379251 | 135.1125523 |
残差平方和 ➡ | 369186 | ||||
回帰係数 | 定数項 | ||||
1 | 407 |
例題では、
回帰係数は1、定数項は407となる。
このようにして、最小二乗法でモデルパラメータが推定できる。
これの結果は上記の式に代入する方法と一緒になる。
ですから、皆様もExcelを使い簡単に求めてみましょう。