問題文が長くて理解しづらい重回帰分析を簡単な問題で練習しよう
統計検定2級:重回帰分析の実戦演習
統計ソフトの出力結果(回帰・分散分析表)を読み解く
【問題設定】
ある飲料メーカーにおいて、清涼飲料水の売上数量(y)を、最高気温(x1)と広告費(x2)の2つの説明変数でモデル化した。以下の回帰分析表および分散分析表の空欄 [ A ] ~ [ E ] に関する問いに答えよ。
表1:回帰分析の結果(係数の推定)
| 項 | 推定係数 | 標準誤差 | t 値 | p 値 |
|---|---|---|---|---|
| 切片 | -150.0 | 30.0 | -5.00 | 0.000 |
| 最高気温(x1) | [ A ] | 0.40 | 8.00 | 0.000 |
| 広告費(x2) | 0.50 | 0.20 | [ B ] | 0.019 |
表2:分散分析表(モデル全体の有意性)
| 要因 | 自由度 | 平方和 | 平均平方 | F 値 |
|---|---|---|---|---|
| 回帰 | [ C ] | 4000 | 2000 | [ E ] |
| 残差 | 27 | 1080 | [ D ] | – |
| 合計 | 29 | 5080 | – | – |
演習問題
問1 推定係数の逆算: 空欄 [ A ] に入る最高気温の推定係数(回帰係数)を求めよ。
問2 t 値の算出と有意性: 空欄 [ B ] の値を算出せよ。また、この変数は有意水準5%で売上に影響を与えていると言えるか。
問3 自由度とサンプルサイズ: 空欄 [ C ] に入る回帰の自由度を答えよ。また、この分析のサンプルサイズ n はいくつか。
問4 誤差項の分散: 空欄 [ D ] に入る残差平均平方(不偏分散)を求めよ。
問5 モデル全体の判定: 空欄 [ E ] に入る F 値を求めよ。また、F 検定の帰無仮説は何か。
解答と理論的解説
問1 正解: 3.20
t 値の定義は「推定係数 ÷ 標準誤差」です。したがって、推定係数 = t 値 × 標準誤差 で求められます。
計算: 8.00 × 0.40 = 3.20
問2 正解: 2.50(有意である)
t 値 = 0.50 ÷ 0.20 = 2.50 です。p 値が 0.019 であり、有意水準 0.05 よりも小さいため、「広告費は売上に影響を与えている」と判断します。
問3 正解: 自由度 2、サンプルサイズ 30
重回帰分析において回帰の自由度は「説明変数の数(k)」に一致します。今回は気温と広告費の2つのため「2」です。
サンプルサイズ n は、合計自由度(n – 1)が 29 であることから、29 + 1 = 30 と導かれます。
問4 正解: 40.0
平均平方は「平方和 ÷ 自由度」で算出します。
計算: 1080 ÷ 27 = 40.0。これが誤差項の不偏分散の推定値となります。
問5 正解: 50.0
F 値 = 回帰の平均平方 ÷ 残差の平均平方 です。
計算: 2000 ÷ 40 = 50.0。F 検定の帰無仮説は「すべての偏回帰係数が 0 である」であり、これが棄却されることでモデル全体の有効性が示されます。
重回帰分析:試験での着眼点
● 数値の連鎖性を掴む
推定係数、標準誤差、t 値のどれかが欠けていても、割り算・掛け算で復元できることを覚えておきましょう。検定2級ではこの「表の穴埋め」が頻出です。
● 自由度の構造を理解する
合計自由度は n – 1、回帰は k(変数の数)、残差は n – k – 1 です。サンプルサイズを問われた際は、必ず「合計自由度 + 1」を計算してください。



