統計検定2級 対策問題(3月26日分)
本日は「標本分布の特性」「仮説検定の誤り」「分散分析」「時系列データ」など、試験後半で得点源となる範囲から出題します。
問1:サンプルサイズ n = 10 のデータから求められる、母平均の推定に用いる t 分布の「自由度」はいくらですか。
- 9
- 10
- 11
- 100
【解説を表示】
正解:9
1つの母平均に関する推論(t検定など)では、自由度は n – 1 となります。10 – 1 = 9 です。自由度は「独立に動かせるデータの数」を意味します。
問2:「実際には差がある(帰無仮説が偽である)」ときに、正しく帰無仮説を棄却できる確率を何と呼びますか。
- 検出力(検定力)
- 有意水準
- 第1種の過誤
- 信頼係数
【解説を表示】
正解:検出力(検定力)
これは 1 – β(第2種の過誤の確率を1から引いたもの)で表されます。サンプルサイズを大きくすると、この検出力は高まる傾向にあります。
問3:3つ以上の群の平均値に差があるかどうかを検定する「分散分析(ANOVA)」において、検定統計量として用いられるのはどれですか。
- F統計量
- t統計量
- z統計量
- カイ二乗統計量
【解説を表示】
正解:F統計量
分散分析は「群間の分散」と「群内の分散」の比をとり、F検定を行います。t検定を繰り返すと第1種の過誤が増大するため、一元配置分散分析が必要になります。
問4:重回帰分析において、説明変数を増やすほど(たとえ無意味な変数でも)値が上昇してしまう決定係数の欠点を補う指標はどれですか。
- 自由度調整済み決定係数
- 相関係数
- 標準誤差
- p値
【解説を表示】
正解:自由度調整済み決定係数
変数の数に応じてペナルティを課すことで、モデルの当てはまりの良さをより適切に評価する指標です。2級の重回帰分析の単元で必須の知識です。
問5:アイスクリームの売上データのように、1年周期で繰り返される変動パターンを何と呼びますか。
- 季節変動
- 傾向変動(トレンド)
- 循環変動
- 不規則変動
【解説を表示】
正解:季節変動
時系列データにおいて、季節や曜日など定期的な周期で発生する変動です。これを取り除くことを「季節調整」といいます。
問6:事象Aが起こる確率 P(A) = 0.4、事象Bが起こる確率 P(B) = 0.5、事象AとBが排反(同時に起こらない)であるとき、P(A ∪ B) はいくらですか。
- 0.9
- 0.2
- 0.1
- 0.45
【解説を表示】
正解:0.9
排反事象の場合、和事象の確率は単なる足し算で求められます(P(A) + P(B))。独立事象の積(0.4 × 0.5 = 0.2)と混同しないようにしましょう。
問7:第3四分位数を Q3、第1四分位数を Q1 としたとき、四分位範囲(IQR)の計算式はどれですか。
- Q3 – Q1
- (Q3 – Q1) / 2
- Q3 + Q1
- Q2 (中央値)
【解説を表示】
正解:Q3 – Q1
データの中心部50%が含まれる範囲を指します。外れ値の影響を受けにくいバラつきの指標です。ちなみに (Q3 – Q1) / 2 は「四分位偏差」と呼ばれます。
問8:「成功確率 p の試行において、初めて成功するまでに必要な試行回数」が従う分布はどれですか。
- 幾何分布
- 二項分布
- ポアソン分布
- 指数分布
【解説を表示】
正解:幾何分布
「初めて当たりが出るまで」「初めて故障するまで」といった現象を扱います。期待値は 1 / p です。
問9:所得の格差などを視覚的に表すグラフで、対角線(均等配分線)から離れるほど格差が大きいことを示す曲線は何ですか。
- ローレンツ曲線
- 正規分布曲線
- 回帰直線
- ROC曲線
【解説を表示】
正解:ローレンツ曲線
この曲線と対角線に囲まれた面積をもとに算出される指標が「ジニ係数」です。ジニ係数が 1 に近いほど格差が大きいことを意味します。
問10:母集団をいくつかの層(グループ)に分け、各層からサンプルを抽出する方法を何と呼びますか。
- 層化抽出法
- 系統抽出法
- 多段抽出法
- クラスター抽出法
【解説を表示】
正解:層化抽出法
「男女別」「年代別」などに分けた後で抽出することで、母集団の構成を反映させやすくし、推定の精度を高める手法です。