統計検定2級 練習問題⑥

統計検定2級 対策問題(3月26日分)

本日は「標本分布の特性」「仮説検定の誤り」「分散分析」「時系列データ」など、試験後半で得点源となる範囲から出題します。


問1:サンプルサイズ n = 10 のデータから求められる、母平均の推定に用いる t 分布の「自由度」はいくらですか。

  • 9
  • 10
  • 11
  • 100
【解説を表示】

正解:9

1つの母平均に関する推論(t検定など)では、自由度は n – 1 となります。10 – 1 = 9 です。自由度は「独立に動かせるデータの数」を意味します。

問2:「実際には差がある(帰無仮説が偽である)」ときに、正しく帰無仮説を棄却できる確率を何と呼びますか。

  • 検出力(検定力)
  • 有意水準
  • 第1種の過誤
  • 信頼係数
【解説を表示】

正解:検出力(検定力)

これは 1 – β(第2種の過誤の確率を1から引いたもの)で表されます。サンプルサイズを大きくすると、この検出力は高まる傾向にあります。

問3:3つ以上の群の平均値に差があるかどうかを検定する「分散分析(ANOVA)」において、検定統計量として用いられるのはどれですか。

  • F統計量
  • t統計量
  • z統計量
  • カイ二乗統計量
【解説を表示】

正解:F統計量

分散分析は「群間の分散」と「群内の分散」の比をとり、F検定を行います。t検定を繰り返すと第1種の過誤が増大するため、一元配置分散分析が必要になります。

問4:重回帰分析において、説明変数を増やすほど(たとえ無意味な変数でも)値が上昇してしまう決定係数の欠点を補う指標はどれですか。

  • 自由度調整済み決定係数
  • 相関係数
  • 標準誤差
  • p値
【解説を表示】

正解:自由度調整済み決定係数

変数の数に応じてペナルティを課すことで、モデルの当てはまりの良さをより適切に評価する指標です。2級の重回帰分析の単元で必須の知識です。

問5:アイスクリームの売上データのように、1年周期で繰り返される変動パターンを何と呼びますか。

  • 季節変動
  • 傾向変動(トレンド)
  • 循環変動
  • 不規則変動
【解説を表示】

正解:季節変動

時系列データにおいて、季節や曜日など定期的な周期で発生する変動です。これを取り除くことを「季節調整」といいます。

問6:事象Aが起こる確率 P(A) = 0.4、事象Bが起こる確率 P(B) = 0.5、事象AとBが排反(同時に起こらない)であるとき、P(A ∪ B) はいくらですか。

  • 0.9
  • 0.2
  • 0.1
  • 0.45
【解説を表示】

正解:0.9

排反事象の場合、和事象の確率は単なる足し算で求められます(P(A) + P(B))。独立事象の積(0.4 × 0.5 = 0.2)と混同しないようにしましょう。

問7:第3四分位数を Q3、第1四分位数を Q1 としたとき、四分位範囲(IQR)の計算式はどれですか。

  • Q3 – Q1
  • (Q3 – Q1) / 2
  • Q3 + Q1
  • Q2 (中央値)
【解説を表示】

正解:Q3 – Q1

データの中心部50%が含まれる範囲を指します。外れ値の影響を受けにくいバラつきの指標です。ちなみに (Q3 – Q1) / 2 は「四分位偏差」と呼ばれます。

問8:「成功確率 p の試行において、初めて成功するまでに必要な試行回数」が従う分布はどれですか。

  • 幾何分布
  • 二項分布
  • ポアソン分布
  • 指数分布
【解説を表示】

正解:幾何分布

「初めて当たりが出るまで」「初めて故障するまで」といった現象を扱います。期待値は 1 / p です。

問9:所得の格差などを視覚的に表すグラフで、対角線(均等配分線)から離れるほど格差が大きいことを示す曲線は何ですか。

  • ローレンツ曲線
  • 正規分布曲線
  • 回帰直線
  • ROC曲線
【解説を表示】

正解:ローレンツ曲線

この曲線と対角線に囲まれた面積をもとに算出される指標が「ジニ係数」です。ジニ係数が 1 に近いほど格差が大きいことを意味します。

問10:母集団をいくつかの層(グループ)に分け、各層からサンプルを抽出する方法を何と呼びますか。

  • 層化抽出法
  • 系統抽出法
  • 多段抽出法
  • クラスター抽出法
【解説を表示】

正解:層化抽出法

「男女別」「年代別」などに分けた後で抽出することで、母集団の構成を反映させやすくし、推定の精度を高める手法です。