統計検定2級 対策問題(3月28日分)
本日は「標本分布の計算」「確率の乗法定理」「情報セキュリティ(サニタイジング)」など、実践的な内容を中心に出題します。
問1:母分散 σ² = 100 の母集団から、サンプルサイズ n = 25 の標本を抽出したとき、標本平均の標準誤差(SE)はいくらですか。
- 2
- 4
- 10
- 20
【解説を表示】
正解:2
標準誤差は √(σ² / n) で求められます。√ (100 / 25) = √4 = 2 となります。分散(4)と標準誤差(2)を混同しないようにしましょう。
問2:事象Aが起こったという条件の下で事象Bが起こる「条件付き確率 P(B|A)」を求める式として正しいものはどれですか。
- P(A ∩ B) / P(A)
- P(A ∩ B) / P(B)
- P(A) × P(B)
- P(A) + P(B)
【解説を表示】
正解:P(A ∩ B) / P(A)
条件となる事象Aの確率 P(A) を分母に置きます。ベイズの定理の基礎となる非常に重要な公式です。
問3:クロスサイトスクリプティング(XSS)を防ぐために、ユーザーが入力した「<」や「>」などの特殊文字を無害な文字列に変換する処理を何と呼びますか。
- サニタイジング(エスケープ処理)
- フィルタリング
- ハッシング
- ソルト(Salt)
【解説を表示】
正解:サニタイジング(エスケープ処理)
プログラムとして実行されないように「消毒」するイメージです。WordPressでも、出力前に `esc_html()` などの関数を使ってこの処理を行うのが基本です。
問4:ある標本の偏差平方和(SS)が 100、サンプルサイズ n が 5 のとき、この標本の「不偏分散」の値はいくらですか。
- 25
- 20
- 4
- 5
【解説を表示】
正解:25
不偏分散は 偏差平方和 / (n – 1) で求めます。100 / (5 – 1) = 100 / 4 = 25 です。5で割ってしまうと「標本分散(20)」になり、母分散を過小評価してしまいます。
問5:3つの群(各群のサンプルサイズは 10)に対して一元配置分散分析を行うとき、「群間」の自由度はいくらですか。
- 2
- 3
- 9
- 27
【解説を表示】
正解:2
群間の自由度は(水準数 – 1)で求めます。3つの群があるため、3 – 1 = 2 です。ちなみに群内の自由度は(全体数 – 水準数)で、30 – 3 = 27 となります。
問6:相関係数 r = -0.5 であるとき、決定係数 R² はいくらですか。
- 0.25
- -0.25
- 0.5
- -0.5
【解説を表示】
正解:0.25
決定係数は相関係数の2乗です。(-0.5) × (-0.5) = 0.25 となり、マイナスにはなりません。
問7:正規分布において、平均 μ から左右に 2σ(標準偏差の2倍)の範囲内に、全データの約何%が含まれますか。
- 約 95%
- 約 68%
- 約 99%
- 約 50%
【解説を表示】
正解:約 95%
正確には ±1.96σ の範囲が 95% です。±1σ は約 68%、±3σ は約 99.7% となります。これらは頻出の数値です。
問8:「実際には母集団の間に差があるのに、有意な差がないと判断してしまう誤り」を何と呼びますか。
- 第2種の過誤(β)
- 第1種の過誤(α)
- 検出力(1-β)
- 信頼係数
【解説を表示】
正解:第2種の過誤(β)
差を見逃してしまう「ぼんやりものの誤り」です。一方、差がないのに差があると言ってしまうのは「第1種の過誤」です。
問9:箱ひげ図において、箱(ボックス)の長さが表している指標は何ですか。
- 四分位範囲(IQR)
- 標準偏差
- 中央値
- 範囲(最大値 – 最小値)
【解説を表示】
正解:四分位範囲(IQR)
箱の上下(左右)の端は第1四分位数と第3四分位数を表しており、その差である四分位範囲が箱の長さになります。
問10:重回帰分析において、説明変数同士に強い相関があることで、係数の推定が不安定になる現象を何と呼びますか。
- 多重共線性(マルチコ)
- 自己相関
- 不均一分散
- 偽相関
【解説を表示】
正解:多重共線性(マルチコ)
似たような情報を表す変数を同時に入れると発生します。これを防ぐには、相関の強すぎる変数を片方除外するなどの対策が必要です。