アーカイブ: 統計検定練習問題

  • 統計検定2級 練習問題④

    統計検定2級 対策問題(3月24日分) 日々の積み重ねが合格への近道です。各問題の「解説を表示」をクリックして…

  • 統計検定2級練習問題③

    統計検定2級 対策問題(10問セット) 各問題の「解説を表示」をクリックすると、正解と詳細な解説を確認できます…

  • 統計検定2級練習問題②

    【問1:確率密度関数】 連続型の確率変数において、すべてのとりうる値の範囲で確率密度関数を積分した値は必ずいく…

  • 統計検定2級 練習問題

    問1:データの記述】 変数値 x1​,x2​,…,xn​ の平均値が xˉ、分散…

  • 統計検定2級 練習問題④

    統計検定2級 対策問題(3月24日分)

    日々の積み重ねが合格への近道です。各問題の「解説を表示」をクリックして、知識を定着させましょう。


    問1:事象Aと事象Bが「独立」であるとき、事象Aと事象Bが同時に起こる確率 P(A ∩ B) を求める式として正しいものはどれですか。

    • P(A) × P(B)
    • P(A) + P(B)
    • P(A) + P(B) – P(A ∩ B)
    • P(A | B)
    【解説を表示】

    正解:P(A) × P(B)

    2つの事象が独立(互いに影響し合わない)であれば、同時確率はそれぞれの確率の「積」で求められます。足し算(加法定理)と混同しないよう注意しましょう。

    問2:母集団の分布がどのような形状であっても、サンプルサイズ n が十分に大きいとき、標本平均の分布は近似的にどのような分布に従いますか。

    • 正規分布
    • 二項分布
    • カイ二乗分布
    • t分布
    【解説を表示】

    正解:正規分布

    これを「中心極限定理」と呼びます。元の分布が歪んでいても、平均をとればその分布は正規分布に近づくという、統計学において最も重要な定理の一つです。

    問3:母分散が未知でサンプルサイズが小さい場合、母平均の検定に用いられる分布はどれですか。

    • t分布
    • 標準正規分布(Z分布)
    • F分布
    • ポアソン分布
    【解説を表示】

    正解:t分布

    母分散がわからないときは、代わりに不偏分散を使用するため、正規分布よりも裾の長い「t分布」を使用します。

    問4:「不偏分散」の期待値は、母集団のどの値と一致するように設計されていますか。

    • 母分散(σ²)
    • 母標準偏差(σ)
    • 母平均(μ)
    • 標本分散
    【解説を表示】

    正解:母分散(σ²)

    「不偏」とは、平均的に見て(期待値が)真の値と一致することを意味します。n-1 で割ることで、母分散を偏りなく推定できるようになります。

    問5:変数 X の分散が V(X) = 10 であるとき、変数 Y = 2X + 5 の分散 V(Y) はいくらになりますか。

    • 40
    • 20
    • 25
    • 45
    【解説を表示】

    正解:40

    分散の性質 V(aX + b) = a²V(X) を用います。今回の場合は 2の2乗(=4)倍になるため、4 × 10 = 40 です。定数項(+5)は分散(散らばり)には影響しません。

    問6:統計的仮説検定において、「差がない」や「効果がない」という前提で立てられる仮説を何と呼びますか。

    • 帰無仮説(H0)
    • 対立仮説(H1)
    • 有意仮説
    • 基本仮説
    【解説を表示】

    正解:帰無仮説(H0)

    「無に帰すべき仮説」という意味です。これを否定(棄却)することで、本当に言いたいこと(対立仮説)を証明する手続きをとります。

    問7:成功確率 p = 0.2 の試行を 100回 繰り返したとき(二項分布)、成功回数の期待値はいくらですか。

    • 20
    • 80
    • 0.2
    • 4
    【解説を表示】

    正解:20

    二項分布 B(n, p) の期待値は np で求められます。100 × 0.2 = 20 です。ちなみに分散は np(1-p) で、100 × 0.2 × 0.8 = 16 となります。

    問8:「2つの母集団の分散が等しいかどうか」を検定(等分散性の検定)する際に用いられる分布はどれですか。

    • F分布
    • カイ二乗分布
    • 正規分布
    • 二項分布
    【解説を表示】

    正解:F分布

    2つの分散の「比」が従う分布がF分布です。分散分析(ANOVA)などでも重要な役割を果たします。

    問9:相関係数が高いからといって、必ずしも一方が他方の原因であるとは限らない理由として適切なものはどれですか。

    • 因果関係の逆転や、第3の変数(交絡)の可能性があるため
    • 相関係数は常に 0 から 1 の範囲しかとらないため
    • 相関は直線的な関係しか測定できないため
    • サンプルサイズが大きすぎると相関が消えるため
    【解説を表示】

    正解:因果関係の逆転や、第3の変数(交絡)の可能性があるため

    「相関関係は因果関係を意味しない」は統計学の鉄則です。共通の要因がある場合や、たまたま数字が連動しただけ(偽相関)の場合があります。

    問10:「身長」や「体重」のように、0 が絶対的な無(原点)を意味し、値の比率(2倍など)に意味がある尺度はどれですか。

    • 比率尺度(比例尺度)
    • 間隔尺度
    • 順序尺度
    • 名義尺度
    【解説を表示】

    正解:比率尺度(比例尺度)

    最も情報量が多い尺度です。例えば、摂氏温度(℃)は「0度」が「温度がない」わけではない(氷点下がある)ため「間隔尺度」に分類されますが、身長は「0cm」が「長さがない」ことを意味するので比率尺度です。

  • 統計検定2級練習問題③

    統計検定2級 対策問題(10問セット)

    各問題の「解説を表示」をクリックすると、正解と詳細な解説を確認できます。


    問1:ある製品の故障率が非常に低く、平均して1000時間に1回故障するとします。このとき、1000時間以内にちょうど2回故障する確率を求めるのに最も適した分布はどれですか。

    • ポアソン分布
    • 二項分布
    • 幾何分布
    • 正規分布
    【解説を表示】

    正解:ポアソン分布

    ポアソン分布は、滅多に起こらない稀な事象が、一定の時間や範囲内で何回発生するかを記述するのに適しています。「1000時間に1回」という低い発生率は典型的な例です。

    問2:正規分布 N(μ, σ²) に従う母集団から大きさ n の無作為標本を抽出したとき、標本平均の分散はどのように表されますか。

    • σ² / n
    • σ / √n
    • σ²
    • nσ²
    【解説を表示】

    正解:σ² / n

    標本平均の分散は、母分散(σ²)をサンプルサイズ(n)で割った値になります。サンプルを増やすほど、平均値のバラつきが小さくなることを示しています。

    問3:第1種の過誤(Type I error)の説明として正しいものはどれですか。

    • 帰無仮説が正しいのに、それを棄却してしまうこと
    • 帰無仮説が偽であるのに、それを採択してしまうこと
    • 対立仮説が正しいときに、帰無仮説を棄却すること
    • 有意水準を大きくすることで、防ぎやすくなる誤りのこと
    【解説を表示】

    正解:帰無仮説が正しいのに、それを棄却してしまうこと

    第1種の過誤は「あわてものの誤り」と呼ばれ、真実である帰無仮説を誤って捨ててしまう確率(有意水準 α)を指します。

    問4:相関係数 r が -0.9 である散布図の特徴として適切なものはどれですか。

    • 強い負の相関があり、右下がりの直線に近い形状
    • 強い正の相関があり、右上がりの直線に近い形状
    • 相関がほとんどなく、点がバラバラに散らばっている形状
    • 非線形な関係(放物線など)がある形状
    【解説を表示】

    正解:強い負の相関があり、右下がりの直線に近い形状

    相関係数が -1 に近いほど強い負の相関を意味し、散布図の点は右下がりの直線状に並びます。

    問5:不偏分散を求める際に、データの個数 n ではなく n-1 で割る理由は何ですか。

    • 標本平均を使うことで失われる自由度を考慮し、母分散の推定を不偏にするため
    • 計算を簡略化し、大きな数値を取り扱いやすくするため
    • 標本分散が母分散よりも常に大きくなってしまう傾向を抑えるため
    • 正規分布以外の分布でも一貫した計算結果を得るため
    【解説を表示】

    正解:標本平均を使うことで失われる自由度を考慮し、母分散の推定を不偏にするため

    標本平均を用いると偏差が小さめに見積もられるため、n-1(自由度)で割ることで、期待値が母分散と一致するように補正しています。

    問6:単回帰分析において、決定係数 R² が 0.49 であった場合、相関係数 r の絶対値はいくらですか。

    • 0.7
    • 0.49
    • 0.245
    • 0.3
    【解説を表示】

    正解:0.7

    単回帰では「決定係数 = 相関係数の2乗」なので、√0.49 = 0.7 となります。

    問7:信頼区間の幅を半分にするためには、サンプルサイズ n を何倍にする必要がありますか。

    • 4倍
    • 2倍
    • 8倍
    • 16倍
    【解説を表示】

    正解:4倍

    信頼区間の幅は √n に反比例します。幅を 1/2 にするには、分母を √4 = 2 にする必要があるため、n を 4倍にします。

    問8:共通の原因によって2つの変数に関連があるように見える現象を何と呼びますか。

    • 見せかけの相関(虚偽相関)
    • 自己相関
    • 多重共線性
    • 交互作用
    【解説を表示】

    正解:見せかけの相関(虚偽相関)

    第3の変数(交絡因子)が2つの変数に影響を与えているだけで、直接の因果関係がない状態を指します。

    問9:3行 × 4列の分割表を用いた独立性の検定において、自由度はいくらですか。

    • 6
    • 12
    • 7
    • 5
    【解説を表示】

    正解:6

    分割表の自由度は (行数-1) × (列数-1) で計算します。(3-1) × (4-1) = 2 × 3 = 6 です。

    問10:比較時点(現在)の数量をウェイトとして用いる物価指数の名称はどれですか。

    • パーシェ指数
    • ラスパイレス指数
    • フィッシャー指数
    • ジニ係数
    【解説を表示】

    正解:パーシェ指数

    パーシェ指数は「比較時点(現在)」、ラスパイレス指数は「基準時点(過去)」の数量をウェイトにします。

  • 統計検定2級練習問題②

    【問1:確率密度関数】
    連続型の確率変数において、すべてのとりうる値の範囲で確率密度関数を積分した値は必ずいくつになるか。

    1. 0
    2. 0.5
    3. 1
    4. 無限大
    ▶ 解答を確認する
    正解: 3
    解説:全事象の起こる確率は必ず1(100%)になります。グラフの下側の面積の合計が1になるのが確率密度関数のルールです。

    【問2:ベルヌーイ試行】
    「結果が成功か失敗かの2通りしかない試行」を何というか。

    1. ベルヌーイ試行
    2. ポアソン試行
    3. ガウス試行
    4. マルコフ試行
    ▶ 解答を確認する
    正解: 1
    解説:コインの表裏や合格・不合格など、2値の結果のみを扱う基本単位をベルヌーイ試行と呼びます。

    【問3:二項分布の分散】
    成功確率 p、試行回数 n の二項分布において、分散を表す式はどれか。

    1. np
    2. np(1 – p)
    3. √(np)
    4. n/p
    ▶ 解答を確認する
    正解: 2
    解説:二項分布の期待値は np、分散は np(1 – p) です。公式として暗記必須の項目です。

    【問4:標準正規分布の性質】
    標準正規分布(平均0、分散1)において、値が0以下となる確率はいくらか。

    1. 0
    2. 0.05
    3. 0.5
    4. 1
    ▶ 解答を確認する
    正解: 3
    解説:正規分布は平均値を中心に左右対称な形をしているため、平均(0)より小さい確率はちょうど半分の0.5(50%)となります。

    【問5:標本平均の期待値】
    母平均 μ(ミュー)の母集団から抽出した、サイズ n の標本平均の期待値はいくらになるか。

    1. μ
    2. μ / n
    3. μ / √n
    ▶ 解答を確認する
    正解: 1
    解説:標本平均の期待値は、常に母平均と一致します。これを標本平均の不偏性と呼びます。

    【問6:標準誤差】
    標本平均の標準偏差(ばらつき)を何と呼ぶか。

    1. 不偏分散
    2. 標準誤差
    3. 変動係数
    4. 許容誤差
    ▶ 解答を確認する
    正解: 2
    解説:標本平均の分布の広がり(標準偏差)は「標準誤差(Standard Error)」と呼ばれ、母標準偏差を √n で割った値になります。

    【問7:99%信頼区間】
    信頼水準を 95% から 99% に上げたとき、構築される信頼区間の幅はどう変化するか。

    1. 狭くなる
    2. 広くなる
    3. 変化しない
    4. 半分になる
    ▶ 解答を確認する
    正解: 2
    解説:より確実に(99%の確率で)母数を含めようとすると、その分、区間の幅は広く(余裕を大きく)設定する必要があります。

    【問8:不偏推定量の条件】
    「推定量の期待値が母数に等しい」という性質を何というか。

    1. 一致性
    2. 有効性
    3. 不偏性
    4. 充足性
    ▶ 解答を確認する
    正解: 3
    解説:偏り(バイアス)がない性質を不偏性と呼びます。不偏分散などがその代表例です。

    【問9:大数の法則】
    標本サイズ n を限りなく大きくすると、標本平均は母平均に収束するという法則を何というか。

    1. 中心極限定理
    2. 大数の法則
    3. ベイズの法則
    4. 三数法則
    ▶ 解答を確認する
    正解: 2
    解説:サンプルを増やせば増やすほど、その平均値は真の値(母平均)に近づいていくという法則です。

    【問10:最尤法(さいゆうほう)】
    手元のデータが得られる確率(尤度)を最大にするように母数を推定する方法を何というか。

    1. 最小二乗法
    2. 最尤法
    3. 点推定法
    4. モーメント法
    ▶ 解答を確認する
    正解: 2
    解説:もっともらしい(尤もらしい)値を推定値として採用する、統計学で非常に汎用性の高い推定方法です。
  • 統計検定2級 練習問題

    問1:データの記述】

    変数値 x1​,x2​,…,xn​ の平均値が xˉ、分散が s2 であるとき、すべてのデータに定数 a を足して b 倍した新しいデータ yi​=bxi​+a (ただし b>0)の分散 sy2​ はどのように表されるか。

    1. bs2+a
    2. b2s2+a
    3. bs2
    4. b2s2
    解答

    【正解】 4 【解説】 データの線形変換において、平均値は bxˉ+a となりますが、分散は足し算(平行移動)の影響を受けず、掛け算の2乗倍になります。したがって、sy2​=b2s2 となります。標準偏差であれば bs倍となります。

    【問2:2変数の相関】

    散布図において、すべてのデータ点が右上がりの直線上に完全に並んでいるとき、ピアソンの積率相関係数の値として正しいものはどれか。

    1. 0
    2. 0.5
    3. 1
    4. 不定(計算できない)
    解答

    【正解】 3 【解説】 相関係数は −1 から 1 の値をとります。完全に正の相関(右上がりの直線)がある場合は 1、完全に負の相関(右下がりの直線)がある場合は −1 となります。

    【問3:確率分布】

    期待値 μ=10、分散 σ2=4 の正規分布に従う変数 X について、 P(X≥12) を求めるために標準化を行ったとき、標準正規分布 Z の値として適切なものはどれか。

    1. Z≥0.5
    2. Z≥1.0
    3. Z≥2.0
    4. Z≥4.0
    解答

    【正解】 2 【解説】 標準化の式 Z=σX−μ​ に代入します。 σ=4​=2 なので、 Z=212−10​=22​=1 となります。

    【問4:標本分布】

    母集団の分布が正規分布ではない場合でも、標本サイズ n が十分に大きければ、標本平均 Xˉ の分布は近似的に正規分布に従うという定理を何というか。

    1. 大数の法則
    2. 中心極限定理
    3. ベイズの定理
    4. ガウス=マルコフの定理
    解答

    【正解】 2 【解説】 統計学において最も重要な定理の一つです。元の分布が何であれ、平均の分布は n が大きければ正規分布に近づきます。「大数の法則」は、標本平均が母平均に収束することを指します。

    【問5:推定】

    信頼水準 95% の信頼区間の解釈として、最も適切なものはどれか。

    1. 母数がその区間に入る確率が 95% である。
    2. 同様のサンプリングを100回繰り返したとき、約95回の割合で構築した区間に母数が含まれる。
    3. 標本データの 95% がその区間の中に含まれている。
    4. 次に抽出する1つのデータが 95% の確率でその区間に入る。
    解答

    【正解】 2 【解説】 頻度論的な統計学では、母数は定数であり、動くのは「区間」です。そのため「確率」ではなく「信頼係数(同様の手順を繰り返した時の成功率)」として解釈します。

    【問6:仮説検定】

    P値(有意確率)が 0.03 であった。有意水準 α=0.05 で検定を行うとき、どのような結論になるか。

    1. 帰無仮説を棄却し、対立仮説には有意な差があるとは言えない。
    2. 帰無仮説を棄却できず、有意な差があるとは言えない。
    3. 帰無仮説を棄却し、統計的に有意な差があると言える。
    4. 有意水準がP値より大きいため、検定は失敗である。
    解答

    【正解】 3 【解説】 P値が有意水準 α よりも小さい(P<α)場合、「めったに起こらないことが起きた」と判断し、帰無仮説を棄却して「有意な差がある」と結論付けます。

    【問7:カイ二乗検定】

    2つの名義変数(例:性別と支持政党)の間に、関連性があるかどうかを調べる検定として適切なものはどれか。

    1. 独立性の検定
    2. 適合度の検定
    3. 等分散の検定
    4. 対応のあるt検定
    解答

    【正解】 1 【解説】 分割表(クロス集計表)を用いて、2つの属性が互いに独立かどうかを調べるのが「独立性の検定」です。適合度の検定は、観測された頻度が特定の分布(比率)に一致するかを調べます。

    【問8:線形回帰】

    単回帰分析において、決定係数 R2 が 0.64 であった。このとき、相関係数 r の絶対値として正しいものはどれか。

    1. 0.32
    2. 0.40
    3. 0.64
    4. 0.80
    解答

    【正解】 4 【解説】 単回帰分析において、決定係数は相関係数の2乗に等しくなります(R2=r2)。 0.64​=0.8 となります。

    【問9:分散分析】

    3つ以上の群の平均値に差があるかどうかを検定する「分散分析(ANOVA)」において用いられる統計量はどれか。

    1. z 統計量
    2. t 統計量
    3. F 統計量
    4. χ2 統計量
    解答

    【正解】 3 【解説】 分散分析では、群間のばらつきと群内のばらつきの比をとった「F統計量」を用います。 t 検定は2群の比較に用いられます。

    【問10:時系列・指数】

    ラスパイレス指数とパーシェ指数の違いについて、正しい記述はどれか。

    1. ラスパイレス指数は比較時の数量を、パーシェ指数は基準時の数量を重みに用いる。
    2. ラスパイレス指数は基準時の数量を、パーシェ指数は比較時の数量を重みに用いる。
    3. 両者の幾何平均をとったものを消費者物価指数と呼ぶ。
    4. パーシェ指数は常にラスパイレス指数より大きな値になる。
    解答

    【正解】 2 【解説】 ラスパイレスは「過去(基準時)」の重み、パーシェは「現在(比較時)」の重みを使います。なお、両者の幾何平均は「フィッシャー指数」と呼ばれます。