2級: 2級

  • 計検定練習問題13

    今日は検定を主に問題を出していきます。普段の生活を題材に問題を出しています。 統計検定2級:推定・検定の実践演…

  • 計検定練習問題12

    統計検定2級:確率分野 実戦10選 日常の「偶然」を数字で捉える練習です。全問正解を目指しましょう! 【問1】…

  • 統計検定練習問題11

    統計検定2級:実戦計算演習10選 手を動かして解いてみましょう。試験本番で「あと1点」をもぎ取るための計算ドリ…

  • 統計検定2級 今週の総合復習

    統計検定2級:今週の総復習(厳選10問) 今週の学習、大変お疲れ様でした!間違えた問題は解説を読み込み、公式を…

  • 統計検定2級 練習問題⑦

    統計検定2級 対策問題(3月28日分) 本日は「標本分布の計算」「確率の乗法定理」「情報セキュリティ(サニタイ…

  • 統計検定2級 練習問題⑤

    統計検定2級 対策問題(3月25日分) 本日は「推定・検定」「データの要約」「標本分布」を中心に、実戦で差がつ…

  • 統計検定2級 練習問題④

    統計検定2級 対策問題(3月24日分) 日々の積み重ねが合格への近道です。各問題の「解説を表示」をクリックして…

  • 統計検定2級練習問題③

    統計検定2級 対策問題(10問セット) 各問題の「解説を表示」をクリックすると、正解と詳細な解説を確認できます…

  • 統計検定2級練習問題②

    【問1:確率密度関数】 連続型の確率変数において、すべてのとりうる値の範囲で確率密度関数を積分した値は必ずいく…

  • 統計検定2級 練習問題

    問1:データの記述】 変数値 x1​,x2​,…,xn​ の平均値が xˉ、分散…

  • 計検定練習問題13

    今日は検定を主に問題を出していきます。普段の生活を題材に問題を出しています。

    統計検定2級:推定・検定の実践演習10選

    「この結果に意味はあるのか?」を統計で判断する力を養いましょう。実務でよく使う判定基準を網羅しています。

    【問1】Webサイトの改善(母比率の差の検定)
    ボタンの色を変えたら、クリック率が「2%」から「3%」に上がりました。これが偶然か、それとも意味のある変化かを調べる検定を何と呼びますか?

    解答・解説を表示

    正解:母比率の差の検定
    「割合(%)」に差があるかどうかを判定する手法です。ABテストなどで非常によく使われます。

    【問2】ダイエットサプリ(対応のあるt検定)
    同じ10人に対し、サプリを「飲む前」と「飲んだ後」で体重を測りました。この「前後の差」に意味があるかを調べるのに最適な検定は?

    解答・解説を表示

    正解:対応のあるt検定
    同一人物のデータを比較する場合、個人の体格差をキャンセルできる「対応のある」方を選びます。

    【問3】p値の意味(基本)
    検定の結果、p値(有意確率)が「0.03」でした。有意水準を「5%」としたとき、どのような判定になりますか?

    解答・解説を表示

    正解:有意(差があると言える)
    p値が有意水準(0.05)より小さいので、「偶然とは言い難い(有意である)」と判断し、帰無仮説を棄却します。

    【問4】95%信頼区間(解釈)
    ある商品の満足度を調査し、95%信頼区間が「70%から80%」と出ました。この意味として正しいものは?

    解答・解説を表示

    正解:同じ調査を100回行えば、95回はその区間に本当の値が含まれる
    「今のデータが95%の確率で正しい」という意味ではなく、手法の信頼性を表しています。

    【問5】第1種の過誤(ミス)
    「本当は差がない」のに、間違えて「差がある(有意だ)」と判定してしまうミスを何と呼びますか?

    解答・解説を表示

    正解:第1種の過誤(あわてものの誤り)
    何でもないものを「異常だ!」と判定してしまうミスです。有意水準(アルファ)はこの確率をコントロールするものです。

    【問6】検定力(ベータ)
    「本当は差がある」のに、それを見逃して「差がない」と判定してしまうミスを避けるための指標を何と言いますか?

    解答・解説を表示

    正解:検定力(パワー)
    「1 – 第2種の過誤」で計算されます。サンプルサイズが大きくなると、この検定力も高まります。

    【問7】カイ二乗検定(独立性)
    「男性と女性で、好きな飲み物に違いがあるか?」を分割表で調べる検定を何と呼びますか?

    解答・解説を表示

    正解:独立性の検定(カイ二乗検定)
    2つのカテゴリ変数(性別・飲み物など)に関連があるかどうかを判定します。

    【問8】F検定(分散の比較)
    2つのクラスのテストの「平均点」ではなく、「バラツキ(分散)」に違いがあるかを調べる検定は?

    解答・解説を表示

    正解:F検定
    等分散性の検定(t検定を行う前の準備)としてよく使われます。

    【問9】母平均の推定(t分布)
    母集団の分散がわかっていないとき、少数のサンプルから平均を推定するために使う分布は?

    解答・解説を表示

    正解:t分布
    標準偏差をサンプルから計算した「不偏標準偏差」で代用する場合に登場する分布です。

    【問10】有意水準の引き下げ
    有意水準を「5%」から「1%」に変更しました。このとき、検定の結果は「有意(差がある)」と言いやすくなりますか、それとも厳しくなりますか?

    解答・解説を表示

    正解:厳しくなる
    ハードルを上げる(1%にする)と、よっぽど確実な証拠がない限り「差がある」とは言えなくなります。

    【最重要】統計的推定・検定の攻略ポイント

    1. 問題文の「着眼点」:どの検定を使うか?

    • 「%(割合)」の比較 → 母比率の差の検定
    • 「同じ人の前後」の比較 → 対応のあるt検定
    • 「別々のグループ」の比較 → 対応のないt検定(独立2群)
    • 「表(縦×横)」の関連性 → カイ二乗検定(独立性の検定)
    • 「バラツキ(分散)」の比較 → F検定

    2. 覚えるべき必須の用語・関係性

    用語 意味・ポイント
    p値 < 有意水準 「めったに起きないことが起きた」= 有意(差がある)
    第1種の過誤 差がないのに「差がある」と言ってしまうミス(あわてもの)
    第2種の過誤 差があるのに「差がない」と見逃すミス(ぼんやり)
    自由度 分割表では「(行-1) × (列-1)」。検定統計量を出すために必須

    3. 暗記推奨の「信頼区間」の形

    信頼区間 = 標本平均 ± (信頼係数 × 標準誤差)
    ※95%信頼区間の信頼係数は「1.96」をよく使います(正規分布の場合)。

    検定は「帰無仮説を棄却できるか(=否定できるか)」のゲームだと考えると分かりやすいです!

  • 計検定練習問題12

    統計検定2級:確率分野 実戦10選

    日常の「偶然」を数字で捉える練習です。全問正解を目指しましょう!

    【問1】和事象の確率(重複あり)
    1から10までの番号札が1枚ずつあります。1枚引いたとき、その番号が「2の倍数」または「3の倍数」である確率は?

    解答・解説を表示

    正解:10分の7 (0.7)
    2の倍数は {2, 4, 6, 8, 10} の5通り。3の倍数は {3, 6, 9} の3通り。両方に共通する「6」を1回分引く必要があります。(5 + 3 – 1) / 10 = 7/10 です。

    【問2】余事象の活用
    サイコロを3回投げたとき、少なくとも1回は「1の目」が出る確率は?

    解答・解説を表示

    正解:216分の91
    「少なくとも1回」は「1回も出ない(すべて2〜6)」の反対です。すべて2〜6が出る確率は (5/6)の3乗 = 125/216。これを1から引いて、 1 – 125/216 = 91/216 となります。

    【問3】独立試行の確率
    シュート成功率が80%の選手が2回シュートを打ちます。2回とも外れる確率は?

    解答・解説を表示

    正解:4% (0.04)
    1回外れる確率は20%(0.2)です。独立な試行なので、 0.2 × 0.2 = 0.04 と計算します。

    【問4】条件付き確率
    子供が2人いる家庭があります。少なくとも1人が女の子であるとわかっているとき、2人とも女の子である確率は?(男女の生まれる確率は0.5ずつとします)

    解答・解説を表示

    正解:3分の1
    2人の性別の組み合わせは {男男, 男女, 女男, 女女}。少なくとも1人が女なので「男男」を除いた3通りが分母になります。そのうち2人とも女なのは「女女」の1通りだけなので、 1/3 です。

    【問5】ベイズの定理(簡易版)
    ある病気の検査薬は、病気の人に99%正しく反応します。また、健康な人にも1%の確率で誤反応します。人口の1%がその病気だとしたとき、反応が出た人が本当に病気である確率は?

    解答・解説を表示

    正解:50% (0.5)
    1万人のうち病気は100人。その99人が陽性。健康な9900人のうち1%(99人)も誤陽性。合計198人の陽性のうち、本物は99人なので、 99/198 = 0.5 です。

    【問6】反復試行(ベルヌーイ試行)
    サイコロを4回投げて、ちょうど2回「6の目」が出る確率は?

    解答・解説を表示

    正解:1296分の150
    公式 4C2 × (1/6)の2乗 × (5/6)の2乗 を使います。 6 × (1/36) × (25/36) = 150/1296 です。

    【問7】期待値の計算(賞金)
    当たりが1本(1000円)、ハズレが9本のくじを1回引きます。このくじの期待値は?

    解答・解説を表示

    正解:100円
    (1000円 × 1/10) + (0円 × 9/10) = 100円。統計検定の基礎となる計算です。

    【問8】幾何分布の考え方
    成功率が25%の作業があります。ちょうど3回目に初めて成功する確率は?

    解答・解説を表示

    正解:約14% (0.140625)
    1回目失敗(0.75) × 2回目失敗(0.75) × 3回目成功(0.25) = 0.140625 です。

    【問9】期待値の性質(和)
    サイコロを1個投げた時の期待値は3.5です。サイコロを10個同時に投げたとき、出る目の合計の期待値は?

    解答・解説を表示

    正解:35
    期待値の和は、個々の期待値の和に等しいです。 3.5 × 10 = 35 となります。

    【問10】ポアソン分布の期待値
    ある交差点で1日に平均0.5回事故が起きます。この交差点で2日間(48時間)に起きる事故の回数の期待値は?

    解答・解説を表示

    正解:1回
    ポアソン分布の期待値は期間に比例します。1日あたり0.5回なら、2日間では 0.5 × 2 = 1回です。

    【最短合格】統計検定2級・確率分野の重要ポイントまとめ

    確率の問題でミスを防ぎ、確実に得点を稼ぐための必須知識を整理しました。

    1. 「和事象」は重複に注意!

    「AまたはB」の確率を求める時は、「Aの確率 + Bの確率 – 両方同時に起こる確率」を忘れずに。特に「2の倍数かつ3の倍数(=6の倍数)」のような重なりを引くのが定石です。

    2. 「少なくとも」は余事象

    「少なくとも1回は〇〇」というキーワードを見たら、「1 – (すべて〇〇以外)」を計算しましょう。まともに計算するより圧倒的に早く、正確に答えが出せます。

    3. ポアソン分布と期待値

    ポアソン分布は「期待値(平均)と分散が同じ」という極めて強力な性質があります。これを知っているだけで瞬殺できる問題が2級ではよく出題されます。

    4. 期待値の線形性

    「合計の期待値 = 期待値の合計」です。サイコロ10個の平均値を出すとき、難しい式は不要。1個の期待値(3.5)を10倍するだけで答えに辿り着けます。

    ※統計検定2級の確率は、公式を覚えるだけでなく「どのシチュエーションでどの公式を使うか」の判断が重要です。

  • 統計検定練習問題11

    統計検定2級:実戦計算演習10選

    手を動かして解いてみましょう。試験本番で「あと1点」をもぎ取るための計算ドリルです。

    【問1】エレベーターの安全荷重
    1人の体重の平均が65キロ、標準偏差が10キロです。このエレベーターに4人乗ったとき、4人の「合計体重」が280キロを超える確率は?(4人の合計は、平均260キロ、標準偏差20キロの正規分布に従うものとします)

    解答・解説を表示

    正解:約16%
    標準化の計算をします。 (280 – 260) / 20 = 1。つまり「平均より標準偏差1個分大きい値」以上になる確率を求めます。正規分布表より、1シグマより外側(片側)は約16%となります。

    【問2】2つの変数の期待値
    変数Aの期待値が10、変数Bの期待値が20です。新しい変数「C = 2A + B」を作ったとき、Cの期待値はいくつになりますか?

    解答・解説を表示

    正解:40
    期待値の計算:2 × 10 + 20 = 40。期待値はそのまま式通りに計算してOKです。

    【問3】2つの変数の分散
    独立な変数A(分散9)と変数B(分散16)があります。この2つを足した「A + B」の標準偏差はいくらですか?

    解答・解説を表示

    正解:5
    まず分散を足します。 9 + 16 = 25。標準偏差はそのルートなので、√25 = 5 となります。標準偏差をそのまま足して3+4=7にしないよう注意!

    【問4】コイン投げの分散
    コインを100回投げたとき、表が出る回数の「分散」を求めてください。(表が出る確率は0.5とします)

    解答・解説を表示

    正解:25
    二項分布の分散公式「回数 × 確率 × (1 – 確率)」を使います。 100 × 0.5 × 0.5 = 25 です。

    【問5】偏差値の逆算
    平均50点、標準偏差10点のテストで、偏差値が70だった人の実際の点数は何点ですか?

    解答・解説を表示

    正解:70点
    偏差値70は「平均より標準偏差2個分上」という意味です。 50 + (10 × 2) = 70点となります。

    【問6】ポアソン分布の計算
    1時間に平均2回着信がある電話があります。この電話の「着信回数の分散」はいくつですか?

    解答・解説を表示

    正解:2
    ポアソン分布の最大の特徴は「期待値と分散が同じ」ことです。平均が2なら分散も2です。計算いらずのサービス問題です。

    【問7】相関係数の二乗
    2つのデータの相関係数が「-0.8」でした。このときの決定係数(寄与率)は何%ですか?

    解答・解説を表示

    正解:64%
    決定係数は相関係数を二乗したものです。 (-0.8) × (-0.8) = 0.64。 つまり64%となります。マイナスが消える点に注目。

    【問8】標本平均の標準偏差
    標準偏差が20の母集団から、100個のサンプルを取り出しました。このとき、サンプル平均の標準偏差(標準誤差)はいくつになりますか?

    解答・解説を表示

    正解:2
    公式「母標準偏差 / √サンプル数」を使います。 20 / √100 = 20 / 10 = 2 となります。

    【問9】カイ二乗検定の自由度
    「3行 × 4列」の分割表を使って独立性の検定を行います。このときの自由度はいくつですか?

    解答・解説を表示

    正解:6
    自由度の公式「(行の数 – 1) × (列の数 – 1)」を使います。 (3-1) × (4-1) = 2 × 3 = 6 です。

    【問10】変動係数の計算
    平均が200、標準偏差が10のグループがあります。このグループの「変動係数」を求めてください。

    解答・解説を表示

    正解:0.05 (5%)
    変動係数は「標準偏差 / 平均」で求めます。 10 / 200 = 0.05 です。単位の違うもの同士のバラツキを比べる時に使います。

  • 統計検定2級 今週の総合復習

    統計検定2級:今週の総復習(厳選10問)

    今週の学習、大変お疲れ様でした!間違えた問題は解説を読み込み、公式を指差し確認しましょう。


    問1:母平均 μ、母分散 σ² の母集団から、大きさ n の無作為標本を抽出したとき、標本平均 $\bar{X}$ の分散 $V(\bar{X})$ はいくらになりますか。

    • σ² / n
    • σ / √n
    • σ²
    • nσ²
    【解説を確認】

    正解:σ² / n

    これは「標本平均は、データを集めれば集めるほど真の値(母平均)の周りに集まり、バラつきが小さくなる」という統計学の根幹を支える性質です。

    問2:母分散の推定値として「不偏分散」を計算する際、偏差平方和を割る値(自由度)として正しいものはどれですか。

    • n – 1
    • n
    • n + 1
    • √n
    【解説を確認】

    正解:n – 1

    単なる「標本分散(nで割る)」は、母分散を少し小さめに推定してしまうクセ(偏り)があります。n-1 で割ることで、その偏りを取り除いた「不偏」な推定が可能になります。

    問3:母分散が未知で、サンプルサイズが小さい(n=10など)場合に、母平均の検定に用いる分布はどれですか。

    • t分布
    • 標準正規分布(Z分布)
    • カイ二乗分布
    • F分布
    【解説を確認】

    正解:t分布

    「母分散がわからない」かつ「サンプルが少ない」ときは、正規分布よりも裾の長いt分布を使います。サンプルサイズが大きくなれば、t分布は正規分布に近づいていきます。

    問4:仮説検定において、「実際には差があるのに、有意な差がないと誤って判断してしまうこと」を何と呼びますか。

    • 第2種の過誤
    • 第1種の過誤
    • 有意水準
    • 信頼係数
    【解説を確認】

    正解:第2種の過誤

    本当は効果があるのに「効果なし」と見逃してしまうミスです。一方、効果がないのに「効果あり」と言ってしまうのが第1種の過誤です。

    問5:期待値(平均)が λ であるポアソン分布において、その「分散」はいくらになりますか。

    • λ
    • λ²
    • √λ
    • 1 / λ
    【解説を確認】

    正解:λ

    ポアソン分布は「平均と分散が等しい」という非常にユニークな性質を持っています。試験で計算の手間を省ける重要知識です。

    問6:「A店・B店・C店の3店舗間で、客単価の平均値に差があるか」を一度に検定したい場合、最適な手法はどれですか。

    • 一元配置分散分析
    • 対応のあるt検定
    • 独立性の検定(カイ二乗検定)
    • 単回帰分析
    【解説を確認】

    正解:一元配置分散分析

    3つ以上の群の平均値を比較するときは、t検定を繰り返すのではなく分散分析(ANOVA)を行います。F検定を利用するのが特徴です。

    問7:事象 A と事象 B が独立であるとき、$P(A \cap B)$ を求める式として正しいものはどれですか。

    • P(A) × P(B)
    • P(A) + P(B)
    • P(A | B)
    • P(A) + P(B) – P(A \cap B)
    【解説を確認】

    正解:P(A) × P(B)

    独立事象(お互いに影響しない)であれば、同時に起こる確率は単純に掛け算で求まります。サイコロを2回振るようなイメージです。

    問8:重回帰分析において、説明変数を増やすほど値が勝手に上がってしまう決定係数の弱点を補う指標を何と呼びますか。

    • 自由度調整済み決定係数
    • 寄与率
    • 標準化係数
    • VIF(分散膨張係数)
    【解説を確認】

    正解:自由度調整済み決定係数

    無意味な変数をたくさん入れると、見かけ上の「当てはまり」が良くなってしまいます。それを防ぐために変数の数に応じてペナルティを課した指標です。

    問9:箱ひげ図において、中央の「箱(ボックス)」の長さは何を表していますか。

    • 四分位範囲(IQR)
    • 範囲(レンジ)
    • 標準偏差
    • 平均偏差
    【解説を確認】

    正解:四分位範囲(IQR)

    箱の上端(第3四分位数)から下端(第1四分位数)までの距離であり、全データの真ん中50%が収まっている範囲を示します。

    問10:信頼区間の幅を「半分」にするためには、サンプルサイズ n を何倍にする必要がありますか。

    • 4倍
    • 2倍
    • 8倍
    • 16倍
    【解説を確認】

    正解:4倍

    信頼区間の幅は $1/\sqrt{n}$ に比例します。幅を $1/2$ にするには、分母の $\sqrt{n}$ を 2 にすればよいので、$n$ は $2^2 = 4$ 倍にする必要があります。

  • 統計検定2級 練習問題⑦

    統計検定2級 対策問題(3月28日分)

    本日は「標本分布の計算」「確率の乗法定理」「情報セキュリティ(サニタイジング)」など、実践的な内容を中心に出題します。


    問1:母分散 σ² = 100 の母集団から、サンプルサイズ n = 25 の標本を抽出したとき、標本平均の標準誤差(SE)はいくらですか。

    • 2
    • 4
    • 10
    • 20
    【解説を表示】

    正解:2

    標準誤差は √(σ² / n) で求められます。√ (100 / 25) = √4 = 2 となります。分散(4)と標準誤差(2)を混同しないようにしましょう。

    問2:事象Aが起こったという条件の下で事象Bが起こる「条件付き確率 P(B|A)」を求める式として正しいものはどれですか。

    • P(A ∩ B) / P(A)
    • P(A ∩ B) / P(B)
    • P(A) × P(B)
    • P(A) + P(B)
    【解説を表示】

    正解:P(A ∩ B) / P(A)

    条件となる事象Aの確率 P(A) を分母に置きます。ベイズの定理の基礎となる非常に重要な公式です。

    問3:クロスサイトスクリプティング(XSS)を防ぐために、ユーザーが入力した「<」や「>」などの特殊文字を無害な文字列に変換する処理を何と呼びますか。

    • サニタイジング(エスケープ処理)
    • フィルタリング
    • ハッシング
    • ソルト(Salt)
    【解説を表示】

    正解:サニタイジング(エスケープ処理)

    プログラムとして実行されないように「消毒」するイメージです。WordPressでも、出力前に `esc_html()` などの関数を使ってこの処理を行うのが基本です。

    問4:ある標本の偏差平方和(SS)が 100、サンプルサイズ n が 5 のとき、この標本の「不偏分散」の値はいくらですか。

    • 25
    • 20
    • 4
    • 5
    【解説を表示】

    正解:25

    不偏分散は 偏差平方和 / (n – 1) で求めます。100 / (5 – 1) = 100 / 4 = 25 です。5で割ってしまうと「標本分散(20)」になり、母分散を過小評価してしまいます。

    問5:3つの群(各群のサンプルサイズは 10)に対して一元配置分散分析を行うとき、「群間」の自由度はいくらですか。

    • 2
    • 3
    • 9
    • 27
    【解説を表示】

    正解:2

    群間の自由度は(水準数 – 1)で求めます。3つの群があるため、3 – 1 = 2 です。ちなみに群内の自由度は(全体数 – 水準数)で、30 – 3 = 27 となります。

    問6:相関係数 r = -0.5 であるとき、決定係数 R² はいくらですか。

    • 0.25
    • -0.25
    • 0.5
    • -0.5
    【解説を表示】

    正解:0.25

    決定係数は相関係数の2乗です。(-0.5) × (-0.5) = 0.25 となり、マイナスにはなりません。

    問7:正規分布において、平均 μ から左右に 2σ(標準偏差の2倍)の範囲内に、全データの約何%が含まれますか。

    • 約 95%
    • 約 68%
    • 約 99%
    • 約 50%
    【解説を表示】

    正解:約 95%

    正確には ±1.96σ の範囲が 95% です。±1σ は約 68%、±3σ は約 99.7% となります。これらは頻出の数値です。

    問8:「実際には母集団の間に差があるのに、有意な差がないと判断してしまう誤り」を何と呼びますか。

    • 第2種の過誤(β)
    • 第1種の過誤(α)
    • 検出力(1-β)
    • 信頼係数
    【解説を表示】

    正解:第2種の過誤(β)

    差を見逃してしまう「ぼんやりものの誤り」です。一方、差がないのに差があると言ってしまうのは「第1種の過誤」です。

    問9:箱ひげ図において、箱(ボックス)の長さが表している指標は何ですか。

    • 四分位範囲(IQR)
    • 標準偏差
    • 中央値
    • 範囲(最大値 – 最小値)
    【解説を表示】

    正解:四分位範囲(IQR)

    箱の上下(左右)の端は第1四分位数と第3四分位数を表しており、その差である四分位範囲が箱の長さになります。

    問10:重回帰分析において、説明変数同士に強い相関があることで、係数の推定が不安定になる現象を何と呼びますか。

    • 多重共線性(マルチコ)
    • 自己相関
    • 不均一分散
    • 偽相関
    【解説を表示】

    正解:多重共線性(マルチコ)

    似たような情報を表す変数を同時に入れると発生します。これを防ぐには、相関の強すぎる変数を片方除外するなどの対策が必要です。

  • 統計検定2級 練習問題⑤

    統計検定2級 対策問題(3月25日分)

    本日は「推定・検定」「データの要約」「標本分布」を中心に、実戦で差がつくポイントを厳選しました。


    問1:平均 μ = 50、標準偏差 σ = 10 の正規分布に従うデータ x を、平均 0、分散 1 の標準正規分布に変換する「標準化」の式として正しいものはどれですか。

    • (x – 50) / 10
    • (x – 10) / 50
    • 10(x – 50)
    • (x – 50)² / 10
    【解説を表示】

    正解:(x – 50) / 10

    標準化の基本式は z = (x – μ) / σ です。各データから平均を引いて標準偏差で割ることで、異なる単位のデータを比較可能な「zスコア」に変換できます。

    問2:右側に長い裾を持つ分布(正の歪みがある分布)において、平均値と中央値の関係として一般的なものはどれですか。

    • 平均値 > 中央値
    • 平均値 < 中央値
    • 平均値 = 中央値
    • 分布の形状に関わらず常に一定である
    【解説を表示】

    正解:平均値 > 中央値

    右側に極端に大きな値がある場合、平均値はその外れ値に引きずられて大きくなりますが、中央値は順位に基づくため影響が限定的です。所得分布などが典型的な例です。

    問3:2つの独立した母集団の平均値の差を検定する際、母分散が等しいと仮定できる場合に使用される統計量はどれですか。

    • プールした分散を用いたt統計量
    • ウェルチのt統計量
    • F統計量
    • カイ二乗統計量
    【解説を表示】

    正解:プールした分散を用いたt統計量

    等分散性が仮定できる場合は、2つの標本分散を重み付き平均した「プールした分散」を使います。等分散が仮定できない場合は「ウェルチ(Welch)のt検定」を用います。

    問4:母比率 p、サンプルサイズ n のとき、標本比率 ^p(ピーハット)の分散はどのように表されますか。

    • p(1 – p) / n
    • np(1 – p)
    • √[p(1 – p) / n]
    • p / n
    【解説を表示】

    正解:p(1 – p) / n

    二項分布の分散 np(1-p) を n² で割ることで、比率の分散が求まります。区間推定の公式のルートの中身として頻出です。

    問5:正規分布を用いた95%信頼区間の推定において、信頼区間の幅を決定する係数(z値)として近似的に用いられる値はどれですか。

    • 1.96
    • 2.58
    • 1.65
    • 1.00
    【解説を表示】

    正解:1.96

    95%信頼区間では 1.96、99%では 2.58、90%では 1.65 を使用します。これらの数値は正規分布表を見なくても即答できるようにしておきましょう。

    問6:すべてのデータに対して y = -3x + 10 という完璧な負の直線関係が成り立つとき、x と y の相関係数 r はいくらですか。

    • -1
    • 1
    • -3
    • 0
    【解説を表示】

    正解:-1

    相関係数は直線の「傾きの大きさ」ではなく「直線性への集中の度合い」を表します。完璧な右下がりの直線であれば、傾きが -3 であっても -100 であっても相関係数は -1 です。

    問7:検定の結果、p値(有意確率)が 0.03 でした。有意水準 α = 0.05 で検定を行う場合、どのような判断を下しますか。

    • 帰無仮説を棄却し、対立仮説を採択する(有意な差がある)
    • 帰無仮説を採択する(有意な差があるとはいえない)
    • 有意水準を 0.01 に変更して再検定する
    • 検定は失敗であり、サンプルサイズを増やすべきである
    【解説を表示】

    正解:帰無仮説を棄却し、対立仮説を採択する(有意な差がある)

    p値 < 有意水準 α となる場合、その結果は「めったに起こらないことが起きた」と判断し、帰無仮説を捨てます。

    問8:異なる単位(例:cm と kg)を持つデータのバラつき具合を比較するために用いられる、標準偏差を平均値で割った指標を何と呼びますか。

    • 変動係数
    • 相関係数
    • 決定係数
    • 不偏分散
    【解説を表示】

    正解:変動係数

    変動係数 = 標準偏差 / 平均 です。単位に依存しないため、「ゾウの体重の個体差」と「ネズミの体重の個体差」を比較するような場合に有効です。

    問9:サイコロを60回振って、各目が均等に出ているかどうかを調べるために最適な検定手法はどれですか。

    • カイ二乗検定(適合度検定)
    • t検定
    • F検定
    • Z検定
    【解説を表示】

    正解:カイ二乗検定(適合度検定)

    「観測された頻度」が「理論上の期待頻度」とどれくらいズレているかを調べるには、カイ二乗統計量を用いた適合度検定が使われます。

    問10:2つの独立な変数 X と Y について、E(X) = 2, E(Y) = 3 のとき、E(X + Y) の値はいくらになりますか。

    • 5
    • 6
    • 1
    • 独立でないと計算できない
    【解説を表示】

    正解:5

    期待値には「線形性」があり、E(X + Y) = E(X) + E(Y) が常に成り立ちます。分散の場合は独立性が条件となりますが、期待値は独立でなくても足し算が可能です。

  • 統計検定2級 練習問題④

    統計検定2級 対策問題(3月24日分)

    日々の積み重ねが合格への近道です。各問題の「解説を表示」をクリックして、知識を定着させましょう。


    問1:事象Aと事象Bが「独立」であるとき、事象Aと事象Bが同時に起こる確率 P(A ∩ B) を求める式として正しいものはどれですか。

    • P(A) × P(B)
    • P(A) + P(B)
    • P(A) + P(B) – P(A ∩ B)
    • P(A | B)
    【解説を表示】

    正解:P(A) × P(B)

    2つの事象が独立(互いに影響し合わない)であれば、同時確率はそれぞれの確率の「積」で求められます。足し算(加法定理)と混同しないよう注意しましょう。

    問2:母集団の分布がどのような形状であっても、サンプルサイズ n が十分に大きいとき、標本平均の分布は近似的にどのような分布に従いますか。

    • 正規分布
    • 二項分布
    • カイ二乗分布
    • t分布
    【解説を表示】

    正解:正規分布

    これを「中心極限定理」と呼びます。元の分布が歪んでいても、平均をとればその分布は正規分布に近づくという、統計学において最も重要な定理の一つです。

    問3:母分散が未知でサンプルサイズが小さい場合、母平均の検定に用いられる分布はどれですか。

    • t分布
    • 標準正規分布(Z分布)
    • F分布
    • ポアソン分布
    【解説を表示】

    正解:t分布

    母分散がわからないときは、代わりに不偏分散を使用するため、正規分布よりも裾の長い「t分布」を使用します。

    問4:「不偏分散」の期待値は、母集団のどの値と一致するように設計されていますか。

    • 母分散(σ²)
    • 母標準偏差(σ)
    • 母平均(μ)
    • 標本分散
    【解説を表示】

    正解:母分散(σ²)

    「不偏」とは、平均的に見て(期待値が)真の値と一致することを意味します。n-1 で割ることで、母分散を偏りなく推定できるようになります。

    問5:変数 X の分散が V(X) = 10 であるとき、変数 Y = 2X + 5 の分散 V(Y) はいくらになりますか。

    • 40
    • 20
    • 25
    • 45
    【解説を表示】

    正解:40

    分散の性質 V(aX + b) = a²V(X) を用います。今回の場合は 2の2乗(=4)倍になるため、4 × 10 = 40 です。定数項(+5)は分散(散らばり)には影響しません。

    問6:統計的仮説検定において、「差がない」や「効果がない」という前提で立てられる仮説を何と呼びますか。

    • 帰無仮説(H0)
    • 対立仮説(H1)
    • 有意仮説
    • 基本仮説
    【解説を表示】

    正解:帰無仮説(H0)

    「無に帰すべき仮説」という意味です。これを否定(棄却)することで、本当に言いたいこと(対立仮説)を証明する手続きをとります。

    問7:成功確率 p = 0.2 の試行を 100回 繰り返したとき(二項分布)、成功回数の期待値はいくらですか。

    • 20
    • 80
    • 0.2
    • 4
    【解説を表示】

    正解:20

    二項分布 B(n, p) の期待値は np で求められます。100 × 0.2 = 20 です。ちなみに分散は np(1-p) で、100 × 0.2 × 0.8 = 16 となります。

    問8:「2つの母集団の分散が等しいかどうか」を検定(等分散性の検定)する際に用いられる分布はどれですか。

    • F分布
    • カイ二乗分布
    • 正規分布
    • 二項分布
    【解説を表示】

    正解:F分布

    2つの分散の「比」が従う分布がF分布です。分散分析(ANOVA)などでも重要な役割を果たします。

    問9:相関係数が高いからといって、必ずしも一方が他方の原因であるとは限らない理由として適切なものはどれですか。

    • 因果関係の逆転や、第3の変数(交絡)の可能性があるため
    • 相関係数は常に 0 から 1 の範囲しかとらないため
    • 相関は直線的な関係しか測定できないため
    • サンプルサイズが大きすぎると相関が消えるため
    【解説を表示】

    正解:因果関係の逆転や、第3の変数(交絡)の可能性があるため

    「相関関係は因果関係を意味しない」は統計学の鉄則です。共通の要因がある場合や、たまたま数字が連動しただけ(偽相関)の場合があります。

    問10:「身長」や「体重」のように、0 が絶対的な無(原点)を意味し、値の比率(2倍など)に意味がある尺度はどれですか。

    • 比率尺度(比例尺度)
    • 間隔尺度
    • 順序尺度
    • 名義尺度
    【解説を表示】

    正解:比率尺度(比例尺度)

    最も情報量が多い尺度です。例えば、摂氏温度(℃)は「0度」が「温度がない」わけではない(氷点下がある)ため「間隔尺度」に分類されますが、身長は「0cm」が「長さがない」ことを意味するので比率尺度です。

  • 統計検定2級練習問題③

    統計検定2級 対策問題(10問セット)

    各問題の「解説を表示」をクリックすると、正解と詳細な解説を確認できます。


    問1:ある製品の故障率が非常に低く、平均して1000時間に1回故障するとします。このとき、1000時間以内にちょうど2回故障する確率を求めるのに最も適した分布はどれですか。

    • ポアソン分布
    • 二項分布
    • 幾何分布
    • 正規分布
    【解説を表示】

    正解:ポアソン分布

    ポアソン分布は、滅多に起こらない稀な事象が、一定の時間や範囲内で何回発生するかを記述するのに適しています。「1000時間に1回」という低い発生率は典型的な例です。

    問2:正規分布 N(μ, σ²) に従う母集団から大きさ n の無作為標本を抽出したとき、標本平均の分散はどのように表されますか。

    • σ² / n
    • σ / √n
    • σ²
    • nσ²
    【解説を表示】

    正解:σ² / n

    標本平均の分散は、母分散(σ²)をサンプルサイズ(n)で割った値になります。サンプルを増やすほど、平均値のバラつきが小さくなることを示しています。

    問3:第1種の過誤(Type I error)の説明として正しいものはどれですか。

    • 帰無仮説が正しいのに、それを棄却してしまうこと
    • 帰無仮説が偽であるのに、それを採択してしまうこと
    • 対立仮説が正しいときに、帰無仮説を棄却すること
    • 有意水準を大きくすることで、防ぎやすくなる誤りのこと
    【解説を表示】

    正解:帰無仮説が正しいのに、それを棄却してしまうこと

    第1種の過誤は「あわてものの誤り」と呼ばれ、真実である帰無仮説を誤って捨ててしまう確率(有意水準 α)を指します。

    問4:相関係数 r が -0.9 である散布図の特徴として適切なものはどれですか。

    • 強い負の相関があり、右下がりの直線に近い形状
    • 強い正の相関があり、右上がりの直線に近い形状
    • 相関がほとんどなく、点がバラバラに散らばっている形状
    • 非線形な関係(放物線など)がある形状
    【解説を表示】

    正解:強い負の相関があり、右下がりの直線に近い形状

    相関係数が -1 に近いほど強い負の相関を意味し、散布図の点は右下がりの直線状に並びます。

    問5:不偏分散を求める際に、データの個数 n ではなく n-1 で割る理由は何ですか。

    • 標本平均を使うことで失われる自由度を考慮し、母分散の推定を不偏にするため
    • 計算を簡略化し、大きな数値を取り扱いやすくするため
    • 標本分散が母分散よりも常に大きくなってしまう傾向を抑えるため
    • 正規分布以外の分布でも一貫した計算結果を得るため
    【解説を表示】

    正解:標本平均を使うことで失われる自由度を考慮し、母分散の推定を不偏にするため

    標本平均を用いると偏差が小さめに見積もられるため、n-1(自由度)で割ることで、期待値が母分散と一致するように補正しています。

    問6:単回帰分析において、決定係数 R² が 0.49 であった場合、相関係数 r の絶対値はいくらですか。

    • 0.7
    • 0.49
    • 0.245
    • 0.3
    【解説を表示】

    正解:0.7

    単回帰では「決定係数 = 相関係数の2乗」なので、√0.49 = 0.7 となります。

    問7:信頼区間の幅を半分にするためには、サンプルサイズ n を何倍にする必要がありますか。

    • 4倍
    • 2倍
    • 8倍
    • 16倍
    【解説を表示】

    正解:4倍

    信頼区間の幅は √n に反比例します。幅を 1/2 にするには、分母を √4 = 2 にする必要があるため、n を 4倍にします。

    問8:共通の原因によって2つの変数に関連があるように見える現象を何と呼びますか。

    • 見せかけの相関(虚偽相関)
    • 自己相関
    • 多重共線性
    • 交互作用
    【解説を表示】

    正解:見せかけの相関(虚偽相関)

    第3の変数(交絡因子)が2つの変数に影響を与えているだけで、直接の因果関係がない状態を指します。

    問9:3行 × 4列の分割表を用いた独立性の検定において、自由度はいくらですか。

    • 6
    • 12
    • 7
    • 5
    【解説を表示】

    正解:6

    分割表の自由度は (行数-1) × (列数-1) で計算します。(3-1) × (4-1) = 2 × 3 = 6 です。

    問10:比較時点(現在)の数量をウェイトとして用いる物価指数の名称はどれですか。

    • パーシェ指数
    • ラスパイレス指数
    • フィッシャー指数
    • ジニ係数
    【解説を表示】

    正解:パーシェ指数

    パーシェ指数は「比較時点(現在)」、ラスパイレス指数は「基準時点(過去)」の数量をウェイトにします。

  • 統計検定2級練習問題②

    【問1:確率密度関数】
    連続型の確率変数において、すべてのとりうる値の範囲で確率密度関数を積分した値は必ずいくつになるか。

    1. 0
    2. 0.5
    3. 1
    4. 無限大
    ▶ 解答を確認する
    正解: 3
    解説:全事象の起こる確率は必ず1(100%)になります。グラフの下側の面積の合計が1になるのが確率密度関数のルールです。

    【問2:ベルヌーイ試行】
    「結果が成功か失敗かの2通りしかない試行」を何というか。

    1. ベルヌーイ試行
    2. ポアソン試行
    3. ガウス試行
    4. マルコフ試行
    ▶ 解答を確認する
    正解: 1
    解説:コインの表裏や合格・不合格など、2値の結果のみを扱う基本単位をベルヌーイ試行と呼びます。

    【問3:二項分布の分散】
    成功確率 p、試行回数 n の二項分布において、分散を表す式はどれか。

    1. np
    2. np(1 – p)
    3. √(np)
    4. n/p
    ▶ 解答を確認する
    正解: 2
    解説:二項分布の期待値は np、分散は np(1 – p) です。公式として暗記必須の項目です。

    【問4:標準正規分布の性質】
    標準正規分布(平均0、分散1)において、値が0以下となる確率はいくらか。

    1. 0
    2. 0.05
    3. 0.5
    4. 1
    ▶ 解答を確認する
    正解: 3
    解説:正規分布は平均値を中心に左右対称な形をしているため、平均(0)より小さい確率はちょうど半分の0.5(50%)となります。

    【問5:標本平均の期待値】
    母平均 μ(ミュー)の母集団から抽出した、サイズ n の標本平均の期待値はいくらになるか。

    1. μ
    2. μ / n
    3. μ / √n
    ▶ 解答を確認する
    正解: 1
    解説:標本平均の期待値は、常に母平均と一致します。これを標本平均の不偏性と呼びます。

    【問6:標準誤差】
    標本平均の標準偏差(ばらつき)を何と呼ぶか。

    1. 不偏分散
    2. 標準誤差
    3. 変動係数
    4. 許容誤差
    ▶ 解答を確認する
    正解: 2
    解説:標本平均の分布の広がり(標準偏差)は「標準誤差(Standard Error)」と呼ばれ、母標準偏差を √n で割った値になります。

    【問7:99%信頼区間】
    信頼水準を 95% から 99% に上げたとき、構築される信頼区間の幅はどう変化するか。

    1. 狭くなる
    2. 広くなる
    3. 変化しない
    4. 半分になる
    ▶ 解答を確認する
    正解: 2
    解説:より確実に(99%の確率で)母数を含めようとすると、その分、区間の幅は広く(余裕を大きく)設定する必要があります。

    【問8:不偏推定量の条件】
    「推定量の期待値が母数に等しい」という性質を何というか。

    1. 一致性
    2. 有効性
    3. 不偏性
    4. 充足性
    ▶ 解答を確認する
    正解: 3
    解説:偏り(バイアス)がない性質を不偏性と呼びます。不偏分散などがその代表例です。

    【問9:大数の法則】
    標本サイズ n を限りなく大きくすると、標本平均は母平均に収束するという法則を何というか。

    1. 中心極限定理
    2. 大数の法則
    3. ベイズの法則
    4. 三数法則
    ▶ 解答を確認する
    正解: 2
    解説:サンプルを増やせば増やすほど、その平均値は真の値(母平均)に近づいていくという法則です。

    【問10:最尤法(さいゆうほう)】
    手元のデータが得られる確率(尤度)を最大にするように母数を推定する方法を何というか。

    1. 最小二乗法
    2. 最尤法
    3. 点推定法
    4. モーメント法
    ▶ 解答を確認する
    正解: 2
    解説:もっともらしい(尤もらしい)値を推定値として採用する、統計学で非常に汎用性の高い推定方法です。
  • 統計検定2級 練習問題

    問1:データの記述】

    変数値 x1​,x2​,…,xn​ の平均値が xˉ、分散が s2 であるとき、すべてのデータに定数 a を足して b 倍した新しいデータ yi​=bxi​+a (ただし b>0)の分散 sy2​ はどのように表されるか。

    1. bs2+a
    2. b2s2+a
    3. bs2
    4. b2s2
    解答

    【正解】 4 【解説】 データの線形変換において、平均値は bxˉ+a となりますが、分散は足し算(平行移動)の影響を受けず、掛け算の2乗倍になります。したがって、sy2​=b2s2 となります。標準偏差であれば bs倍となります。

    【問2:2変数の相関】

    散布図において、すべてのデータ点が右上がりの直線上に完全に並んでいるとき、ピアソンの積率相関係数の値として正しいものはどれか。

    1. 0
    2. 0.5
    3. 1
    4. 不定(計算できない)
    解答

    【正解】 3 【解説】 相関係数は −1 から 1 の値をとります。完全に正の相関(右上がりの直線)がある場合は 1、完全に負の相関(右下がりの直線)がある場合は −1 となります。

    【問3:確率分布】

    期待値 μ=10、分散 σ2=4 の正規分布に従う変数 X について、 P(X≥12) を求めるために標準化を行ったとき、標準正規分布 Z の値として適切なものはどれか。

    1. Z≥0.5
    2. Z≥1.0
    3. Z≥2.0
    4. Z≥4.0
    解答

    【正解】 2 【解説】 標準化の式 Z=σX−μ​ に代入します。 σ=4​=2 なので、 Z=212−10​=22​=1 となります。

    【問4:標本分布】

    母集団の分布が正規分布ではない場合でも、標本サイズ n が十分に大きければ、標本平均 Xˉ の分布は近似的に正規分布に従うという定理を何というか。

    1. 大数の法則
    2. 中心極限定理
    3. ベイズの定理
    4. ガウス=マルコフの定理
    解答

    【正解】 2 【解説】 統計学において最も重要な定理の一つです。元の分布が何であれ、平均の分布は n が大きければ正規分布に近づきます。「大数の法則」は、標本平均が母平均に収束することを指します。

    【問5:推定】

    信頼水準 95% の信頼区間の解釈として、最も適切なものはどれか。

    1. 母数がその区間に入る確率が 95% である。
    2. 同様のサンプリングを100回繰り返したとき、約95回の割合で構築した区間に母数が含まれる。
    3. 標本データの 95% がその区間の中に含まれている。
    4. 次に抽出する1つのデータが 95% の確率でその区間に入る。
    解答

    【正解】 2 【解説】 頻度論的な統計学では、母数は定数であり、動くのは「区間」です。そのため「確率」ではなく「信頼係数(同様の手順を繰り返した時の成功率)」として解釈します。

    【問6:仮説検定】

    P値(有意確率)が 0.03 であった。有意水準 α=0.05 で検定を行うとき、どのような結論になるか。

    1. 帰無仮説を棄却し、対立仮説には有意な差があるとは言えない。
    2. 帰無仮説を棄却できず、有意な差があるとは言えない。
    3. 帰無仮説を棄却し、統計的に有意な差があると言える。
    4. 有意水準がP値より大きいため、検定は失敗である。
    解答

    【正解】 3 【解説】 P値が有意水準 α よりも小さい(P<α)場合、「めったに起こらないことが起きた」と判断し、帰無仮説を棄却して「有意な差がある」と結論付けます。

    【問7:カイ二乗検定】

    2つの名義変数(例:性別と支持政党)の間に、関連性があるかどうかを調べる検定として適切なものはどれか。

    1. 独立性の検定
    2. 適合度の検定
    3. 等分散の検定
    4. 対応のあるt検定
    解答

    【正解】 1 【解説】 分割表(クロス集計表)を用いて、2つの属性が互いに独立かどうかを調べるのが「独立性の検定」です。適合度の検定は、観測された頻度が特定の分布(比率)に一致するかを調べます。

    【問8:線形回帰】

    単回帰分析において、決定係数 R2 が 0.64 であった。このとき、相関係数 r の絶対値として正しいものはどれか。

    1. 0.32
    2. 0.40
    3. 0.64
    4. 0.80
    解答

    【正解】 4 【解説】 単回帰分析において、決定係数は相関係数の2乗に等しくなります(R2=r2)。 0.64​=0.8 となります。

    【問9:分散分析】

    3つ以上の群の平均値に差があるかどうかを検定する「分散分析(ANOVA)」において用いられる統計量はどれか。

    1. z 統計量
    2. t 統計量
    3. F 統計量
    4. χ2 統計量
    解答

    【正解】 3 【解説】 分散分析では、群間のばらつきと群内のばらつきの比をとった「F統計量」を用います。 t 検定は2群の比較に用いられます。

    【問10:時系列・指数】

    ラスパイレス指数とパーシェ指数の違いについて、正しい記述はどれか。

    1. ラスパイレス指数は比較時の数量を、パーシェ指数は基準時の数量を重みに用いる。
    2. ラスパイレス指数は基準時の数量を、パーシェ指数は比較時の数量を重みに用いる。
    3. 両者の幾何平均をとったものを消費者物価指数と呼ぶ。
    4. パーシェ指数は常にラスパイレス指数より大きな値になる。
    解答

    【正解】 2 【解説】 ラスパイレスは「過去(基準時)」の重み、パーシェは「現在(比較時)」の重みを使います。なお、両者の幾何平均は「フィッシャー指数」と呼ばれます。