アーカイブ: 統計検定練習問題

  • 計検定練習問題13

    今日は検定を主に問題を出していきます。普段の生活を題材に問題を出しています。 統計検定2級:推定・検定の実践演…

  • 計検定練習問題12

    統計検定2級:確率分野 実戦10選 日常の「偶然」を数字で捉える練習です。全問正解を目指しましょう! 【問1】…

  • 統計検定練習問題11

    統計検定2級:実戦計算演習10選 手を動かして解いてみましょう。試験本番で「あと1点」をもぎ取るための計算ドリ…

  • 統計検定2級:練習問題🔟

    前回と似たよな問題です。高得点を目指しましょう! 統計検定2級:実生活演習10選 生活の中の「あるある」を統計…

  • 統計検定2級対策  演習問題⑨   

    統計検定2級:実生活シミュレーション演習(10問) 数式を現実の課題に当てはめて解いてみましょう! 【問1:設…

  • 統計検定2級 練習問題⑧

    統計検定2級:新規演習問題(3月31日分) 新しいテーマを中心とした10問です。期待値の性質や標本抽出法など、…

  • 統計検定2級 今週の総合復習

    統計検定2級:今週の総復習(厳選10問) 今週の学習、大変お疲れ様でした!間違えた問題は解説を読み込み、公式を…

  • 統計検定2級 練習問題⑦

    統計検定2級 対策問題(3月28日分) 本日は「標本分布の計算」「確率の乗法定理」「情報セキュリティ(サニタイ…

  • 統計検定2級 練習問題⑥

    統計検定2級 対策問題(3月26日分) 本日は「標本分布の特性」「仮説検定の誤り」「分散分析」「時系列データ」…

  • 統計検定2級 練習問題⑤

    統計検定2級 対策問題(3月25日分) 本日は「推定・検定」「データの要約」「標本分布」を中心に、実戦で差がつ…

  • 計検定練習問題13

    今日は検定を主に問題を出していきます。普段の生活を題材に問題を出しています。

    統計検定2級:推定・検定の実践演習10選

    「この結果に意味はあるのか?」を統計で判断する力を養いましょう。実務でよく使う判定基準を網羅しています。

    【問1】Webサイトの改善(母比率の差の検定)
    ボタンの色を変えたら、クリック率が「2%」から「3%」に上がりました。これが偶然か、それとも意味のある変化かを調べる検定を何と呼びますか?

    解答・解説を表示

    正解:母比率の差の検定
    「割合(%)」に差があるかどうかを判定する手法です。ABテストなどで非常によく使われます。

    【問2】ダイエットサプリ(対応のあるt検定)
    同じ10人に対し、サプリを「飲む前」と「飲んだ後」で体重を測りました。この「前後の差」に意味があるかを調べるのに最適な検定は?

    解答・解説を表示

    正解:対応のあるt検定
    同一人物のデータを比較する場合、個人の体格差をキャンセルできる「対応のある」方を選びます。

    【問3】p値の意味(基本)
    検定の結果、p値(有意確率)が「0.03」でした。有意水準を「5%」としたとき、どのような判定になりますか?

    解答・解説を表示

    正解:有意(差があると言える)
    p値が有意水準(0.05)より小さいので、「偶然とは言い難い(有意である)」と判断し、帰無仮説を棄却します。

    【問4】95%信頼区間(解釈)
    ある商品の満足度を調査し、95%信頼区間が「70%から80%」と出ました。この意味として正しいものは?

    解答・解説を表示

    正解:同じ調査を100回行えば、95回はその区間に本当の値が含まれる
    「今のデータが95%の確率で正しい」という意味ではなく、手法の信頼性を表しています。

    【問5】第1種の過誤(ミス)
    「本当は差がない」のに、間違えて「差がある(有意だ)」と判定してしまうミスを何と呼びますか?

    解答・解説を表示

    正解:第1種の過誤(あわてものの誤り)
    何でもないものを「異常だ!」と判定してしまうミスです。有意水準(アルファ)はこの確率をコントロールするものです。

    【問6】検定力(ベータ)
    「本当は差がある」のに、それを見逃して「差がない」と判定してしまうミスを避けるための指標を何と言いますか?

    解答・解説を表示

    正解:検定力(パワー)
    「1 – 第2種の過誤」で計算されます。サンプルサイズが大きくなると、この検定力も高まります。

    【問7】カイ二乗検定(独立性)
    「男性と女性で、好きな飲み物に違いがあるか?」を分割表で調べる検定を何と呼びますか?

    解答・解説を表示

    正解:独立性の検定(カイ二乗検定)
    2つのカテゴリ変数(性別・飲み物など)に関連があるかどうかを判定します。

    【問8】F検定(分散の比較)
    2つのクラスのテストの「平均点」ではなく、「バラツキ(分散)」に違いがあるかを調べる検定は?

    解答・解説を表示

    正解:F検定
    等分散性の検定(t検定を行う前の準備)としてよく使われます。

    【問9】母平均の推定(t分布)
    母集団の分散がわかっていないとき、少数のサンプルから平均を推定するために使う分布は?

    解答・解説を表示

    正解:t分布
    標準偏差をサンプルから計算した「不偏標準偏差」で代用する場合に登場する分布です。

    【問10】有意水準の引き下げ
    有意水準を「5%」から「1%」に変更しました。このとき、検定の結果は「有意(差がある)」と言いやすくなりますか、それとも厳しくなりますか?

    解答・解説を表示

    正解:厳しくなる
    ハードルを上げる(1%にする)と、よっぽど確実な証拠がない限り「差がある」とは言えなくなります。

    【最重要】統計的推定・検定の攻略ポイント

    1. 問題文の「着眼点」:どの検定を使うか?

    • 「%(割合)」の比較 → 母比率の差の検定
    • 「同じ人の前後」の比較 → 対応のあるt検定
    • 「別々のグループ」の比較 → 対応のないt検定(独立2群)
    • 「表(縦×横)」の関連性 → カイ二乗検定(独立性の検定)
    • 「バラツキ(分散)」の比較 → F検定

    2. 覚えるべき必須の用語・関係性

    用語 意味・ポイント
    p値 < 有意水準 「めったに起きないことが起きた」= 有意(差がある)
    第1種の過誤 差がないのに「差がある」と言ってしまうミス(あわてもの)
    第2種の過誤 差があるのに「差がない」と見逃すミス(ぼんやり)
    自由度 分割表では「(行-1) × (列-1)」。検定統計量を出すために必須

    3. 暗記推奨の「信頼区間」の形

    信頼区間 = 標本平均 ± (信頼係数 × 標準誤差)
    ※95%信頼区間の信頼係数は「1.96」をよく使います(正規分布の場合)。

    検定は「帰無仮説を棄却できるか(=否定できるか)」のゲームだと考えると分かりやすいです!

  • 計検定練習問題12

    統計検定2級:確率分野 実戦10選

    日常の「偶然」を数字で捉える練習です。全問正解を目指しましょう!

    【問1】和事象の確率(重複あり)
    1から10までの番号札が1枚ずつあります。1枚引いたとき、その番号が「2の倍数」または「3の倍数」である確率は?

    解答・解説を表示

    正解:10分の7 (0.7)
    2の倍数は {2, 4, 6, 8, 10} の5通り。3の倍数は {3, 6, 9} の3通り。両方に共通する「6」を1回分引く必要があります。(5 + 3 – 1) / 10 = 7/10 です。

    【問2】余事象の活用
    サイコロを3回投げたとき、少なくとも1回は「1の目」が出る確率は?

    解答・解説を表示

    正解:216分の91
    「少なくとも1回」は「1回も出ない(すべて2〜6)」の反対です。すべて2〜6が出る確率は (5/6)の3乗 = 125/216。これを1から引いて、 1 – 125/216 = 91/216 となります。

    【問3】独立試行の確率
    シュート成功率が80%の選手が2回シュートを打ちます。2回とも外れる確率は?

    解答・解説を表示

    正解:4% (0.04)
    1回外れる確率は20%(0.2)です。独立な試行なので、 0.2 × 0.2 = 0.04 と計算します。

    【問4】条件付き確率
    子供が2人いる家庭があります。少なくとも1人が女の子であるとわかっているとき、2人とも女の子である確率は?(男女の生まれる確率は0.5ずつとします)

    解答・解説を表示

    正解:3分の1
    2人の性別の組み合わせは {男男, 男女, 女男, 女女}。少なくとも1人が女なので「男男」を除いた3通りが分母になります。そのうち2人とも女なのは「女女」の1通りだけなので、 1/3 です。

    【問5】ベイズの定理(簡易版)
    ある病気の検査薬は、病気の人に99%正しく反応します。また、健康な人にも1%の確率で誤反応します。人口の1%がその病気だとしたとき、反応が出た人が本当に病気である確率は?

    解答・解説を表示

    正解:50% (0.5)
    1万人のうち病気は100人。その99人が陽性。健康な9900人のうち1%(99人)も誤陽性。合計198人の陽性のうち、本物は99人なので、 99/198 = 0.5 です。

    【問6】反復試行(ベルヌーイ試行)
    サイコロを4回投げて、ちょうど2回「6の目」が出る確率は?

    解答・解説を表示

    正解:1296分の150
    公式 4C2 × (1/6)の2乗 × (5/6)の2乗 を使います。 6 × (1/36) × (25/36) = 150/1296 です。

    【問7】期待値の計算(賞金)
    当たりが1本(1000円)、ハズレが9本のくじを1回引きます。このくじの期待値は?

    解答・解説を表示

    正解:100円
    (1000円 × 1/10) + (0円 × 9/10) = 100円。統計検定の基礎となる計算です。

    【問8】幾何分布の考え方
    成功率が25%の作業があります。ちょうど3回目に初めて成功する確率は?

    解答・解説を表示

    正解:約14% (0.140625)
    1回目失敗(0.75) × 2回目失敗(0.75) × 3回目成功(0.25) = 0.140625 です。

    【問9】期待値の性質(和)
    サイコロを1個投げた時の期待値は3.5です。サイコロを10個同時に投げたとき、出る目の合計の期待値は?

    解答・解説を表示

    正解:35
    期待値の和は、個々の期待値の和に等しいです。 3.5 × 10 = 35 となります。

    【問10】ポアソン分布の期待値
    ある交差点で1日に平均0.5回事故が起きます。この交差点で2日間(48時間)に起きる事故の回数の期待値は?

    解答・解説を表示

    正解:1回
    ポアソン分布の期待値は期間に比例します。1日あたり0.5回なら、2日間では 0.5 × 2 = 1回です。

    【最短合格】統計検定2級・確率分野の重要ポイントまとめ

    確率の問題でミスを防ぎ、確実に得点を稼ぐための必須知識を整理しました。

    1. 「和事象」は重複に注意!

    「AまたはB」の確率を求める時は、「Aの確率 + Bの確率 – 両方同時に起こる確率」を忘れずに。特に「2の倍数かつ3の倍数(=6の倍数)」のような重なりを引くのが定石です。

    2. 「少なくとも」は余事象

    「少なくとも1回は〇〇」というキーワードを見たら、「1 – (すべて〇〇以外)」を計算しましょう。まともに計算するより圧倒的に早く、正確に答えが出せます。

    3. ポアソン分布と期待値

    ポアソン分布は「期待値(平均)と分散が同じ」という極めて強力な性質があります。これを知っているだけで瞬殺できる問題が2級ではよく出題されます。

    4. 期待値の線形性

    「合計の期待値 = 期待値の合計」です。サイコロ10個の平均値を出すとき、難しい式は不要。1個の期待値(3.5)を10倍するだけで答えに辿り着けます。

    ※統計検定2級の確率は、公式を覚えるだけでなく「どのシチュエーションでどの公式を使うか」の判断が重要です。

  • 統計検定練習問題11

    統計検定2級:実戦計算演習10選

    手を動かして解いてみましょう。試験本番で「あと1点」をもぎ取るための計算ドリルです。

    【問1】エレベーターの安全荷重
    1人の体重の平均が65キロ、標準偏差が10キロです。このエレベーターに4人乗ったとき、4人の「合計体重」が280キロを超える確率は?(4人の合計は、平均260キロ、標準偏差20キロの正規分布に従うものとします)

    解答・解説を表示

    正解:約16%
    標準化の計算をします。 (280 – 260) / 20 = 1。つまり「平均より標準偏差1個分大きい値」以上になる確率を求めます。正規分布表より、1シグマより外側(片側)は約16%となります。

    【問2】2つの変数の期待値
    変数Aの期待値が10、変数Bの期待値が20です。新しい変数「C = 2A + B」を作ったとき、Cの期待値はいくつになりますか?

    解答・解説を表示

    正解:40
    期待値の計算:2 × 10 + 20 = 40。期待値はそのまま式通りに計算してOKです。

    【問3】2つの変数の分散
    独立な変数A(分散9)と変数B(分散16)があります。この2つを足した「A + B」の標準偏差はいくらですか?

    解答・解説を表示

    正解:5
    まず分散を足します。 9 + 16 = 25。標準偏差はそのルートなので、√25 = 5 となります。標準偏差をそのまま足して3+4=7にしないよう注意!

    【問4】コイン投げの分散
    コインを100回投げたとき、表が出る回数の「分散」を求めてください。(表が出る確率は0.5とします)

    解答・解説を表示

    正解:25
    二項分布の分散公式「回数 × 確率 × (1 – 確率)」を使います。 100 × 0.5 × 0.5 = 25 です。

    【問5】偏差値の逆算
    平均50点、標準偏差10点のテストで、偏差値が70だった人の実際の点数は何点ですか?

    解答・解説を表示

    正解:70点
    偏差値70は「平均より標準偏差2個分上」という意味です。 50 + (10 × 2) = 70点となります。

    【問6】ポアソン分布の計算
    1時間に平均2回着信がある電話があります。この電話の「着信回数の分散」はいくつですか?

    解答・解説を表示

    正解:2
    ポアソン分布の最大の特徴は「期待値と分散が同じ」ことです。平均が2なら分散も2です。計算いらずのサービス問題です。

    【問7】相関係数の二乗
    2つのデータの相関係数が「-0.8」でした。このときの決定係数(寄与率)は何%ですか?

    解答・解説を表示

    正解:64%
    決定係数は相関係数を二乗したものです。 (-0.8) × (-0.8) = 0.64。 つまり64%となります。マイナスが消える点に注目。

    【問8】標本平均の標準偏差
    標準偏差が20の母集団から、100個のサンプルを取り出しました。このとき、サンプル平均の標準偏差(標準誤差)はいくつになりますか?

    解答・解説を表示

    正解:2
    公式「母標準偏差 / √サンプル数」を使います。 20 / √100 = 20 / 10 = 2 となります。

    【問9】カイ二乗検定の自由度
    「3行 × 4列」の分割表を使って独立性の検定を行います。このときの自由度はいくつですか?

    解答・解説を表示

    正解:6
    自由度の公式「(行の数 – 1) × (列の数 – 1)」を使います。 (3-1) × (4-1) = 2 × 3 = 6 です。

    【問10】変動係数の計算
    平均が200、標準偏差が10のグループがあります。このグループの「変動係数」を求めてください。

    解答・解説を表示

    正解:0.05 (5%)
    変動係数は「標準偏差 / 平均」で求めます。 10 / 200 = 0.05 です。単位の違うもの同士のバラツキを比べる時に使います。

  • 統計検定2級:練習問題🔟

    前回と似たよな問題です。高得点を目指しましょう!

    統計検定2級:実生活演習10選

    生活の中の「あるある」を統計で解いてみましょう。数式記号を使わずに解説しています。

    【問1】エレベーターの設計
    平均60キロ、標準偏差10キロの人が4人乗ったとき、4人の合計体重の「標準偏差」はいくらになりますか?

    解答・解説を表示

    正解:20キロ
    4人分の分散(バラツキの二乗)を足します。10×10×4人分=400。これのルートをとると20になります。4倍の40キロにはならないのがポイントです。

    【問2】電球の交換
    寿命が平均2000時間の電球を3個順番に使い切るまでの「合計時間」の期待値(平均)は?

    解答・解説を表示

    正解:6000時間
    期待値(平均)は単純に足し算できます。2000時間 × 3個 = 6000時間です。

    【問3】不良品のチェック
    不良率1%の製品が100個あります。不良品の数の「期待値(平均)」は?

    解答・解説を表示

    正解:1個
    100個のうち1%が不良なので、100 × 0.01 = 1個です(二項分布の期待値)。

    【問4】お店の着信
    1時間に平均3回の電話が来るお店で、特定の1時間に電話が来る回数を調べるのに最適な分布は?

    解答・解説を表示

    正解:ポアソン分布
    「めったに起きないことが、一定時間に何回起きるか」を数える時に使います。

    【問5】アンケートの精度
    調査人数を100人から400人に4倍増やしました。結果の「誤差」の幅はどうなりますか?

    解答・解説を表示

    正解:半分(2分の1)になる
    誤差の幅は人数のルートに反比例します。人数が4倍なら、ルート4の「2分の1」に誤差が縮まります。

    【問6】サプリの効果
    同じ10人にダイエットサプリを飲んでもらい、「飲む前」と「飲んだ後」の体重を比べたい時の検定手法は?

    解答・解説を表示

    正解:対応のあるt検定
    同一人物の比較なので「対応のある」を使います。個人差を無視して純粋な効果を測れます。

    【問7】レジの待ち時間
    お客さんが来る「間隔の時間」が従う分布はどれですか?

    解答・解説を表示

    正解:指数分布
    回数は「ポアソン」、時間は「指数」とセットで覚えましょう。

    【問8】勉強時間と点数
    「勉強を1時間増やすと、点数が10点上がる」という関係があるとき、この「10」は何と呼ばれますか?

    解答・解説を表示

    正解:回帰係数(傾き)
    一単位増えたときに、どれだけ結果が変わるかを示す数値です。

    【問9】テストの偏差値
    平均50、標準偏差10のテストで、60点をとった人の偏差値は?

    解答・解説を表示

    正解:60
    平均よりちょうど標準偏差1個分(+10)高いので、偏差値も50から10上がって60になります。

    【問10】品質保証
    内容量500ミリの商品で、標準偏差2ミリです。496ミリ以下(マイナス2シグマ以下)が発生する確率は?

    解答・解説を表示

    正解:約2.3%
    正規分布の「平均±2シグマ」の外側にいる確率は左右合わせて約5%。その片側なので約2.3〜2.5%です。

  • 統計検定2級対策  演習問題⑨   

    統計検定2級:実生活シミュレーション演習(10問)

    数式を現実の課題に当てはめて解いてみましょう!


    【問1:設計】あるエレベーターに、平均60kg、標準偏差12kgの正規分布に従う大人が9人乗りました。この9人の「総重量」の期待値と標準偏差はいくらですか?

    解説を確認

    正解:期待値 540kg / 標準偏差 36kg

    期待値は 60×9=540kg。分散は 12²×9=1296。標準偏差はそのルートなので √1296 = 36kg です。人数が9倍になっても、標準偏差(バラつき)は√9=3倍にしかなりません。

    【問2:保守】平均寿命2000時間の電球があります。この電球を1個使い、切れたらすぐ次の1個に交換します。3個使い切るまでの「合計時間」の期待値は?

    解説を確認

    正解:6000時間

    期待値の線形性により、単純に 2000時間 × 3個 = 6000時間 となります。期待値は独立性に依存せず足し算が可能です。

    【問3:品質管理】不良率2%の製品ラインから、無作為に100個を抜き取って検査します。不良品の個数の期待値と分散はいくらですか?

    解説を確認

    正解:期待値 2個 / 分散 1.96

    二項分布 B(n, p) の公式を使います。期待値は np = 100 × 0.02 = 2。分散は np(1-p) = 100 × 0.02 × 0.98 = 1.96 です。

    【問4:運営】平均して1時間に5件の着信があるコールセンターで、ある特定の1時間に全く着信がない(0件)確率は、どの分布で計算すべきですか?

    解説を確認

    正解:ポアソン分布

    「単位時間あたりに平均λ回起こる現象がk回起こる確率」を求めるにはポアソン分布が最適です。稀な事象のカウントに適しています。

    【問5:マーケティング】新商品の支持率を調査したい。誤差を±3%以内に抑えたい場合、サンプルサイズ n を増やすと誤差はどう変化しますか?

    解説を確認

    正解:1/√n に比例して小さくなる

    標本誤差(標準誤差)は √n に反比例します。つまり、誤差を半分にするには、4倍のサンプルを集める必要があります。

    【問6:医学】サプリを「飲む前」と「飲んだ後」で同じ人の体重を測定し、効果があるか調べたい。使うべき検定手法は?

    解説を確認

    正解:対応のあるt検定

    「同じ個体」の前後比較なので、個体差をキャンセルできる「対応のあるt検定」を用います。個人ごとの「差」の平均が0かどうかを調べます。

    【問7:サービス】平均待ち時間が3分のレジで、次の客が来るまでの「待ち時間」が従う分布はどれですか?

    解説を確認

    正解:指数分布

    ポアソン過程に従う事象が次に起こるまでの「時間の間隔」は指数分布に従います。これは試験でセットで覚えるべき頻出知識です。

    【問8:ビジネス】「広告費を1万円増やすと、売上が5万円増える」という関係がわかった。この「5万円」に相当する回帰分析の用語は?

    解説を確認

    正解:回帰係数(傾き)

    回帰直線 y = ax + b の a のことです。x(説明変数)が1単位増えた時に、y(目的変数)がどれだけ増えるかを表します。

    【問9:教育】平均50点、標準偏差10点のテストで70点をとった。この人の偏差値はいくらですか?

    解説を確認

    正解:70

    偏差値は 50 + 10 × (スコア – 平均) / 標準偏差 で計算します。今回の場合は 50 + 10 × (70-50)/10 = 70 となります。

    【問10:物流】ジュースの充填量が平均500ml、標準偏差2mlの正規分布に従うとき、496ml以下の商品は約何%発生しますか?

    解説を確認

    正解:約2.3%(または2.5%)

    496mlは、平均から「標準偏差2個分(-2σ)」低い値です。正規分布の 2σ の外側(片側)は約2.3%です。※試験では標準正規分布表を引きます。

    全問正解できましたか?日常の疑問を統計で考えるのが合格への近道です!

  • 統計検定2級 練習問題⑧

    統計検定2級:新規演習問題(3月31日分)

    新しいテーマを中心とした10問です。期待値の性質や標本抽出法など、得点源になる知識を確認しましょう。


    問1:確率変数 X の期待値が E[X] = 5 であるとき、新しい確率変数 Y = 3X + 2 の期待値 E[Y] はいくらですか。

    • □ 17
    • □ 15
    • □ 21
    • □ 5
    【解説を確認】

    正解:17

    公式 E[aX + b] = aE[X] + b に当てはめます。3 × 5 + 2 = 17 となります。

    問2:確率変数 X の分散が V(X) = 4 であるとき、新しい確率変数 Y = -2X + 5 の分散 V(Y) はいくらですか。

    • □ 16
    • □ -8
    • □ 21
    • □ 8
    【解説を確認】

    正解:16

    公式 V(aX + b) = a²V(X) を使います。(-2)² × 4 = 16 です。定数項の +5 は分散には影響しません。

    問3:母集団をいくつかの層に分け、各層からサンプルサイズに比例して抽出する方法を何と呼びますか。

    • □ 層化抽出法
    • □ 系統抽出法
    • □ 多段抽出法
    • □ クラスター抽出法
    【解説を確認】

    正解:層化抽出法

    男女別、年代別など「層」に分けてから引くことで、標本の偏りを抑える手法です。

    問4:2つのサイコロを投げたとき、出た目の和が 4 になる確率は?

    • □ 1 / 12
    • □ 1 / 9
    • □ 1 / 18
    • □ 1 / 6
    【解説を確認】

    正解:1 / 12

    全36通りのうち、和が4になるのは(1,3), (2,2), (3,1)の3通り。3/36 = 1/12 です。

    問5:期待度数 10、観測度数 (8, 12, 11, 9) のときのカイ二乗統計量は?

    • □ 1.0
    • □ 0.5
    • □ 2.0
    • □ 10
    【解説を確認】

    正解:1.0

    各項の (観測-期待)² / 期待 を足します。(4/10 + 4/10 + 1/10 + 1/10) = 1.0 です。

    問6:Q1=20, Q3=50 のとき、外れ値判定に使う「IQRの1.5倍」はいくらですか。

    • □ 45
    • □ 30
    • □ 75
    • □ 15
    【解説を確認】

    正解:45

    IQR = 50 – 20 = 30 です。その1.5倍は 45 となります。

    問7:確率 p が非常に小さく、回数 n が非常に大きいとき、二項分布は何で近似できますか。

    • □ ポアソン分布
    • □ 幾何分布
    • □ 指数分布
    • □ 一様分布
    【解説を確認】

    正解:ポアソン分布

    「稀にしか起きない現象(低い確率)」を大量に試行する場合、ポアソン分布が使われます。

    問8:決定係数 R² = 0.64 のとき、説明変数は目的変数の変動の何%を説明していますか。

    • □ 64%
    • □ 80%
    • □ 36%
    • □ 40%
    【解説を確認】

    正解:64%

    決定係数はそのまま「説明できている割合(寄与率)」を表します。

    問9:パーシェ指数の特徴として正しいものは?

    • □ 比較時(現在)の数量をウェイトにする
    • □ 基準時(過去)の数量をウェイトにする
    • □ 常に過大評価する傾向がある
    • □ 計算に過去の価格を使わない
    【解説を確認】

    正解:比較時(現在)の数量をウェイトにする

    「パーシェは今(比較時)」「ラスパイレスは昔(基準時)」と覚えましょう。

    問10:独立な N(10, 4) と N(20, 9) の和の分布はどうなりますか。

    • □ N(30, 13)
    • □ N(30, 5)
    • □ N(30, 25)
    • □ N(10, 5)
    【解説を確認】

    正解:N(30, 13)

    平均は和(10+20)、分散も和(4+9)になります。※標準偏差の和ではないことに注意!

  • 統計検定2級 今週の総合復習

    統計検定2級:今週の総復習(厳選10問)

    今週の学習、大変お疲れ様でした!間違えた問題は解説を読み込み、公式を指差し確認しましょう。


    問1:母平均 μ、母分散 σ² の母集団から、大きさ n の無作為標本を抽出したとき、標本平均 $\bar{X}$ の分散 $V(\bar{X})$ はいくらになりますか。

    • σ² / n
    • σ / √n
    • σ²
    • nσ²
    【解説を確認】

    正解:σ² / n

    これは「標本平均は、データを集めれば集めるほど真の値(母平均)の周りに集まり、バラつきが小さくなる」という統計学の根幹を支える性質です。

    問2:母分散の推定値として「不偏分散」を計算する際、偏差平方和を割る値(自由度)として正しいものはどれですか。

    • n – 1
    • n
    • n + 1
    • √n
    【解説を確認】

    正解:n – 1

    単なる「標本分散(nで割る)」は、母分散を少し小さめに推定してしまうクセ(偏り)があります。n-1 で割ることで、その偏りを取り除いた「不偏」な推定が可能になります。

    問3:母分散が未知で、サンプルサイズが小さい(n=10など)場合に、母平均の検定に用いる分布はどれですか。

    • t分布
    • 標準正規分布(Z分布)
    • カイ二乗分布
    • F分布
    【解説を確認】

    正解:t分布

    「母分散がわからない」かつ「サンプルが少ない」ときは、正規分布よりも裾の長いt分布を使います。サンプルサイズが大きくなれば、t分布は正規分布に近づいていきます。

    問4:仮説検定において、「実際には差があるのに、有意な差がないと誤って判断してしまうこと」を何と呼びますか。

    • 第2種の過誤
    • 第1種の過誤
    • 有意水準
    • 信頼係数
    【解説を確認】

    正解:第2種の過誤

    本当は効果があるのに「効果なし」と見逃してしまうミスです。一方、効果がないのに「効果あり」と言ってしまうのが第1種の過誤です。

    問5:期待値(平均)が λ であるポアソン分布において、その「分散」はいくらになりますか。

    • λ
    • λ²
    • √λ
    • 1 / λ
    【解説を確認】

    正解:λ

    ポアソン分布は「平均と分散が等しい」という非常にユニークな性質を持っています。試験で計算の手間を省ける重要知識です。

    問6:「A店・B店・C店の3店舗間で、客単価の平均値に差があるか」を一度に検定したい場合、最適な手法はどれですか。

    • 一元配置分散分析
    • 対応のあるt検定
    • 独立性の検定(カイ二乗検定)
    • 単回帰分析
    【解説を確認】

    正解:一元配置分散分析

    3つ以上の群の平均値を比較するときは、t検定を繰り返すのではなく分散分析(ANOVA)を行います。F検定を利用するのが特徴です。

    問7:事象 A と事象 B が独立であるとき、$P(A \cap B)$ を求める式として正しいものはどれですか。

    • P(A) × P(B)
    • P(A) + P(B)
    • P(A | B)
    • P(A) + P(B) – P(A \cap B)
    【解説を確認】

    正解:P(A) × P(B)

    独立事象(お互いに影響しない)であれば、同時に起こる確率は単純に掛け算で求まります。サイコロを2回振るようなイメージです。

    問8:重回帰分析において、説明変数を増やすほど値が勝手に上がってしまう決定係数の弱点を補う指標を何と呼びますか。

    • 自由度調整済み決定係数
    • 寄与率
    • 標準化係数
    • VIF(分散膨張係数)
    【解説を確認】

    正解:自由度調整済み決定係数

    無意味な変数をたくさん入れると、見かけ上の「当てはまり」が良くなってしまいます。それを防ぐために変数の数に応じてペナルティを課した指標です。

    問9:箱ひげ図において、中央の「箱(ボックス)」の長さは何を表していますか。

    • 四分位範囲(IQR)
    • 範囲(レンジ)
    • 標準偏差
    • 平均偏差
    【解説を確認】

    正解:四分位範囲(IQR)

    箱の上端(第3四分位数)から下端(第1四分位数)までの距離であり、全データの真ん中50%が収まっている範囲を示します。

    問10:信頼区間の幅を「半分」にするためには、サンプルサイズ n を何倍にする必要がありますか。

    • 4倍
    • 2倍
    • 8倍
    • 16倍
    【解説を確認】

    正解:4倍

    信頼区間の幅は $1/\sqrt{n}$ に比例します。幅を $1/2$ にするには、分母の $\sqrt{n}$ を 2 にすればよいので、$n$ は $2^2 = 4$ 倍にする必要があります。

  • 統計検定2級 練習問題⑦

    統計検定2級 対策問題(3月28日分)

    本日は「標本分布の計算」「確率の乗法定理」「情報セキュリティ(サニタイジング)」など、実践的な内容を中心に出題します。


    問1:母分散 σ² = 100 の母集団から、サンプルサイズ n = 25 の標本を抽出したとき、標本平均の標準誤差(SE)はいくらですか。

    • 2
    • 4
    • 10
    • 20
    【解説を表示】

    正解:2

    標準誤差は √(σ² / n) で求められます。√ (100 / 25) = √4 = 2 となります。分散(4)と標準誤差(2)を混同しないようにしましょう。

    問2:事象Aが起こったという条件の下で事象Bが起こる「条件付き確率 P(B|A)」を求める式として正しいものはどれですか。

    • P(A ∩ B) / P(A)
    • P(A ∩ B) / P(B)
    • P(A) × P(B)
    • P(A) + P(B)
    【解説を表示】

    正解:P(A ∩ B) / P(A)

    条件となる事象Aの確率 P(A) を分母に置きます。ベイズの定理の基礎となる非常に重要な公式です。

    問3:クロスサイトスクリプティング(XSS)を防ぐために、ユーザーが入力した「<」や「>」などの特殊文字を無害な文字列に変換する処理を何と呼びますか。

    • サニタイジング(エスケープ処理)
    • フィルタリング
    • ハッシング
    • ソルト(Salt)
    【解説を表示】

    正解:サニタイジング(エスケープ処理)

    プログラムとして実行されないように「消毒」するイメージです。WordPressでも、出力前に `esc_html()` などの関数を使ってこの処理を行うのが基本です。

    問4:ある標本の偏差平方和(SS)が 100、サンプルサイズ n が 5 のとき、この標本の「不偏分散」の値はいくらですか。

    • 25
    • 20
    • 4
    • 5
    【解説を表示】

    正解:25

    不偏分散は 偏差平方和 / (n – 1) で求めます。100 / (5 – 1) = 100 / 4 = 25 です。5で割ってしまうと「標本分散(20)」になり、母分散を過小評価してしまいます。

    問5:3つの群(各群のサンプルサイズは 10)に対して一元配置分散分析を行うとき、「群間」の自由度はいくらですか。

    • 2
    • 3
    • 9
    • 27
    【解説を表示】

    正解:2

    群間の自由度は(水準数 – 1)で求めます。3つの群があるため、3 – 1 = 2 です。ちなみに群内の自由度は(全体数 – 水準数)で、30 – 3 = 27 となります。

    問6:相関係数 r = -0.5 であるとき、決定係数 R² はいくらですか。

    • 0.25
    • -0.25
    • 0.5
    • -0.5
    【解説を表示】

    正解:0.25

    決定係数は相関係数の2乗です。(-0.5) × (-0.5) = 0.25 となり、マイナスにはなりません。

    問7:正規分布において、平均 μ から左右に 2σ(標準偏差の2倍)の範囲内に、全データの約何%が含まれますか。

    • 約 95%
    • 約 68%
    • 約 99%
    • 約 50%
    【解説を表示】

    正解:約 95%

    正確には ±1.96σ の範囲が 95% です。±1σ は約 68%、±3σ は約 99.7% となります。これらは頻出の数値です。

    問8:「実際には母集団の間に差があるのに、有意な差がないと判断してしまう誤り」を何と呼びますか。

    • 第2種の過誤(β)
    • 第1種の過誤(α)
    • 検出力(1-β)
    • 信頼係数
    【解説を表示】

    正解:第2種の過誤(β)

    差を見逃してしまう「ぼんやりものの誤り」です。一方、差がないのに差があると言ってしまうのは「第1種の過誤」です。

    問9:箱ひげ図において、箱(ボックス)の長さが表している指標は何ですか。

    • 四分位範囲(IQR)
    • 標準偏差
    • 中央値
    • 範囲(最大値 – 最小値)
    【解説を表示】

    正解:四分位範囲(IQR)

    箱の上下(左右)の端は第1四分位数と第3四分位数を表しており、その差である四分位範囲が箱の長さになります。

    問10:重回帰分析において、説明変数同士に強い相関があることで、係数の推定が不安定になる現象を何と呼びますか。

    • 多重共線性(マルチコ)
    • 自己相関
    • 不均一分散
    • 偽相関
    【解説を表示】

    正解:多重共線性(マルチコ)

    似たような情報を表す変数を同時に入れると発生します。これを防ぐには、相関の強すぎる変数を片方除外するなどの対策が必要です。

  • 統計検定2級 練習問題⑥

    統計検定2級 対策問題(3月26日分)

    本日は「標本分布の特性」「仮説検定の誤り」「分散分析」「時系列データ」など、試験後半で得点源となる範囲から出題します。


    問1:サンプルサイズ n = 10 のデータから求められる、母平均の推定に用いる t 分布の「自由度」はいくらですか。

    • 9
    • 10
    • 11
    • 100
    【解説を表示】

    正解:9

    1つの母平均に関する推論(t検定など)では、自由度は n – 1 となります。10 – 1 = 9 です。自由度は「独立に動かせるデータの数」を意味します。

    問2:「実際には差がある(帰無仮説が偽である)」ときに、正しく帰無仮説を棄却できる確率を何と呼びますか。

    • 検出力(検定力)
    • 有意水準
    • 第1種の過誤
    • 信頼係数
    【解説を表示】

    正解:検出力(検定力)

    これは 1 – β(第2種の過誤の確率を1から引いたもの)で表されます。サンプルサイズを大きくすると、この検出力は高まる傾向にあります。

    問3:3つ以上の群の平均値に差があるかどうかを検定する「分散分析(ANOVA)」において、検定統計量として用いられるのはどれですか。

    • F統計量
    • t統計量
    • z統計量
    • カイ二乗統計量
    【解説を表示】

    正解:F統計量

    分散分析は「群間の分散」と「群内の分散」の比をとり、F検定を行います。t検定を繰り返すと第1種の過誤が増大するため、一元配置分散分析が必要になります。

    問4:重回帰分析において、説明変数を増やすほど(たとえ無意味な変数でも)値が上昇してしまう決定係数の欠点を補う指標はどれですか。

    • 自由度調整済み決定係数
    • 相関係数
    • 標準誤差
    • p値
    【解説を表示】

    正解:自由度調整済み決定係数

    変数の数に応じてペナルティを課すことで、モデルの当てはまりの良さをより適切に評価する指標です。2級の重回帰分析の単元で必須の知識です。

    問5:アイスクリームの売上データのように、1年周期で繰り返される変動パターンを何と呼びますか。

    • 季節変動
    • 傾向変動(トレンド)
    • 循環変動
    • 不規則変動
    【解説を表示】

    正解:季節変動

    時系列データにおいて、季節や曜日など定期的な周期で発生する変動です。これを取り除くことを「季節調整」といいます。

    問6:事象Aが起こる確率 P(A) = 0.4、事象Bが起こる確率 P(B) = 0.5、事象AとBが排反(同時に起こらない)であるとき、P(A ∪ B) はいくらですか。

    • 0.9
    • 0.2
    • 0.1
    • 0.45
    【解説を表示】

    正解:0.9

    排反事象の場合、和事象の確率は単なる足し算で求められます(P(A) + P(B))。独立事象の積(0.4 × 0.5 = 0.2)と混同しないようにしましょう。

    問7:第3四分位数を Q3、第1四分位数を Q1 としたとき、四分位範囲(IQR)の計算式はどれですか。

    • Q3 – Q1
    • (Q3 – Q1) / 2
    • Q3 + Q1
    • Q2 (中央値)
    【解説を表示】

    正解:Q3 – Q1

    データの中心部50%が含まれる範囲を指します。外れ値の影響を受けにくいバラつきの指標です。ちなみに (Q3 – Q1) / 2 は「四分位偏差」と呼ばれます。

    問8:「成功確率 p の試行において、初めて成功するまでに必要な試行回数」が従う分布はどれですか。

    • 幾何分布
    • 二項分布
    • ポアソン分布
    • 指数分布
    【解説を表示】

    正解:幾何分布

    「初めて当たりが出るまで」「初めて故障するまで」といった現象を扱います。期待値は 1 / p です。

    問9:所得の格差などを視覚的に表すグラフで、対角線(均等配分線)から離れるほど格差が大きいことを示す曲線は何ですか。

    • ローレンツ曲線
    • 正規分布曲線
    • 回帰直線
    • ROC曲線
    【解説を表示】

    正解:ローレンツ曲線

    この曲線と対角線に囲まれた面積をもとに算出される指標が「ジニ係数」です。ジニ係数が 1 に近いほど格差が大きいことを意味します。

    問10:母集団をいくつかの層(グループ)に分け、各層からサンプルを抽出する方法を何と呼びますか。

    • 層化抽出法
    • 系統抽出法
    • 多段抽出法
    • クラスター抽出法
    【解説を表示】

    正解:層化抽出法

    「男女別」「年代別」などに分けた後で抽出することで、母集団の構成を反映させやすくし、推定の精度を高める手法です。

  • 統計検定2級 練習問題⑤

    統計検定2級 対策問題(3月25日分)

    本日は「推定・検定」「データの要約」「標本分布」を中心に、実戦で差がつくポイントを厳選しました。


    問1:平均 μ = 50、標準偏差 σ = 10 の正規分布に従うデータ x を、平均 0、分散 1 の標準正規分布に変換する「標準化」の式として正しいものはどれですか。

    • (x – 50) / 10
    • (x – 10) / 50
    • 10(x – 50)
    • (x – 50)² / 10
    【解説を表示】

    正解:(x – 50) / 10

    標準化の基本式は z = (x – μ) / σ です。各データから平均を引いて標準偏差で割ることで、異なる単位のデータを比較可能な「zスコア」に変換できます。

    問2:右側に長い裾を持つ分布(正の歪みがある分布)において、平均値と中央値の関係として一般的なものはどれですか。

    • 平均値 > 中央値
    • 平均値 < 中央値
    • 平均値 = 中央値
    • 分布の形状に関わらず常に一定である
    【解説を表示】

    正解:平均値 > 中央値

    右側に極端に大きな値がある場合、平均値はその外れ値に引きずられて大きくなりますが、中央値は順位に基づくため影響が限定的です。所得分布などが典型的な例です。

    問3:2つの独立した母集団の平均値の差を検定する際、母分散が等しいと仮定できる場合に使用される統計量はどれですか。

    • プールした分散を用いたt統計量
    • ウェルチのt統計量
    • F統計量
    • カイ二乗統計量
    【解説を表示】

    正解:プールした分散を用いたt統計量

    等分散性が仮定できる場合は、2つの標本分散を重み付き平均した「プールした分散」を使います。等分散が仮定できない場合は「ウェルチ(Welch)のt検定」を用います。

    問4:母比率 p、サンプルサイズ n のとき、標本比率 ^p(ピーハット)の分散はどのように表されますか。

    • p(1 – p) / n
    • np(1 – p)
    • √[p(1 – p) / n]
    • p / n
    【解説を表示】

    正解:p(1 – p) / n

    二項分布の分散 np(1-p) を n² で割ることで、比率の分散が求まります。区間推定の公式のルートの中身として頻出です。

    問5:正規分布を用いた95%信頼区間の推定において、信頼区間の幅を決定する係数(z値)として近似的に用いられる値はどれですか。

    • 1.96
    • 2.58
    • 1.65
    • 1.00
    【解説を表示】

    正解:1.96

    95%信頼区間では 1.96、99%では 2.58、90%では 1.65 を使用します。これらの数値は正規分布表を見なくても即答できるようにしておきましょう。

    問6:すべてのデータに対して y = -3x + 10 という完璧な負の直線関係が成り立つとき、x と y の相関係数 r はいくらですか。

    • -1
    • 1
    • -3
    • 0
    【解説を表示】

    正解:-1

    相関係数は直線の「傾きの大きさ」ではなく「直線性への集中の度合い」を表します。完璧な右下がりの直線であれば、傾きが -3 であっても -100 であっても相関係数は -1 です。

    問7:検定の結果、p値(有意確率)が 0.03 でした。有意水準 α = 0.05 で検定を行う場合、どのような判断を下しますか。

    • 帰無仮説を棄却し、対立仮説を採択する(有意な差がある)
    • 帰無仮説を採択する(有意な差があるとはいえない)
    • 有意水準を 0.01 に変更して再検定する
    • 検定は失敗であり、サンプルサイズを増やすべきである
    【解説を表示】

    正解:帰無仮説を棄却し、対立仮説を採択する(有意な差がある)

    p値 < 有意水準 α となる場合、その結果は「めったに起こらないことが起きた」と判断し、帰無仮説を捨てます。

    問8:異なる単位(例:cm と kg)を持つデータのバラつき具合を比較するために用いられる、標準偏差を平均値で割った指標を何と呼びますか。

    • 変動係数
    • 相関係数
    • 決定係数
    • 不偏分散
    【解説を表示】

    正解:変動係数

    変動係数 = 標準偏差 / 平均 です。単位に依存しないため、「ゾウの体重の個体差」と「ネズミの体重の個体差」を比較するような場合に有効です。

    問9:サイコロを60回振って、各目が均等に出ているかどうかを調べるために最適な検定手法はどれですか。

    • カイ二乗検定(適合度検定)
    • t検定
    • F検定
    • Z検定
    【解説を表示】

    正解:カイ二乗検定(適合度検定)

    「観測された頻度」が「理論上の期待頻度」とどれくらいズレているかを調べるには、カイ二乗統計量を用いた適合度検定が使われます。

    問10:2つの独立な変数 X と Y について、E(X) = 2, E(Y) = 3 のとき、E(X + Y) の値はいくらになりますか。

    • 5
    • 6
    • 1
    • 独立でないと計算できない
    【解説を表示】

    正解:5

    期待値には「線形性」があり、E(X + Y) = E(X) + E(Y) が常に成り立ちます。分散の場合は独立性が条件となりますが、期待値は独立でなくても足し算が可能です。