統計検定2級:確率論と確率分布の体系的解説
事象の数学的定義から標本分布の収束理論まで
目次
1. 確率の公理的基礎
統計学における「確率」とは、ある試行において特定の事象が起こる確からしさを数値化したものです。検定2級において、まず整理すべきは事象の重なり(和事象)と、前提条件の変化(条件付き確率)です。
● 加法定理と排反事象
事象AとBが同時に起こり得ない(排反である)とき、和事象の確率は単純な加算で求められます。しかし、独立であっても排反でない場合、重複分を差し引く演算が必要です。この「重複の除去」は、多変量解析における独立性の理解にも通ずる基礎概念です。
● ベイズの定理の論理構造
条件付き確率は、標本空間がある事象に制限された際の確率を指します。ベイズの定理は、観測された結果(事後情報)から、その原因となった事象の確率(事後確率)を逆算する枠組みを提供します。
2. 離散型確率分布の特性
確率変数が整数の値をとる分布では、期待値(平均)と分散の定義を正確に把握することが求められます。
二項分布とポアソン分布の近似
二項分布は、成功確率 p の試行を n 回行った際の成功回数の分布です。ここで、試行回数 n が極めて大きく、かつ成功確率 p が極めて小さい(稀な現象)場合、分布は平均 λ = np のポアソン分布に近似されます。
ポアソン分布の特筆すべき性質は、期待値と分散がいずれも λ に一致する点です。この性質は、事故発生件数やコールセンターへの着信数など、単位時間あたりの発生数を扱う問題で強力な武器となります。
3. 連続型確率分布と標準化
測定値のように連続的な値をとる分布において、特定の1点の確率は0となり、確率は「面積」として定義されます。
● 正規分布の標準化(z変換)
平均 μ、標準偏差 σ を持つデータ X を、平均 0、分散 1 の「標準正規分布」に合わせる操作を標準化と呼びます。
この変換により、異なる単位を持つデータ同士を共通の尺度で比較することが可能となり、統計検定における全ての推論の起点となります。
4. 標本分布と収束の理論
個々のデータの分布から、標本全体の要約統計量(標本平均など)が従う分布への移行を理解することが、検定2級合格の鍵です。
分散の加法性と中心極限定理
複数の独立な確率変数の和を考える際、その分散は各変数の分散の総和となります。この性質に基づき、サイズ n の標本平均の分散は、母分散を n で割った値となります。
中心極限定理は、母集団がどのような分布であっても、標本サイズ n が大きければ標本平均の分布は正規分布に近似することを示しています。これは、母集団の正確な形を知らなくても、平均値に関する推論を行える数学的根拠となっています。
5. 確率分野の重要ポイント・公式まとめ
和の期待値は、期待値の和に等しい。
E(aX + b) = aE(X) + b
定数は2乗で外に出る。
独立なら V(X + Y) = V(X) + V(Y)
平均: np
分散: np(1-p)
標準誤差 = σ / √n
(nが大きくなると精度が上がる)
確率を「予測」の言語として定着させる
各確率分布は、特定の現象をモデル化した「型」です。問題文からその現象が「回数」なのか「時間」なのか「測定値」なのかを読み取り、適切な分布を選択する。このプロセスを繰り返すことが、統計検定2級合格への最短ルートとなります。


