📊 STEP 4: 確率分布の理論
二項分布、ポアソン分布、正規分布を理解し、確率分布の世界を探検しよう
📖 このステップで学ぶこと
統計学の中心となる確率分布を学びます。特に二項分布、ポアソン分布、正規分布は統計学2級レベルで最重要です。
🎯 到達目標: 二項分布とポアソン分布の性質を理解する、連続型確率分布の概念を説明できる、正規分布の標準化ができる、確率分布の期待値と分散が計算できる
1️⃣ 離散型確率分布
離散型確率分布は、とびとびの値をとる確率変数の分布です。
確率変数と確率分布
確率的に決まる値をとる変数
記号: X, Y, Z など大文字
確率分布(probability distribution)
確率変数がどの値をどんな確率でとるかを表したもの
確率質量関数(PMF: Probability Mass Function)
P(X = x) = 確率変数Xがxである確率
① すべてのxについて: P(X = x) ≥ 0
② すべてのxの確率の合計: ΣP(X = x) = 1
期待値と分散
確率変数の「平均的な値」
記号: E(X) または μ
公式: E(X) = Σ x·P(X = x)
分散(variance)
確率変数の「散らばり」
記号: V(X) または σ²
公式: V(X) = E[(X – μ)²] = E(X²) – [E(X)]²
標準偏差(standard deviation)
記号: σ = √V(X)
X | 1 2 3 4
P(X=x)| 0.1 0.3 0.4 0.2
期待値 E(X) = 2.7
分散 V(X) = 0.81
—
【期待値を求める手順】
ステップ1: 期待値の公式を確認
E(X) = Σ x · P(X = x)
= 「各値 × その確率」の合計
ステップ2: 表を作って計算
x | P(X=x) | x × P(X=x) ─────┼────────┼─────────── 1 | 0.1 | 1 × 0.1 = 0.1 2 | 0.3 | 2 × 0.3 = 0.6 3 | 0.4 | 3 × 0.4 = 1.2 4 | 0.2 | 4 × 0.2 = 0.8 ─────┴────────┴─────────── 合計 | 2.7
E(X) = 0.1 + 0.6 + 1.2 + 0.8 = 2.7
—
【分散を求める手順】
ステップ1: 分散の公式を確認
V(X) = E(X²) – [E(X)]²
(「2乗の期待値」-「期待値の2乗」)
ステップ2: E(X²)を計算
x | P(X=x) | x² | x² × P(X=x) ─────┼────────┼─────┼──────────── 1 | 0.1 | 1 | 1 × 0.1 = 0.1 2 | 0.3 | 4 | 4 × 0.3 = 1.2 3 | 0.4 | 9 | 9 × 0.4 = 3.6 4 | 0.2 | 16 | 16 × 0.2 = 3.2 ─────┴────────┴─────┴──────────── 合計 | 8.1
E(X²) = 0.1 + 1.2 + 3.6 + 3.2 = 8.1
ステップ3: 分散を計算
V(X) = E(X²) – [E(X)]²
= 8.1 – (2.7)²
= 8.1 – 7.29
= 0.81
ステップ4: 標準偏差(おまけ)
σ = √V(X) = √0.81 = 0.9
—
【確認】確率の合計が1になるか
0.1 + 0.3 + 0.4 + 0.2 = 1.0 ✓
【覚え方】
• 期待値: 「重み付き平均」と同じ
• 分散の公式: 「2乗の期待値」から「期待値の2乗」を引く
2️⃣ 二項分布の性質と計算
二項分布は統計学で最も基本的で重要な分布です。
二項分布とは
状況:
• 成功確率pの試行をn回独立に行う
• 成功回数をXとする
記号: X ~ B(n, p)
「Xはパラメータがnとpの二項分布に従う」
確率質量関数:
P(X = r) = ₙCᵣ × pʳ × (1-p)ⁿ⁻ʳ
(r = 0, 1, 2, …, n)
(1) Xの確率分布は?
(2) ちょうど6回表が出る確率は?
(1) X ~ B(10, 0.5)(二項分布)
(2) P(X = 6) ≒ 0.205(約20.5%)
—
【(1) 確率分布の特定】
ステップ1: 二項分布の条件を確認
二項分布の条件 この問題 ──────────────────────────────────── ① 試行回数が決まっている → n = 10回 ② 各試行は独立 → 各回のコイン投げは独立 ③ 成功確率が一定 → p = 0.5(表が出る確率) ④ 成功/失敗の2択 → 表/裏の2択
すべての条件を満たす → 二項分布
ステップ2: パラメータを特定
• n = 10(試行回数)
• p = 0.5(成功確率)
答え: X ~ B(10, 0.5)
—
【(2) ちょうど6回の確率】
ステップ1: 二項分布の公式を確認
P(X = r) = ₙCᵣ × pʳ × (1-p)ⁿ⁻ʳ
ステップ2: 値を代入
• n = 10, r = 6, p = 0.5
P(X = 6) = ₁₀C₆ × (0.5)⁶ × (0.5)⁴
ステップ3: 各部分を計算
₁₀C₆を計算:
₁₀C₆ = 10! / (6! × 4!)
= (10×9×8×7) / (4×3×2×1)
= 5040 / 24
= 210
(0.5)⁶ × (0.5)⁴ を計算:
= (0.5)¹⁰
= 1/1024
≒ 0.000977
ステップ4: 掛け合わせる
P(X = 6) = 210 × (1/1024)
= 210/1024
≒ 0.205(約20.5%)
—
【公式の意味】
P(X = 6) = ₁₀C₆ × (0.5)⁶ × (0.5)⁴
↓ ↓ ↓
6回表が 6回表が 4回裏が
出る 出る確率 出る確率
パターン数
具体例: 「表表表表表表裏裏裏裏」というパターンが210通りある
二項分布の期待値と分散
期待値: E(X) = np
分散: V(X) = np(1-p)
標準偏差: σ = √[np(1-p)]
(1) Xの期待値
(2) Xの標準偏差
(1) E(X) = 10
(2) σ ≒ 2.89
—
【ステップ1: 分布を特定】
状況の確認:
• サイコロを60回振る → n = 60
• 「1の目」が出る確率 → p = 1/6
• 各試行は独立
→ X ~ B(60, 1/6)(二項分布)
—
【(1) 期待値を計算】
公式: E(X) = np
E(X) = 60 × (1/6)
= 60/6
= 10
【解釈】
サイコロを60回振ると、「1の目」は平均10回出ると期待できる
—
【(2) 標準偏差を計算】
ステップ2-1: まず分散を計算
公式: V(X) = np(1-p)
V(X) = 60 × (1/6) × (5/6)
= 60 × (1/6) × (5/6)
= 10 × (5/6)
= 50/6
≒ 8.33
ステップ2-2: 標準偏差を計算
σ = √V(X)
= √(50/6)
= √8.33…
≒ 2.89
—
【解釈】
• 期待値: 10回(平均的に出る回数)
• 標準偏差: 約2.89回(バラつきの目安)
つまり、だいたい 10 ± 2.89 = 7〜13回くらいの範囲に収まることが多い
—
【二項分布の公式まとめ】
X ~ B(n, p) のとき ───────────────────────────── 期待値: E(X) = n × p 分散: V(X) = n × p × (1-p) 標準偏差: σ = √[n × p × (1-p)] ───────────────────────────── 覚え方: ・期待値 = 「試行回数 × 成功確率」 ・分散には「(1-p)」が掛かる
• 記号: X ~ B(n, p)
• 公式: P(X=r) = ₙCᵣ × pʳ × (1-p)ⁿ⁻ʳ
• 期待値: E(X) = np
• 分散: V(X) = np(1-p)
• 条件: 独立試行、成功確率一定
3️⃣ ポアソン分布の導入
ポアソン分布は、稀な事象の回数を表す分布です。
ポアソン分布とは
状況:
• 一定時間内(または一定区間内)に起こる稀な事象の回数
• 事象の発生が互いに独立
記号: X ~ Po(λ)
λ(ラムダ): 平均発生回数(パラメータ)
確率質量関数:
P(X = r) = (e⁻λ × λʳ) / r!
(r = 0, 1, 2, …)
• 1時間あたりの来客数
• 1日あたりの事故件数
• 1ページあたりの誤植数
• 1平方メートルあたりのバクテリア数
共通点: 「稀な事象」が「一定区間」で「独立」に発生
1時間にちょうど2件の事故が起こる確率を求めなさい。
(e⁻³ ≒ 0.0498とする)
—
【ステップ1: 分布を特定】
状況の確認:
• 一定時間(1時間)あたりの事故件数
• 平均3件
• 事故は互いに独立に発生
→ X ~ Po(3)(ポアソン分布、λ = 3)
—
【ステップ2: 公式を確認】
P(X = r) = (e⁻λ × λʳ) / r!
今回は r = 2, λ = 3 を代入
—
【ステップ3: 各部分を計算】
e⁻λ = e⁻³ を確認:
e⁻³ ≒ 0.0498(問題文より)
λʳ = 3² を計算:
3² = 9
r! = 2! を計算:
2! = 2 × 1 = 2
—
【ステップ4: 公式に代入】
P(X = 2) = (e⁻³ × 3²) / 2!
= (0.0498 × 9) / 2
= 0.4482 / 2
= 0.2241
≒ 0.224(約22.4%)
—
【公式の意味】
P(X = r) = e⁻λ × λʳ / r!
↓ ↓ ↓
基本の r回起こる r回の
確率 ポテンシャル 並べ方
—
【ポアソン分布の典型値】
λ = 3 のとき:
P(X=0) = e⁻³ × 3⁰ / 0! = 0.0498 × 1 / 1 ≒ 0.050 P(X=1) = e⁻³ × 3¹ / 1! = 0.0498 × 3 / 1 ≒ 0.149 P(X=2) = e⁻³ × 3² / 2! = 0.0498 × 9 / 2 ≒ 0.224 P(X=3) = e⁻³ × 3³ / 3! = 0.0498 × 27 / 6 ≒ 0.224
2件と3件が最も起こりやすい(λ=3の付近が最頻値)
ポアソン分布の期待値と分散
期待値: E(X) = λ
分散: V(X) = λ
特徴: 期待値と分散が等しい!
二項分布とポアソン分布の関係
X ~ B(n, p) で、n→∞, p→0, np→λ のとき
X の分布は Po(λ) に近づく
実用的な目安:
n ≥ 20, p ≤ 0.05 のとき、B(n, p) ≒ Po(np)
• 記号: X ~ Po(λ)
• 公式: P(X=r) = e⁻λλʳ/r!
• 期待値=分散: E(X) = V(X) = λ
• 稀な事象: 発生回数を数える
• 二項分布の近似: nが大きくpが小さいとき
4️⃣ 連続型確率分布の概念
連続的な値をとる確率変数の分布を学びます。
連続型確率変数
身長、体重、時間など、連続的な値をとる変数
重要な性質:
• ある1点の確率は0: P(X = a) = 0
• 区間の確率を考える: P(a ≤ X ≤ b)
確率密度関数
記号: f(x)
性質:
① f(x) ≥ 0(すべてのxで)
② ∫₋∞^∞ f(x)dx = 1(全体の面積が1)
確率の計算:
P(a ≤ X ≤ b) = ∫ₐᵇ f(x)dx
(グラフの下の面積)
累積分布関数
記号: F(x)
定義: F(x) = P(X ≤ x) = ∫₋∞ˣ f(t)dt
性質:
• 0 ≤ F(x) ≤ 1
• xが増加すると、F(x)も増加(単調増加)
• F(-∞) = 0, F(∞) = 1
離散型:
• 確率質量関数 P(X = x)
• 和: ΣP(X = x) = 1
連続型:
• 確率密度関数 f(x)
• 積分: ∫f(x)dx = 1
• P(X = a) = 0(1点の確率は0)
5️⃣ 正規分布の性質と標準化
正規分布は統計学で最も重要な分布です。
正規分布とは
別名: ガウス分布(Gaussian distribution)
記号: X ~ N(μ, σ²)
μ: 平均(期待値)
σ²: 分散
σ: 標準偏差
確率密度関数:
f(x) = (1 / √(2πσ²)) × exp[-(x-μ)² / (2σ²)]
正規分布の性質
① 左右対称: 平均μを中心に対称
② 釣鐘型: ベルカーブ(bell curve)
③ 平均=中央値=最頻値
④ 無限に裾が伸びる: -∞ < X < ∞
⑤ 面積が1: 全体の確率が1
X ~ N(μ, σ²) のとき:
• P(μ – σ ≤ X ≤ μ + σ) ≒ 0.68(約68%)
• P(μ – 2σ ≤ X ≤ μ + 2σ) ≒ 0.95(約95%)
• P(μ – 3σ ≤ X ≤ μ + 3σ) ≒ 0.997(約99.7%)
データのほとんどは平均±3σの範囲内!
標準正規分布
平均0、分散1の正規分布
記号: Z ~ N(0, 1)
確率密度関数: φ(z) = (1/√(2π)) × e^(-z²/2)
累積分布関数: Φ(z) = P(Z ≤ z)
標準化
任意の正規分布を標準正規分布に変換する
X ~ N(μ, σ²) のとき、
Z = (X – μ) / σ
とすると、Z ~ N(0, 1)
Zを標準得点またはz値という
P(40 ≤ X ≤ 65) を求めなさい。
(正規分布表より: Φ(1.5) = 0.9332, Φ(1) = 0.8413)
—
【ステップ1: パラメータを確認】
X ~ N(50, 100) より:
• μ = 50(平均)
• σ² = 100(分散)
• σ = √100 = 10(標準偏差)
注意: N(μ, σ²) の第2パラメータは分散!
—
【ステップ2: 標準化の公式を確認】
Z = (X – μ) / σ
この変換により、X ~ N(50, 100) が Z ~ N(0, 1) になる
—
【ステップ3: 各値を標準化】
X = 40 のとき:
Z = (40 – 50) / 10
= -10 / 10
= -1
X = 65 のとき:
Z = (65 – 50) / 10
= 15 / 10
= 1.5
—
【ステップ4: 確率を計算】
P(40 ≤ X ≤ 65) = P(-1 ≤ Z ≤ 1.5)
区間の確率の求め方:
P(a ≤ Z ≤ b) = Φ(b) – Φ(a)
図で理解:
Φ(-1) Φ(1.5)
┌──────────┐ ┌──────────────┐
│ │ │ │
────┴──────────┴────┴──────────────┴────
-1 0 1.5
↑
求める部分 = Φ(1.5) - Φ(-1)
—
【ステップ5: 正規分布表の値を使う】
Φ(1.5) = 0.9332(問題文より)
Φ(-1) を求める:
正規分布の対称性より:
Φ(-z) = 1 – Φ(z)
Φ(-1) = 1 – Φ(1) = 1 – 0.8413 = 0.1587
—
【ステップ6: 最終計算】
P(-1 ≤ Z ≤ 1.5) = Φ(1.5) – Φ(-1)
= 0.9332 – 0.1587
= 0.7745
答え: 約0.7745(77.45%)
—
【標準化の手順まとめ】
① 分散から標準偏差を求める(σ = √分散) ② 各境界値を標準化(Z = (X-μ)/σ) ③ 正規分布表でΦの値を読む ④ 区間の確率 = 右端 - 左端
【よくある間違い】
• 分散と標準偏差を混同(N(50, 100)のσは10、100ではない!)
• 負のz値の処理を忘れる
• 記号: X ~ N(μ, σ²)
• 左右対称: μを中心に釣鐘型
• 68-95-99.7ルール: データの散らばり
• 標準化: Z = (X-μ)/σ で N(0,1) に変換
• 正規分布表: z値から確率を求める
📝 練習問題(25問)
このステップの理解度を確認しましょう。20問以上正解できれば次のステップへ進めます。
期待値の計算
確率変数Xが P(X=1)=0.2, P(X=2)=0.5, P(X=3)=0.3 のとき、E(X)を求めなさい。
【解き方】
E(X) = Σ x·P(X=x)
= 1×0.2 + 2×0.5 + 3×0.3
= 0.2 + 1.0 + 0.9 = 2.1
分散の計算
問題1のXについて、V(X)を求めなさい。
【解き方】
E(X²) = 1²×0.2 + 2²×0.5 + 3²×0.3
= 0.2 + 2.0 + 2.7 = 4.9
V(X) = E(X²) – [E(X)]²
= 4.9 – 2.1² = 4.9 – 4.41 = 0.49
期待値の性質
E(X) = 5, E(Y) = 3 のとき、E(2X + 3Y) を求めなさい。
【解き方】
E(aX + bY) = aE(X) + bE(Y)(線形性)
E(2X + 3Y) = 2×5 + 3×3 = 10 + 9 = 19
分散の性質
V(X) = 4 のとき、V(3X) を求めなさい。
【解き方】
V(aX) = a²V(X)(係数は2乗される)
V(3X) = 3² × 4 = 9 × 4 = 36
標準偏差
V(X) = 25 のとき、標準偏差σを求めなさい。
【解き方】
σ = √V(X) = √25 = 5
二項分布の確率
コインを8回投げる。表がちょうど5回出る確率を求めなさい。
【解き方】
X ~ B(8, 0.5)
P(X=5) = ₈C₅ × (0.5)⁵ × (0.5)³
= 56 × (0.5)⁸ = 56/256 = 7/32
二項分布の期待値
X ~ B(20, 0.3) のとき、E(X) を求めなさい。
【解き方】
E(X) = np = 20 × 0.3 = 6
二項分布の分散
X ~ B(50, 0.4) のとき、V(X) を求めなさい。
【解き方】
V(X) = np(1-p) = 50 × 0.4 × 0.6 = 12
二項分布の応用
的中率30%のシュートを10本打つ。少なくとも1本入る確率は?(小数第3位まで)
【解き方】
余事象を使う
P(X≥1) = 1 – P(X=0)
= 1 – (0.7)¹⁰ ≒ 1 – 0.0282 = 0.972
二項分布の判定
サイコロを60回振る。「1の目」が出る回数の期待値と標準偏差を求めなさい。
【解き方】
X ~ B(60, 1/6)
E(X) = np = 60 × (1/6) = 10
V(X) = np(1-p) = 60 × (1/6) × (5/6) = 50/6
σ = √(50/6) ≒ 2.89
ポアソン分布の確率
X ~ Po(2) のとき、P(X=3) を求めなさい。(e⁻² ≒ 0.1353)
【解き方】
P(X=3) = (e⁻² × 2³) / 3!
= (0.1353 × 8) / 6 ≒ 0.180
ポアソン分布の期待値
X ~ Po(5) のとき、E(X) と V(X) を求めなさい。
【解き方】
ポアソン分布では期待値=分散=λ
ポアソン分布の応用
1時間あたり平均4件の電話。30分間に電話がかかってこない確率は?(e⁻² ≒ 0.1353)
【解き方】
30分 = 0.5時間なので λ = 4 × 0.5 = 2
P(X=0) = e⁻² × 2⁰ / 0! = e⁻² ≒ 0.1353
二項分布の近似
X ~ B(100, 0.02) のとき、ポアソン分布 Po(λ) で近似できる。λは?
【解き方】
λ = np = 100 × 0.02 = 2
B(100, 0.02) ≒ Po(2)
ポアソン分布の判定
1ページあたり平均0.5個の誤植。10ページで誤植が1個以下である確率は?(e⁻⁵ ≒ 0.0067)
【解き方】
10ページなので λ = 0.5 × 10 = 5
P(X≤1) = P(X=0) + P(X=1)
= e⁻⁵ + e⁻⁵×5
= 0.0067 + 0.0335 ≒ 0.040
標準化
X ~ N(60, 100) のとき、X=75 を標準化しなさい。
【解き方】
μ = 60, σ = √100 = 10
Z = (75-60)/10 = 15/10 = 1.5
68-95-99.7ルール
X ~ N(100, 225) のとき、P(85 ≤ X ≤ 115) はおよそいくらか?
【解き方】
σ = √225 = 15
85 = 100 – 15 = μ – σ
115 = 100 + 15 = μ + σ
μ±σの範囲 → 約68%
標準正規分布
Z ~ N(0, 1) で、Φ(1.5) = 0.9332, Φ(-1.5) = 0.0668 のとき、P(-1.5 ≤ Z ≤ 1.5) は?
【解き方】
P(-1.5 ≤ Z ≤ 1.5) = Φ(1.5) – Φ(-1.5)
= 0.9332 – 0.0668 = 0.8664
正規分布の確率
X ~ N(50, 64) のとき、P(X ≥ 58) を求めなさい。(Φ(1) = 0.8413)
【解き方】
σ = √64 = 8
Z = (58-50)/8 = 1
P(X≥58) = P(Z≥1) = 1 – Φ(1)
= 1 – 0.8413 = 0.1587
正規分布の応用
身長が平均170cm、標準偏差5cmの正規分布に従う。身長180cm以上の人の割合は?(Φ(2) = 0.9772)
【解き方】
Z = (180-170)/5 = 2
P(X≥180) = 1 – Φ(2)
= 1 – 0.9772 = 0.0228
分布の判定
1000回の独立試行で、成功確率0.01。成功回数Xの分布は何か?近似できる分布は?
【解き方】
正確にはB(1000, 0.01)
n≥20, p≤0.05なのでPo(np=10)で近似可能
期待値の加法性
XとYが独立で、E(X)=3, E(Y)=5, V(X)=2, V(Y)=4 のとき、E(X+Y) と V(X+Y) は?
【解き方】
E(X+Y) = E(X) + E(Y) = 3 + 5 = 8
独立なので V(X+Y) = V(X) + V(Y) = 2 + 4 = 6
確率分布の性質
X ~ Po(λ) で、E(X) = V(X) = 3 のとき、λを求めなさい。
【解き方】
ポアソン分布では E(X) = V(X) = λ
よって λ = 3
正規分布と標準偏差
X ~ N(μ, σ²) で、μ-2σ から μ+2σ の範囲に入る確率はおよそいくらか?
【解き方】
68-95-99.7ルールより、μ±2σ の範囲に約95%
標準化の逆算
X ~ N(50, 100) で、Z = -1 となるXの値を求めなさい。
【解き方】
σ = √100 = 10
Z = (X-μ)/σ より -1 = (X-50)/10
X – 50 = -10 → X = 40
⚠️ よくあるつまずきポイントと対策
二項分布の公式を忘れる
対策: ₙCᵣ × pʳ × (1-p)ⁿ⁻ʳ の意味を理解しましょう。
- ₙCᵣ: r回成功するパターン数
- pʳ: r回成功する確率
- (1-p)ⁿ⁻ʳ: (n-r)回失敗する確率
ポアソン分布のλの意味
対策: λは「平均発生回数」です。時間を変えたらλも変わります。
- 1時間あたり平均3件 → λ = 3
- 30分間なら → λ = 1.5
- 2時間なら → λ = 6
標準化を間違える
対策: Z = (X – μ) / σ の順番を守りましょう。
- 分子: X – μ(平均を引く)
- 分母: σ(標準偏差で割る)
- σ = √分散 に注意!
連続型で P(X=a) を計算しようとする
対策: 連続型では1点の確率は0です。
- 必ず区間で考える: P(a ≤ X ≤ b)
- 面積で確率を計算
📚 このステップのまとめ
🎯 学習したこと
- 期待値と分散: E(X) = Σx·P(x)、V(X) = E(X²) – [E(X)]²
- 二項分布: B(n,p)、P(X=r) = ₙCᵣpʳ(1-p)ⁿ⁻ʳ、E=np、V=np(1-p)
- ポアソン分布: Po(λ)、P(X=r) = e⁻λλʳ/r!、E=V=λ
- 連続型確率分布: 確率密度関数、累積分布関数
- 正規分布: N(μ,σ²)、標準化 Z=(X-μ)/σ、68-95-99.7ルール
練習問題で20問以上(80%以上)正解できたら、STEP 5に進みましょう!
このステップで学んだ確率分布は、統計学2級レベルの核心です。
特に正規分布と標準化は、これからのすべての内容で使います。
正規分布表の使い方も必ずマスターしましょう!
学習メモ
統計検定2級対策 - Step 4