📈 STEP 7: 確率分布入門
確率的な現象を数式で表現しよう
📖 このステップで学ぶこと
このステップでは、確率分布の基礎を学びます。確率変数、確率分布、期待値と分散、二項分布、正規分布など、統計学で重要な概念を理解します。
🎯 到達目標: 確率変数と確率分布を理解し、期待値と分散が計算でき、二項分布と正規分布の基本を説明できる
1️⃣ 確率変数と確率分布
確率変数(random variable)
確率変数は、確率的に決まる値を表す変数です。
• サイコロの出た目(1,2,3,4,5,6)
• コインを10回投げたときの表の回数(0〜10)
• あるテストの点数
• 明日の気温
記号: X、Y など(大文字)
例: X = サイコロの出た目
(1) サイコロを振ったときの出た目
(2) 今日の日付
(3) コインを3回投げたときの表の回数
【確率変数とは?】
確率変数 = ランダムに決まる値
→ 「結果が分からない」「やってみないと分からない」ものが確率変数
【(1) サイコロを振ったときの出た目】
→ 確率変数 ○
理由: 振る前は何が出るか分からない。1〜6のどれかがランダムに出る。
【(2) 今日の日付】
→ 確率変数 ×
理由: 今日が何日かは決まっている。ランダムではない。
【(3) コインを3回投げたときの表の回数】
→ 確率変数 ○
理由: 投げる前は何回表が出るか分からない。0回、1回、2回、3回のどれかがランダムに決まる。
【判断のポイント】
「やってみないと結果が分からない」→ 確率変数
「すでに決まっている」→ 確率変数ではない
確率分布(probability distribution)
確率分布は、確率変数が各値をとる確率を表したものです。
確率変数Xがとる値と、その確率を対応させた表やグラフ
例: サイコロの確率分布
X(出た目)| 1 | 2 | 3 | 4 | 5 | 6
P(X) |1/6 |1/6 |1/6 |1/6 |1/6 |1/6
確率の合計は必ず1
Σ P(X) = 1
【ステップ1】Xがとりうる値を確認する
コインを2回投げたとき、表の回数は:
• 0回(2回とも裏)
• 1回(1回だけ表)
• 2回(2回とも表)
【ステップ2】すべての結果を列挙する
コイン2回の結果は 2² = 4通り:
(表, 表)、(表, 裏)、(裏, 表)、(裏, 裏)
【ステップ3】各Xの値に対応する確率を求める
X = 0回(表が0回)の場合:
該当: (裏, 裏) の1通り
P(X = 0) = 1/4
X = 1回(表が1回)の場合:
該当: (表, 裏)、(裏, 表) の2通り
P(X = 1) = 2/4 = 1/2
X = 2回(表が2回)の場合:
該当: (表, 表) の1通り
P(X = 2) = 1/4
【確率分布表】
X(表の回数)| 0回 | 1回 | 2回
確率 P(X) | 1/4 | 1/2 | 1/4
【確認】確率の合計 = 1 になっているか?
1/4 + 1/2 + 1/4 = 1/4 + 2/4 + 1/4 = 4/4 = 1 ✓
• すべての確率は 0 ≦ P(X) ≦ 1
• 確率の合計は必ず 1
• 確率分布を表やグラフで表すと、全体像が分かりやすい
2️⃣ 期待値(平均)と分散
期待値(expected value)
期待値は、確率変数の「平均的な値」を表します。
E(X) = Σ [値 × その値の確率]
記号: E(X) または μ(ミュー)
計算手順:
1. 各値とその確率を掛ける
2. すべて足し合わせる
X | 1 | 2 | 3 | 4 | 5 | 6
P(X) |1/6 |1/6 |1/6 |1/6 |1/6 |1/6
【期待値の計算式】
E(X) = Σ [値 × その値の確率]
= 各値に確率を掛けて、全部足す
【ステップ1】各値×確率を計算する
• 1 × (1/6) = 1/6
• 2 × (1/6) = 2/6
• 3 × (1/6) = 3/6
• 4 × (1/6) = 4/6
• 5 × (1/6) = 5/6
• 6 × (1/6) = 6/6
【ステップ2】すべて足し合わせる
E(X) = 1/6 + 2/6 + 3/6 + 4/6 + 5/6 + 6/6
= (1 + 2 + 3 + 4 + 5 + 6) / 6
= 21 / 6
= 3.5
【期待値の意味】
サイコロを何度も何度も振り続けたとき、出た目の平均は3.5に近づきます。
【注意】
期待値3.5は、サイコロの目として実際に出る値ではありません。
「平均するとこのくらい」という理論上の値です。
はずれ(0円)が90本あるとき、このくじの期待値(平均的な当選金額)は?
【ステップ1】確率分布を作成する
全体のくじの本数: 1 + 9 + 90 = 100本
当選金額 X | 100万円 | 10万円 | 0円
本数 | 1本 | 9本 | 90本
確率 P(X) | 1/100 | 9/100 | 90/100
【ステップ2】各値×確率を計算する
• 1,000,000 × (1/100) = 10,000円
• 100,000 × (9/100) = 9,000円
• 0 × (90/100) = 0円
【ステップ3】すべて足し合わせる
E(X) = 10,000 + 9,000 + 0
= 19,000円
【期待値の意味】
このくじを1本引いたとき、平均すると19,000円の価値があります。
【実用的な使い方】
もしこのくじが1本20,000円で売られていたら、
期待値19,000円 < 価格20,000円 なので、
平均的には損をする計算になります。
分散(variance)
分散は、確率変数のばらつき具合を表します。
V(X) = E[(X − E(X))²]
または
V(X) = E(X²) − [E(X)]²
記号: V(X) または σ²(シグマの2乗)
標準偏差:
σ = √V(X)
X | 1 | 3 | 5
P(X) | 0.2 | 0.5 | 0.3
期待値 E(X) = 3.2
分散 V(X) = 1.96
【期待値の計算】
ステップ1: 各値×確率を計算
• 1 × 0.2 = 0.2
• 3 × 0.5 = 1.5
• 5 × 0.3 = 1.5
ステップ2: すべて足す
E(X) = 0.2 + 1.5 + 1.5 = 3.2
—
【分散の計算】
公式: V(X) = E(X²) − [E(X)]²
ステップ1: E(X²)を計算する
X²の値: 1² = 1, 3² = 9, 5² = 25
E(X²) = 1×0.2 + 9×0.5 + 25×0.3
= 0.2 + 4.5 + 7.5
= 12.2
ステップ2: [E(X)]²を計算する
[E(X)]² = (3.2)² = 10.24
ステップ3: 分散を求める
V(X) = E(X²) − [E(X)]²
= 12.2 − 10.24
= 1.96
【標準偏差も求めると】
σ = √V(X) = √1.96 = 1.4
• 期待値: 確率変数の「中心」
• 分散: 確率変数の「ばらつき」
• 分散が大きい → ばらつきが大きい
• 分散が小さい → 期待値の周りに集まっている
3️⃣ 二項分布の基礎
二項分布(binomial distribution)は、「成功か失敗か」の試行をn回繰り返したときの成功回数の分布です。
二項分布とは
1. 各試行は「成功」か「失敗」の2つだけ
2. 成功の確率pは毎回同じ
3. n回の試行は独立
記号: B(n, p)
• n: 試行回数
• p: 1回の試行で成功する確率
例:
• コインをn回投げて表が出る回数
• n人の患者に薬を投与して効く人数
• n回のシュートで成功する回数
Xは二項分布に従いますか?従うなら、パラメータn, pを答えなさい。
【二項分布の3つの条件をチェック】
条件1: 各試行は「成功」か「失敗」の2つだけ?
→ ○ 表(成功)か裏(失敗)の2択
条件2: 成功の確率pは毎回同じ?
→ ○ 表が出る確率は毎回 1/2 = 0.5
条件3: n回の試行は独立?
→ ○ 1回目の結果は2回目、3回目に影響しない
【結論】
3つの条件をすべて満たすので、二項分布に従います。
【パラメータ】
• n = 3(コインを3回投げる)
• p = 0.5(表が出る確率)
よって、X 〜 B(3, 0.5)
二項分布の確率計算
n回中ちょうどk回成功する確率:
P(X = k) = ₙCₖ × p^k × (1-p)^(n-k)
ₙCₖ: n個からk個選ぶ組合せの数
p^k: k回成功する確率
(1-p)^(n-k): (n-k)回失敗する確率
【パラメータを確認】
• n = 4(4回投げる)
• p = 1/2(表が出る確率)
• k = 2(ちょうど2回表)
【公式に代入】
P(X = k) = ₙCₖ × p^k × (1-p)^(n-k)
ステップ1: 組合せの数 ₄C₂ を計算
₄C₂ = 4! / (2! × 2!)
= (4 × 3) / (2 × 1)
= 12 / 2 = 6
ステップ2: 成功確率の部分 p² を計算
(1/2)² = 1/4
ステップ3: 失敗確率の部分 (1-p)² を計算
(1/2)² = 1/4
ステップ4: すべて掛ける
P(X = 2) = 6 × (1/4) × (1/4)
= 6 × (1/16)
= 6/16
= 3/8
【確認】具体的に列挙すると
4回中2回表のパターン:
表表裏裏、表裏表裏、表裏裏表、
裏表表裏、裏表裏表、裏裏表表
→ 確かに6通り ✓
二項分布の期待値と分散
期待値:
E(X) = n × p
分散:
V(X) = n × p × (1-p)
例: コインを10回投げたときの表の回数
n = 10, p = 0.5
E(X) = 10 × 0.5 = 5回
V(X) = 10 × 0.5 × 0.5 = 2.5
効果が出る人数Xの期待値と分散を求めなさい。
期待値 E(X) = 7人
分散 V(X) = 2.1
【パラメータを確認】
• n = 10(10人に投与)
• p = 0.7(効果が出る確率)
• 1 – p = 0.3(効果が出ない確率)
【期待値の計算】
公式: E(X) = n × p
E(X) = 10 × 0.7 = 7
意味: 平均して7人に効果が出る
【分散の計算】
公式: V(X) = n × p × (1-p)
V(X) = 10 × 0.7 × 0.3
= 10 × 0.21
= 2.1
【標準偏差も求めると】
σ = √2.1 ≒ 1.45
意味: 効果が出る人数は7人を中心に、約1.45人程度ばらつく
• 「成功/失敗」「当たり/はずれ」などの2択
• 同じ試行をn回繰り返す
• 各試行が独立(影響し合わない)
→ 二項分布の可能性が高い
4️⃣ 正規分布の概要(釣鐘型のグラフ)
正規分布(normal distribution)は、自然界や社会で最もよく現れる分布です。
正規分布とは
• 左右対称の釣鐘型(ベル型)のグラフ
• 平均μ(ミュー)を中心に対称
• 標準偏差σ(シグマ)で広がりが決まる
記号: N(μ, σ²)
• μ: 平均
• σ²: 分散
正規分布に従うデータの例:
• 身長、体重
• テストの点数(人数が多い場合)
• 測定誤差
• 多数のランダムな要因の合計
正規分布の重要な性質
正規分布では、データの約:
• 68%が μ ± 1σ の範囲に入る
• 95%が μ ± 2σ の範囲に入る
• 99.7%が μ ± 3σ の範囲に入る
例: 平均100点、標準偏差10点のテスト
• 約68%の人が 90〜110点
• 約95%の人が 80〜120点
• 約99.7%の人が 70〜130点
次の範囲に入る人の割合はおよそ何%ですか?
(1) 165cm〜175cm
(2) 160cm〜180cm
(1) 約68%
(2) 約95%
【パラメータを確認】
• 平均 μ = 170cm
• 標準偏差 σ = 5cm(分散5² = 25)
—
【(1) 165cm〜175cm】
ステップ1: 範囲をμとσで表す
• 165cm = 170 – 5 = μ – 1σ
• 175cm = 170 + 5 = μ + 1σ
ステップ2: 68-95-99.7ルールを適用
μ ± 1σ の範囲 → 約68%
—
【(2) 160cm〜180cm】
ステップ1: 範囲をμとσで表す
• 160cm = 170 – 10 = 170 – 2×5 = μ – 2σ
• 180cm = 170 + 10 = 170 + 2×5 = μ + 2σ
ステップ2: 68-95-99.7ルールを適用
μ ± 2σ の範囲 → 約95%
【イメージ図】
↓ 平均170cm
|
68%: |—-165—-170—-175—-|
95%: |–160——170——180–|
99.7%: |155——–170——–185|
標準正規分布
平均0、標準偏差1の正規分布
どんな正規分布も、標準化すると標準正規分布になる:
Z = (X − μ) ÷ σ
標準正規分布表を使って確率を求められる
【標準化とは?】
標準化 = 「平均からどれだけ離れているか」を標準偏差の単位で表すこと
【パラメータを確認】
• X = 60(標準化したい値)
• μ = 50(平均)
• σ = 10(標準偏差)
【標準化の公式】
Z = (X − μ) ÷ σ
【計算】
Z = (60 − 50) ÷ 10
= 10 ÷ 10
= 1
【Z = 1 の意味】
60点は平均50点より「標準偏差1つ分」上にある
つまり、平均より10点(= 1σ)高い位置にいる
【図で表すと】
平均(50点) 60点
|———–|
1σ分(10点)
• 左右対称の釣鐘型
• 平均と標準偏差で形が決まる
• 68-95-99.7ルールを覚える
• 標準化でz得点に変換できる
📝 練習問題(15問)
このステップの理解度を確認しましょう。
確率分布の性質
確率分布で、すべての確率の合計はいくつですか?
解説:
確率分布では、すべての確率の合計は必ず1になります。
Σ P(X) = 1
理由: 確率変数Xは必ずどれかの値をとるため、すべての確率を足すと100% = 1になる。
確率変数の判定
「明日の最高気温」は確率変数ですか?
解説:
明日の気温は今の時点では分からず、ランダムに決まります。
「やってみないと(明日にならないと)分からない」ものは確率変数です。
確率分布表の読み取り
X = 2 のとき P(X) = 0.3、X = 4 のとき P(X) = 0.5 です。X = 6 のときP(X) は?(この3つの値だけをとる)
解説:
確率の合計は1なので:
P(X=2) + P(X=4) + P(X=6) = 1
0.3 + 0.5 + P(X=6) = 1
P(X=6) = 1 − 0.3 − 0.5 = 0.2
期待値の計算
X = 1, 2, 3 の確率がそれぞれ 0.2, 0.5, 0.3 のとき、E(X) は?
解説:
E(X) = Σ [値 × 確率]
= 1×0.2 + 2×0.5 + 3×0.3
= 0.2 + 1.0 + 0.9
= 2.1
期待値の意味
サイコロの出た目の期待値は3.5です。これは何を意味しますか?
解説:
期待値は「平均的な値」を表します。
サイコロを1回振って3.5が出ることはありませんが、何度も振り続けると、出た目の平均は3.5に近づきます。
くじの期待値
1等(1000円)が1本、2等(100円)が9本、はずれ(0円)が90本のくじ。期待値は?
解説:
全100本なので:
E(X) = 1000×(1/100) + 100×(9/100) + 0×(90/100)
= 10 + 9 + 0
= 19円
このくじ1本あたりの平均的な価値は19円です。
二項分布の判定
コインを10回投げて表が出る回数は、二項分布に従いますか?
解説:
二項分布の3条件をチェック:
✓ 成功(表)/失敗(裏)の2択
✓ 確率は毎回同じ(1/2 = 0.5)
✓ 各試行が独立
n = 10, p = 0.5 なので B(10, 0.5) です。
二項分布の期待値
X〜B(20, 0.3) のとき、E(X) を求めなさい
解説:
二項分布の期待値の公式: E(X) = n × p
E(X) = 20 × 0.3 = 6
二項分布の分散
X〜B(10, 0.5) のとき、V(X) を求めなさい
解説:
二項分布の分散の公式: V(X) = n × p × (1-p)
V(X) = 10 × 0.5 × (1 – 0.5)
= 10 × 0.5 × 0.5
= 2.5
二項分布の確率
コインを3回投げて、ちょうど1回表が出る確率は?
解説:
n = 3, p = 1/2, k = 1
P(X = 1) = ₃C₁ × (1/2)¹ × (1/2)²
= 3 × (1/2) × (1/4)
= 3 × (1/8)
= 3/8
パターン: 表裏裏、裏表裏、裏裏表 の3通り
正規分布の形
正規分布のグラフはどのような形ですか?
解説:
正規分布は平均を中心に左右対称の釣鐘(ベル)の形をしています。
平均付近が最も高く、端に行くほど低くなります。
68-95-99.7ルール
正規分布で、平均±1σの範囲に入るデータは約何%ですか?
解説:
68-95-99.7ルール:
• μ ± 1σ → 約68%
• μ ± 2σ → 約95%
• μ ± 3σ → 約99.7%
標準化
X〜N(100, 10²) で X = 120 のとき、標準化した値zは?
解説:
標準化の公式: z = (X − μ) ÷ σ
z = (120 − 100) ÷ 10
= 20 ÷ 10
= 2
意味: 120点は平均より標準偏差2つ分上
正規分布の範囲
X〜N(50, 5²) で、45〜55の範囲に入るデータは約何%ですか?
解説:
μ = 50, σ = 5 なので:
• 45 = 50 − 5 = μ − 1σ
• 55 = 50 + 5 = μ + 1σ
μ ± 1σ の範囲 → 約68%
標準正規分布
標準正規分布の平均と標準偏差は?
解説:
標準正規分布は N(0, 1) と表記します。
• 平均 μ = 0
• 分散 σ² = 1
• 標準偏差 σ = 1
どんな正規分布も標準化するとN(0, 1)になります。
📚 このステップのまとめ
🎯 学習したこと
- 確率変数: ランダムに決まる値を表す変数
- 確率分布: 確率変数が各値をとる確率を表したもの
- 期待値: 確率変数の平均的な値 E(X) = Σ[値×確率]
- 分散: 確率変数のばらつき具合
- 二項分布: n回の試行で成功する回数の分布 B(n, p)
- 正規分布: 釣鐘型の分布。68-95-99.7ルールが重要
練習問題で12問以上正解できたら、STEP 8に進みましょう!
確率分布は統計学の核心です。特に期待値の計算と正規分布の68-95-99.7ルールをしっかり覚えてください。
学習メモ
統計検定3級対策 - Step 7