📊 ステップ6:確率の基礎
データ分析の基本となる確率を学ぼう!
📚 このステップで学ぶこと
- 確率とは何か?(基本の考え方)
- 確率の3つの法則(和・積・余事象)
- 条件付き確率
- 期待値の計算
- 順列と組合せ
🎯 到達目標: 確率の基本公式を使いこなし、期待値や組合せを計算できる
1. 確率とは何か?
🎯 確率を一言で言うと
確率とは、「ある出来事が起こる可能性を0〜1の数字で表したもの」です。
例1:天気予報
「明日の降水確率は30%です」
→ 雨が降るかどうか分からないけど、30%の可能性がある
例2:くじ引き
「100本中、当たりは5本」
→ 当たる可能性は5%
例3:ゲームのガチャ
「レアキャラが出る確率は1%」
→ 100回引いて1回くらい出る
📐 確率の計算式
簡単に言うと
確率 = 「当たり」の数 ÷ 「全部」の数
ステップ1:全部の数を数える
サイコロの目は 1, 2, 3, 4, 5, 6 の6個
ステップ2:当たりの数を数える
「3」は1個だけ
ステップ3:計算する
$P(3) = \dfrac{1}{6} \approx 0.167 = 16.7\%$
📊 確率の値の範囲
| 確率の値 | 意味 | 例 |
| $P(A) = 0$ | 絶対に起こらない | サイコロで7が出る |
| $P(A) = 0.5$ | 半分の確率で起こる | コインで表が出る |
| $P(A) = 1$ | 必ず起こる | サイコロで1〜6が出る |
📋 確率の表し方(3種類)
同じ確率を3つの方法で表せます。
| 表し方 | コインで表が出る確率 | サイコロで6が出る確率 |
| 分数 | $\dfrac{1}{2}$ | $\dfrac{1}{6}$ |
| 小数 | $0.5$ | $\approx 0.167$ |
| パーセント | $50\%$ | $\approx 16.7\%$ |
💼 データ分析での確率
- マーケティング: 顧客が商品を購入する確率
- 医療: 治療が成功する確率
- 金融: 株価が上がる確率
- 機械学習: モデルの予測が正解する確率
2. 確率の3つの法則
📚 法則①:和の法則(「または」の確率)
※ AとBが同時に起こらない場合(排反事象)
記号の意味
$\cup$(ユニオン):「または」という意味
$P(A \cup B)$:「AまたはBが起こる確率」
ステップ1:それぞれの確率を求める
$P(1) = \dfrac{1}{6}$、$P(2) = \dfrac{1}{6}$
ステップ2:同時に起こる?
1と2は同時に出ない → 和の法則が使える!
ステップ3:足し算する
$P(1 \cup 2) = \dfrac{1}{6} + \dfrac{1}{6} = \dfrac{2}{6} = \dfrac{1}{3} \approx 33.3\%$
📚 法則②:積の法則(「かつ」の確率)
※ AとBが互いに影響しない場合(独立事象)
記号の意味
$\cap$(インターセクション):「かつ」という意味
$P(A \cap B)$:「AかつBが起こる確率」(両方とも起こる)
ステップ1:それぞれの確率を求める
$P(\text{1回目が表}) = \dfrac{1}{2}$、$P(\text{2回目が表}) = \dfrac{1}{2}$
ステップ2:互いに影響する?
1回目と2回目は関係ない → 独立事象 → 積の法則が使える!
ステップ3:掛け算する
$P(\text{両方表}) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4} = 25\%$
📚 法則③:余事象の法則(「〜でない」の確率)
記号の意味
$A^c$(Aの補集合):「Aでない」「A以外」という意味
$P(A^c)$:「Aが起こらない確率」
方法1:普通に数える(面倒)
1以外 = 2, 3, 4, 5, 6 の5個 → $\dfrac{5}{6}$
方法2:余事象を使う(簡単!)
$P(1) = \dfrac{1}{6}$
$P(1^c) = 1 – \dfrac{1}{6} = \dfrac{5}{6} \approx 83.3\%$
問題:サイコロを2回振って「少なくとも1回は6が出る」確率は?
普通に計算すると大変:
「1回目だけ6」+「2回目だけ6」+「両方6」→ 3パターン計算…
余事象を使うと簡単:
「少なくとも1回は6」の反対 = 「1回も6が出ない」
$P(\text{両方とも6でない}) = \dfrac{5}{6} \times \dfrac{5}{6} = \dfrac{25}{36}$
$P(\text{少なくとも1回は6}) = 1 – \dfrac{25}{36} = \dfrac{11}{36} \approx 30.6\%$
📋 3つの法則まとめ
| 法則 | 使う言葉 | 計算方法 | 例 |
| 和の法則 | 「または」「どちらか」 | 足し算 | 1または2 |
| 積の法則 | 「かつ」「両方とも」 | 掛け算 | 2回とも表 |
| 余事象 | 「〜でない」「少なくとも」 | 1から引く | 1以外 |
3. 条件付き確率
🎯 条件付き確率とは
条件付き確率とは、「ある条件がついたときの確率」です。
クラスに30人(男子15人、女子15人)います。
男子のうち6人、女子のうち3人がメガネをかけています。
質問1:ランダムに1人選ぶとき、メガネの人の確率は?
→ $\dfrac{9}{30} = 30\%$
質問2:「男子」という条件がついたら?
→ 男子15人中、メガネは6人 → $\dfrac{6}{15} = 40\%$
条件がつくと、確率が変わる!
$P(A|B)$:「Bという条件のもとで、Aが起こる確率」
記号の意味
$|$(縦棒):「〜のとき」「〜という条件で」
$P(A|B)$:「Bが起こったという条件で、Aが起こる確率」
📊 具体例:トランプ
問題:52枚から2枚引く(戻さない)。1枚目がハートのとき、2枚目もハートの確率は?
ステップ1:状況を整理
最初:ハート13枚、全部52枚
1枚目でハートを引いた後:ハート12枚、全部51枚
ステップ2:条件付き確率を計算
$P(\text{2枚目ハート}|\text{1枚目ハート}) = \dfrac{12}{51} \approx 23.5\%$
💼 条件付き確率の応用
- 医療: 「検査が陽性」のとき「実際に病気」である確率
- マーケティング: 「20代の顧客」が「商品を購入」する確率
- スパムフィルター: 「特定の単語を含む」とき「スパムである」確率
4. 期待値
🎯 期待値とは
期待値とは、「長い目で見たときの平均」です。
= (値1 × 確率1) + (値2 × 確率2) + …
$E(X) = 1 \times \dfrac{1}{6} + 2 \times \dfrac{1}{6} + 3 \times \dfrac{1}{6} + 4 \times \dfrac{1}{6} + 5 \times \dfrac{1}{6} + 6 \times \dfrac{1}{6}$
$= \dfrac{1+2+3+4+5+6}{6} = \dfrac{21}{6} = 3.5$
答え:3.5(実際には出ない目だけど、平均するとこの値に近づく)
📊 くじ引きの期待値
問題:1回300円のくじ。当たり1000円(10本)、2等500円(20本)、3等100円(70本)、ハズレ0円(900本)。計1000本。期待値は?
ステップ1:確率を計算
1等:$\dfrac{10}{1000} = 0.01$、2等:$\dfrac{20}{1000} = 0.02$、3等:$\dfrac{70}{1000} = 0.07$、ハズレ:$0.90$
ステップ2:「金額 × 確率」を計算
$1000 \times 0.01 + 500 \times 0.02 + 100 \times 0.07 + 0 \times 0.90$
$= 10 + 10 + 7 + 0 = 27$円
結論:期待値27円 < くじの値段300円 → 損するくじ!
💼 期待値の応用
- 投資: 期待リターンを計算して投資判断
- 保険: 期待支払額から保険料を設定
- ゲーム: ガチャの期待値を計算
5. 順列と組合せ
📚 階乗(かいじょう)とは
• $3! = 3 \times 2 \times 1 = 6$
• $4! = 4 \times 3 \times 2 \times 1 = 24$
• $5! = 5 \times 4 \times 3 \times 2 \times 1 = 120$
📐 順列と組合せの違い
順列(P):「順番」を気にする
→ ABとBAは違う
組合せ(C):「順番」を気にしない
→ ABとBAは同じ
① 順列(Permutation)
$n$個から$r$個を選んで順番に並べる方法の数
例:$_5P_3$(5人から3人を選んで並べる)
1位:5人から選べる → 5通り
2位:残り4人から選べる → 4通り
3位:残り3人から選べる → 3通り
合計:$5 \times 4 \times 3 = 60$通り
② 組合せ(Combination)
$n$個から$r$個を選ぶ方法の数(順番は関係ない)
例:$_5C_3$(5人から3人を選ぶ)
ステップ1:順列を計算 → $_5P_3 = 60$
ステップ2:$r!$で割る → $3! = 6$
ステップ3:$_5C_3 = 60 \div 6 = 10$通り
📋 順列と組合せの比較
| 比較項目 | 順列(P) | 組合せ(C) |
| 順番 | 考慮する | 考慮しない |
| ABとBA | 別(2通り) | 同じ(1通り) |
| 5人から3人 | $_5P_3 = 60$通り | $_5C_3 = 10$通り |
| 使う場面 | 順位、並び順 | チーム分け、選抜 |
6. 練習問題(20問)
実際に問題を解いて理解を深めましょう。
基本の確率
サイコロを1回振るとき、偶数の目が出る確率を求めなさい。
【ステップ1】偶数の目を数える
偶数の目:2, 4, 6 の3つ
【ステップ2】全ての目を数える
全ての目:1, 2, 3, 4, 5, 6 の6つ
【ステップ3】確率を計算
$P(\text{偶数}) = \dfrac{3}{6} = \dfrac{1}{2} = 0.5 = 50\%$
基本の確率
コインを投げて表が出る確率を求めなさい。
表が出る場合:1通り
全ての場合:表または裏の2通り
$P(\text{表}) = \dfrac{1}{2} = 50\%$
基本の確率
52枚のトランプから1枚引くとき、ハートが出る確率を求めなさい。
ハートの枚数:13枚
全体の枚数:52枚
$P(\text{ハート}) = \dfrac{13}{52} = \dfrac{1}{4} = 25\%$
【ポイント】
トランプは4種類(ハート、ダイヤ、スペード、クラブ)各13枚ずつ
和の法則
サイコロを1回振るとき、1または2が出る確率を求めなさい。
【ステップ1】それぞれの確率
$P(1) = \dfrac{1}{6}$、$P(2) = \dfrac{1}{6}$
【ステップ2】同時に起こる?
1と2は同時に出ない → 和の法則が使える
【ステップ3】足し算
$P(1 \cup 2) = \dfrac{1}{6} + \dfrac{1}{6} = \dfrac{2}{6} = \dfrac{1}{3}$
【ポイント】「または」は足し算!
積の法則
コインを2回投げるとき、両方とも表が出る確率を求めなさい。
【ステップ1】それぞれの確率
$P(\text{1回目が表}) = \dfrac{1}{2}$、$P(\text{2回目が表}) = \dfrac{1}{2}$
【ステップ2】互いに影響する?
1回目と2回目は独立 → 積の法則が使える
【ステップ3】掛け算
$P(\text{両方表}) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4}$
【ポイント】「両方とも」は掛け算!
余事象
サイコロを1回振るとき、1以外の目が出る確率を求めなさい。
【余事象を使う】
$P(1) = \dfrac{1}{6}$
$P(1^c) = 1 – P(1) = 1 – \dfrac{1}{6} = \dfrac{5}{6}$
【ポイント】「〜以外」は余事象!1から引く!
余事象(応用)
サイコロを2回振るとき、少なくとも1回は6が出る確率を求めなさい。
【余事象を使う】
「少なくとも1回は6」の反対 = 「1回も6が出ない」
【計算】
$P(\text{1回目が6でない}) = \dfrac{5}{6}$
$P(\text{2回目が6でない}) = \dfrac{5}{6}$
$P(\text{両方とも6でない}) = \dfrac{5}{6} \times \dfrac{5}{6} = \dfrac{25}{36}$
$P(\text{少なくとも1回は6}) = 1 – \dfrac{25}{36} = \dfrac{11}{36}$
【ポイント】「少なくとも〜」は余事象を使うと簡単!
期待値
サイコロの目の期待値を求めなさい。
【計算】
$E(X) = 1 \times \dfrac{1}{6} + 2 \times \dfrac{1}{6} + 3 \times \dfrac{1}{6} + 4 \times \dfrac{1}{6} + 5 \times \dfrac{1}{6} + 6 \times \dfrac{1}{6}$
$= \dfrac{1+2+3+4+5+6}{6} = \dfrac{21}{6} = 3.5$
【ポイント】期待値 = (各値 × その確率)の合計
期待値(応用)
当たり確率10%で1000円もらえるくじ。外れたら0円。期待値は?
【計算】
$E(X) = 1000 \times 0.1 + 0 \times 0.9 = 100 + 0 = 100$円
【ポイント】このくじが100円以下なら得、100円より高ければ損
順列
5人の中から3人を選んで順番に並べる方法は何通りありますか?
【考え方】
順番を考慮するので、順列を使う
【計算】
$_5P_3 = 5 \times 4 \times 3 = 60$
【ポイント】「並べる」「順番」→ 順列(P)!
組合せ
5人の中から3人を選ぶ方法は何通りありますか?
【考え方】
順番を考慮しないので、組合せを使う
【計算】
$_5C_3 = \dfrac{5 \times 4 \times 3}{3 \times 2 \times 1} = \dfrac{60}{6} = 10$
【ポイント】「選ぶ」「グループ」→ 組合せ(C)!
条件付き確率
52枚のトランプから2枚引く(戻さない)。1枚目がハートのとき、2枚目もハートの確率は?
【状況】
1枚目でハートを引いた後:
残り51枚中、ハートは12枚
【計算】
$P(\text{2枚目ハート}|\text{1枚目ハート}) = \dfrac{12}{51}$
【ポイント】戻さない場合、1枚目の結果が2枚目に影響する
連続した試行
サイコロを3回振るとき、全て異なる目が出る確率を求めなさい。
【ステップ1】1回目
何でもOK:確率 = $\dfrac{6}{6} = 1$
【ステップ2】2回目
1回目と異なる目:確率 = $\dfrac{5}{6}$
【ステップ3】3回目
1,2回目と異なる目:確率 = $\dfrac{4}{6}$
【ステップ4】掛け算
$P = 1 \times \dfrac{5}{6} \times \dfrac{4}{6} = \dfrac{20}{36} = \dfrac{5}{9}$
組合せ(応用)
6人を3人ずつ2つのグループに分ける方法は何通りありますか?(グループに区別なし)
【ステップ1】6人から3人を選ぶ
$_6C_3 = \dfrac{6 \times 5 \times 4}{3 \times 2 \times 1} = \dfrac{120}{6} = 20$
【ステップ2】グループの区別がない場合
$20 \div 2 = 10$通り
【ポイント】グループに区別がないと、ABCとDEF、DEFとABCは同じ分け方
階乗
「ABCDE」の5文字を並べ替える方法は何通りありますか?
【計算】
5文字全てを並べる → $5!$
$5! = 5 \times 4 \times 3 \times 2 \times 1 = 120$
【ポイント】$n$個全てを並べる → $n!$($n$の階乗)
確率と組合せ
赤玉3個、白玉2個の袋から2個取り出す。両方赤の確率は?
【ステップ1】全ての取り出し方
$_5C_2 = \dfrac{5 \times 4}{2 \times 1} = 10$通り
【ステップ2】赤玉2個を取り出す方法
$_3C_2 = \dfrac{3 \times 2}{2 \times 1} = 3$通り
【ステップ3】確率を計算
$P = \dfrac{3}{10} = 30\%$
ベイズの定理(応用)
病気1%、検査の精度95%(病気→陽性)、偽陽性5%(健康→陽性)。陽性のとき、本当に病気の確率は?
【1000人を想定】
病気の人:10人、健康な人:990人
【陽性と判定される人数】
病気で陽性:$10 \times 0.95 = 9.5$人
健康で陽性:$990 \times 0.05 = 49.5$人
陽性の合計:$9.5 + 49.5 = 59$人
【確率を計算】
$P(\text{病気}|\text{陽性}) = \dfrac{9.5}{59} \approx 16.1\%$
【ポイント】検査精度が高くても、病気の割合が低いと、陽性でも実際に病気である確率は低い!
期待値の比較
A:利益200円(70%)、B:利益500円(40%)、C:利益1000円(20%)。どれが最も期待利益が高い?
【計算】
A:$200 \times 0.7 = 140$円
B:$500 \times 0.4 = 200$円
C:$1000 \times 0.2 = 200$円
【ポイント】利益が大きくても確率が低いと期待値は小さくなる
順列(役職)
10人の中から委員長1人、副委員長1人を選ぶ方法は何通り?
【考え方】
委員長と副委員長は役職が違う → 順番を考慮 → 順列
【計算】
$_{10}P_2 = 10 \times 9 = 90$
【ポイント】役職が異なる → 順列
連続した確率(ファネル分析)
訪問者の30%が商品ページを見て、そのうち10%が購入。訪問者が購入する確率は?
【計算】
$P(\text{商品ページを見る}) = 0.3$
$P(\text{購入}|\text{商品ページを見る}) = 0.1$
$P(\text{購入}) = 0.3 \times 0.1 = 0.03 = 3\%$
【データ分析での応用】
これは「ファネル分析」と呼ばれ、デジタルマーケティングでよく使います。
訪問 → 商品ページ → カート → 購入 の各段階の確率を掛け算
📚 このステップのまとめ
1. 確率の基本
$P(A) = \dfrac{\text{当たりの数}}{\text{全部の数}}$ ($0 \leqq P(A) \leqq 1$)
2. 3つの法則
• 和:「または」→ 足し算
• 積:「かつ」→ 掛け算
• 余事象:「〜でない」→ 1から引く
3. 期待値
$E(X) = \sum(\text{値} \times \text{確率})$
4. 順列と組合せ
• 順列(P):順番を考慮
• 組合せ(C):順番を考慮しない
例題を復習して、確率の基本計算ができるようになったらステップ7に進みましょう!
次は「統計の基礎」を学びます。
学習メモ
数学基礎 - Step 6