ステップ6:確率の基礎

📊 ステップ6:確率の基礎

データ分析の基本となる確率を学ぼう!

📚 このステップで学ぶこと

  • 確率とは何か?(基本の考え方)
  • 確率の3つの法則(和・積・余事象)
  • 条件付き確率
  • 期待値の計算
  • 順列と組合せ
📝 例題: 20問
🎯 到達目標: 確率の基本公式を使いこなし、期待値や組合せを計算できる

1. 確率とは何か?

🎯 確率を一言で言うと

確率とは、「ある出来事が起こる可能性を0〜1の数字で表したもの」です。

身近な例で理解しよう

例1:天気予報
「明日の降水確率は30%です」
→ 雨が降るかどうか分からないけど、30%の可能性がある

例2:くじ引き
「100本中、当たりは5本」
→ 当たる可能性は5%

例3:ゲームのガチャ
「レアキャラが出る確率は1%」
→ 100回引いて1回くらい出る

📐 確率の計算式

$P(A) = \dfrac{\text{Aが起こる場合の数}}{\text{全ての場合の数}}$

簡単に言うと

確率 = 「当たり」の数 ÷ 「全部」の数

🎲 具体例:サイコロで「3」が出る確率

ステップ1:全部の数を数える
サイコロの目は 1, 2, 3, 4, 5, 6 の6個

ステップ2:当たりの数を数える
「3」は1個だけ

ステップ3:計算する
$P(3) = \dfrac{1}{6} \approx 0.167 = 16.7\%$

📊 確率の値の範囲

$0 \leqq P(A) \leqq 1$
確率の値 意味
$P(A) = 0$ 絶対に起こらない サイコロで7が出る
$P(A) = 0.5$ 半分の確率で起こる コインで表が出る
$P(A) = 1$ 必ず起こる サイコロで1〜6が出る

📋 確率の表し方(3種類)

同じ確率を3つの方法で表せます。

表し方 コインで表が出る確率 サイコロで6が出る確率
分数 $\dfrac{1}{2}$ $\dfrac{1}{6}$
小数 $0.5$ $\approx 0.167$
パーセント $50\%$ $\approx 16.7\%$

💼 データ分析での確率

  • マーケティング: 顧客が商品を購入する確率
  • 医療: 治療が成功する確率
  • 金融: 株価が上がる確率
  • 機械学習: モデルの予測が正解する確率

2. 確率の3つの法則

📚 法則①:和の法則(「または」の確率)

$P(A \cup B) = P(A) + P(B)$

※ AとBが同時に起こらない場合(排反事象)

記号の意味

$\cup$(ユニオン):「または」という意味

$P(A \cup B)$:「AまたはBが起こる確率」

📝 例:サイコロで「1または2」が出る確率

ステップ1:それぞれの確率を求める
$P(1) = \dfrac{1}{6}$、$P(2) = \dfrac{1}{6}$

ステップ2:同時に起こる?
1と2は同時に出ない → 和の法則が使える!

ステップ3:足し算する
$P(1 \cup 2) = \dfrac{1}{6} + \dfrac{1}{6} = \dfrac{2}{6} = \dfrac{1}{3} \approx 33.3\%$
💡 ポイント:「または」「どちらか」のときは足し算

📚 法則②:積の法則(「かつ」の確率)

$P(A \cap B) = P(A) \times P(B)$

※ AとBが互いに影響しない場合(独立事象)

記号の意味

$\cap$(インターセクション):「かつ」という意味

$P(A \cap B)$:「AかつBが起こる確率」(両方とも起こる)

📝 例:コインを2回投げて、両方とも表が出る確率

ステップ1:それぞれの確率を求める
$P(\text{1回目が表}) = \dfrac{1}{2}$、$P(\text{2回目が表}) = \dfrac{1}{2}$

ステップ2:互いに影響する?
1回目と2回目は関係ない → 独立事象 → 積の法則が使える!

ステップ3:掛け算する
$P(\text{両方表}) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4} = 25\%$
💡 ポイント:「かつ」「両方とも」「連続で」のときは掛け算

📚 法則③:余事象の法則(「〜でない」の確率)

$P(A^c) = 1 – P(A)$

記号の意味

$A^c$(Aの補集合):「Aでない」「A以外」という意味

$P(A^c)$:「Aが起こらない確率」

📝 例:サイコロで「1以外」が出る確率

方法1:普通に数える(面倒)
1以外 = 2, 3, 4, 5, 6 の5個 → $\dfrac{5}{6}$

方法2:余事象を使う(簡単!)
$P(1) = \dfrac{1}{6}$
$P(1^c) = 1 – \dfrac{1}{6} = \dfrac{5}{6} \approx 83.3\%$
🎯 余事象が特に便利な場面

問題:サイコロを2回振って「少なくとも1回は6が出る」確率は?

普通に計算すると大変:
「1回目だけ6」+「2回目だけ6」+「両方6」→ 3パターン計算…

余事象を使うと簡単:
「少なくとも1回は6」の反対 = 「1回も6が出ない」
$P(\text{両方とも6でない}) = \dfrac{5}{6} \times \dfrac{5}{6} = \dfrac{25}{36}$
$P(\text{少なくとも1回は6}) = 1 – \dfrac{25}{36} = \dfrac{11}{36} \approx 30.6\%$
💡 ポイント:「〜でない」「〜以外」「少なくとも」のときは1から引く

📋 3つの法則まとめ

法則 使う言葉 計算方法
和の法則 「または」「どちらか」 足し算 1または2
積の法則 「かつ」「両方とも」 掛け算 2回とも表
余事象 「〜でない」「少なくとも」 1から引く 1以外

3. 条件付き確率

🎯 条件付き確率とは

条件付き確率とは、「ある条件がついたときの確率」です。

例:クラスで考えよう

クラスに30人(男子15人、女子15人)います。
男子のうち6人、女子のうち3人がメガネをかけています。

質問1:ランダムに1人選ぶとき、メガネの人の確率は?
→ $\dfrac{9}{30} = 30\%$

質問2:「男子」という条件がついたら?
→ 男子15人中、メガネは6人 → $\dfrac{6}{15} = 40\%$

条件がつくと、確率が変わる!
$P(A|B) = \dfrac{P(A \cap B)}{P(B)}$

$P(A|B)$:「Bという条件のもとで、Aが起こる確率」

記号の意味

$|$(縦棒):「〜のとき」「〜という条件で」

$P(A|B)$:「Bが起こったという条件で、Aが起こる確率」

📊 具体例:トランプ

問題:52枚から2枚引く(戻さない)。1枚目がハートのとき、2枚目もハートの確率は?

ステップ1:状況を整理

最初:ハート13枚、全部52枚

1枚目でハートを引いた後:ハート12枚、全部51枚


ステップ2:条件付き確率を計算

$P(\text{2枚目ハート}|\text{1枚目ハート}) = \dfrac{12}{51} \approx 23.5\%$

💼 条件付き確率の応用

  • 医療: 「検査が陽性」のとき「実際に病気」である確率
  • マーケティング: 「20代の顧客」が「商品を購入」する確率
  • スパムフィルター: 「特定の単語を含む」とき「スパムである」確率

4. 期待値

🎯 期待値とは

期待値とは、「長い目で見たときの平均」です。

$E(X) = \sum (\text{値} \times \text{確率})$

= (値1 × 確率1) + (値2 × 確率2) + …
📝 例:サイコロの目の期待値

$E(X) = 1 \times \dfrac{1}{6} + 2 \times \dfrac{1}{6} + 3 \times \dfrac{1}{6} + 4 \times \dfrac{1}{6} + 5 \times \dfrac{1}{6} + 6 \times \dfrac{1}{6}$

$= \dfrac{1+2+3+4+5+6}{6} = \dfrac{21}{6} = 3.5$

答え:3.5(実際には出ない目だけど、平均するとこの値に近づく)

📊 くじ引きの期待値

問題:1回300円のくじ。当たり1000円(10本)、2等500円(20本)、3等100円(70本)、ハズレ0円(900本)。計1000本。期待値は?

ステップ1:確率を計算

1等:$\dfrac{10}{1000} = 0.01$、2等:$\dfrac{20}{1000} = 0.02$、3等:$\dfrac{70}{1000} = 0.07$、ハズレ:$0.90$


ステップ2:「金額 × 確率」を計算

$1000 \times 0.01 + 500 \times 0.02 + 100 \times 0.07 + 0 \times 0.90$

$= 10 + 10 + 7 + 0 = 27$円


結論:期待値27円 < くじの値段300円 → 損するくじ!

💼 期待値の応用

  • 投資: 期待リターンを計算して投資判断
  • 保険: 期待支払額から保険料を設定
  • ゲーム: ガチャの期待値を計算

5. 順列と組合せ

📚 階乗(かいじょう)とは

$n! = n \times (n-1) \times (n-2) \times \cdots \times 2 \times 1$
具体例
• $3! = 3 \times 2 \times 1 = 6$
• $4! = 4 \times 3 \times 2 \times 1 = 24$
• $5! = 5 \times 4 \times 3 \times 2 \times 1 = 120$
💡 意味:$n!$ は「$n$個のものを並べる方法の数」

📐 順列と組合せの違い

🎯 超重要!

順列(P):「順番」を気にする
→ ABとBAは違う

組合せ(C):「順番」を気にしない
→ ABとBAは同じ

① 順列(Permutation)

$_nP_r = n \times (n-1) \times \cdots \times (n-r+1)$

$n$個から$r$個を選んで順番に並べる方法の数

例:$_5P_3$(5人から3人を選んで並べる)

1位:5人から選べる → 5通り

2位:残り4人から選べる → 4通り

3位:残り3人から選べる → 3通り

合計:$5 \times 4 \times 3 = 60$通り

💡 使う場面:「並べる」「順位」「順番」など、順番が大事なとき

② 組合せ(Combination)

$_nC_r = \dfrac{_nP_r}{r!} = \dfrac{n!}{r!(n-r)!}$

$n$個から$r$個を選ぶ方法の数(順番は関係ない)

例:$_5C_3$(5人から3人を選ぶ)

ステップ1:順列を計算 → $_5P_3 = 60$

ステップ2:$r!$で割る → $3! = 6$

ステップ3:$_5C_3 = 60 \div 6 = 10$通り

💡 使う場面:「選ぶ」「チームを作る」など、順番が関係ないとき

📋 順列と組合せの比較

比較項目 順列(P) 組合せ(C)
順番 考慮する 考慮しない
ABとBA 別(2通り) 同じ(1通り)
5人から3人 $_5P_3 = 60$通り $_5C_3 = 10$通り
使う場面 順位、並び順 チーム分け、選抜

6. 練習問題(20問)

実際に問題を解いて理解を深めましょう。

例題 1

基本の確率

サイコロを1回振るとき、偶数の目が出る確率を求めなさい。

解答: $\dfrac{1}{2}$(50%)

【ステップ1】偶数の目を数える
偶数の目:2, 4, 6 の3つ

【ステップ2】全ての目を数える
全ての目:1, 2, 3, 4, 5, 6 の6つ

【ステップ3】確率を計算
$P(\text{偶数}) = \dfrac{3}{6} = \dfrac{1}{2} = 0.5 = 50\%$
例題 2

基本の確率

コインを投げて表が出る確率を求めなさい。

解答: $\dfrac{1}{2}$(50%)

表が出る場合:1通り
全ての場合:表または裏の2通り
$P(\text{表}) = \dfrac{1}{2} = 50\%$
例題 3

基本の確率

52枚のトランプから1枚引くとき、ハートが出る確率を求めなさい。

解答: $\dfrac{1}{4}$(25%)

ハートの枚数:13枚
全体の枚数:52枚
$P(\text{ハート}) = \dfrac{13}{52} = \dfrac{1}{4} = 25\%$

【ポイント】
トランプは4種類(ハート、ダイヤ、スペード、クラブ)各13枚ずつ
例題 4

和の法則

サイコロを1回振るとき、1または2が出る確率を求めなさい。

解答: $\dfrac{1}{3}$(約33.3%)

【ステップ1】それぞれの確率
$P(1) = \dfrac{1}{6}$、$P(2) = \dfrac{1}{6}$

【ステップ2】同時に起こる?
1と2は同時に出ない → 和の法則が使える

【ステップ3】足し算
$P(1 \cup 2) = \dfrac{1}{6} + \dfrac{1}{6} = \dfrac{2}{6} = \dfrac{1}{3}$

【ポイント】「または」は足し算!
例題 5

積の法則

コインを2回投げるとき、両方とも表が出る確率を求めなさい。

解答: $\dfrac{1}{4}$(25%)

【ステップ1】それぞれの確率
$P(\text{1回目が表}) = \dfrac{1}{2}$、$P(\text{2回目が表}) = \dfrac{1}{2}$

【ステップ2】互いに影響する?
1回目と2回目は独立 → 積の法則が使える

【ステップ3】掛け算
$P(\text{両方表}) = \dfrac{1}{2} \times \dfrac{1}{2} = \dfrac{1}{4}$

【ポイント】「両方とも」は掛け算!
例題 6

余事象

サイコロを1回振るとき、1以外の目が出る確率を求めなさい。

解答: $\dfrac{5}{6}$(約83.3%)

【余事象を使う】
$P(1) = \dfrac{1}{6}$
$P(1^c) = 1 – P(1) = 1 – \dfrac{1}{6} = \dfrac{5}{6}$

【ポイント】「〜以外」は余事象!1から引く!
例題 7

余事象(応用)

サイコロを2回振るとき、少なくとも1回は6が出る確率を求めなさい。

解答: $\dfrac{11}{36}$(約30.6%)

【余事象を使う】
「少なくとも1回は6」の反対 = 「1回も6が出ない」

【計算】
$P(\text{1回目が6でない}) = \dfrac{5}{6}$
$P(\text{2回目が6でない}) = \dfrac{5}{6}$
$P(\text{両方とも6でない}) = \dfrac{5}{6} \times \dfrac{5}{6} = \dfrac{25}{36}$
$P(\text{少なくとも1回は6}) = 1 – \dfrac{25}{36} = \dfrac{11}{36}$

【ポイント】「少なくとも〜」は余事象を使うと簡単!
例題 8

期待値

サイコロの目の期待値を求めなさい。

解答: 3.5

【計算】
$E(X) = 1 \times \dfrac{1}{6} + 2 \times \dfrac{1}{6} + 3 \times \dfrac{1}{6} + 4 \times \dfrac{1}{6} + 5 \times \dfrac{1}{6} + 6 \times \dfrac{1}{6}$

$= \dfrac{1+2+3+4+5+6}{6} = \dfrac{21}{6} = 3.5$

【ポイント】期待値 = (各値 × その確率)の合計
例題 9

期待値(応用)

当たり確率10%で1000円もらえるくじ。外れたら0円。期待値は?

解答: 100円

【計算】
$E(X) = 1000 \times 0.1 + 0 \times 0.9 = 100 + 0 = 100$円

【ポイント】このくじが100円以下なら得、100円より高ければ損
例題 10

順列

5人の中から3人を選んで順番に並べる方法は何通りありますか?

解答: 60通り

【考え方】
順番を考慮するので、順列を使う

【計算】
$_5P_3 = 5 \times 4 \times 3 = 60$

【ポイント】「並べる」「順番」→ 順列(P)!
例題 11

組合せ

5人の中から3人を選ぶ方法は何通りありますか?

解答: 10通り

【考え方】
順番を考慮しないので、組合せを使う

【計算】
$_5C_3 = \dfrac{5 \times 4 \times 3}{3 \times 2 \times 1} = \dfrac{60}{6} = 10$

【ポイント】「選ぶ」「グループ」→ 組合せ(C)!
例題 12

条件付き確率

52枚のトランプから2枚引く(戻さない)。1枚目がハートのとき、2枚目もハートの確率は?

解答: $\dfrac{12}{51}$(約23.5%)

【状況】
1枚目でハートを引いた後:
残り51枚中、ハートは12枚

【計算】
$P(\text{2枚目ハート}|\text{1枚目ハート}) = \dfrac{12}{51}$

【ポイント】戻さない場合、1枚目の結果が2枚目に影響する
例題 13

連続した試行

サイコロを3回振るとき、全て異なる目が出る確率を求めなさい。

解答: $\dfrac{5}{9}$(約55.6%)

【ステップ1】1回目
何でもOK:確率 = $\dfrac{6}{6} = 1$

【ステップ2】2回目
1回目と異なる目:確率 = $\dfrac{5}{6}$

【ステップ3】3回目
1,2回目と異なる目:確率 = $\dfrac{4}{6}$

【ステップ4】掛け算
$P = 1 \times \dfrac{5}{6} \times \dfrac{4}{6} = \dfrac{20}{36} = \dfrac{5}{9}$
例題 14

組合せ(応用)

6人を3人ずつ2つのグループに分ける方法は何通りありますか?(グループに区別なし)

解答: 10通り

【ステップ1】6人から3人を選ぶ
$_6C_3 = \dfrac{6 \times 5 \times 4}{3 \times 2 \times 1} = \dfrac{120}{6} = 20$

【ステップ2】グループの区別がない場合
$20 \div 2 = 10$通り

【ポイント】グループに区別がないと、ABCとDEF、DEFとABCは同じ分け方
例題 15

階乗

「ABCDE」の5文字を並べ替える方法は何通りありますか?

解答: 120通り

【計算】
5文字全てを並べる → $5!$
$5! = 5 \times 4 \times 3 \times 2 \times 1 = 120$

【ポイント】$n$個全てを並べる → $n!$($n$の階乗)
例題 16

確率と組合せ

赤玉3個、白玉2個の袋から2個取り出す。両方赤の確率は?

解答: $\dfrac{3}{10}$(30%)

【ステップ1】全ての取り出し方
$_5C_2 = \dfrac{5 \times 4}{2 \times 1} = 10$通り

【ステップ2】赤玉2個を取り出す方法
$_3C_2 = \dfrac{3 \times 2}{2 \times 1} = 3$通り

【ステップ3】確率を計算
$P = \dfrac{3}{10} = 30\%$
例題 17

ベイズの定理(応用)

病気1%、検査の精度95%(病気→陽性)、偽陽性5%(健康→陽性)。陽性のとき、本当に病気の確率は?

解答: 約16.1%

【1000人を想定】
病気の人:10人、健康な人:990人

【陽性と判定される人数】
病気で陽性:$10 \times 0.95 = 9.5$人
健康で陽性:$990 \times 0.05 = 49.5$人
陽性の合計:$9.5 + 49.5 = 59$人

【確率を計算】
$P(\text{病気}|\text{陽性}) = \dfrac{9.5}{59} \approx 16.1\%$

【ポイント】検査精度が高くても、病気の割合が低いと、陽性でも実際に病気である確率は低い!
例題 18

期待値の比較

A:利益200円(70%)、B:利益500円(40%)、C:利益1000円(20%)。どれが最も期待利益が高い?

解答: BとCが同じで最も高い(200円)

【計算】
A:$200 \times 0.7 = 140$円
B:$500 \times 0.4 = 200$円
C:$1000 \times 0.2 = 200$円

【ポイント】利益が大きくても確率が低いと期待値は小さくなる
例題 19

順列(役職)

10人の中から委員長1人、副委員長1人を選ぶ方法は何通り?

解答: 90通り

【考え方】
委員長と副委員長は役職が違う → 順番を考慮 → 順列

【計算】
$_{10}P_2 = 10 \times 9 = 90$

【ポイント】役職が異なる → 順列
例題 20

連続した確率(ファネル分析)

訪問者の30%が商品ページを見て、そのうち10%が購入。訪問者が購入する確率は?

解答: 3%

【計算】
$P(\text{商品ページを見る}) = 0.3$
$P(\text{購入}|\text{商品ページを見る}) = 0.1$
$P(\text{購入}) = 0.3 \times 0.1 = 0.03 = 3\%$

【データ分析での応用】
これは「ファネル分析」と呼ばれ、デジタルマーケティングでよく使います。
訪問 → 商品ページ → カート → 購入 の各段階の確率を掛け算

📚 このステップのまとめ

📌 覚えておくべきこと

1. 確率の基本
$P(A) = \dfrac{\text{当たりの数}}{\text{全部の数}}$ ($0 \leqq P(A) \leqq 1$)

2. 3つの法則
• 和:「または」→ 足し算
• 積:「かつ」→ 掛け算
• 余事象:「〜でない」→ 1から引く

3. 期待値
$E(X) = \sum(\text{値} \times \text{確率})$

4. 順列と組合せ
• 順列(P):順番を考慮
• 組合せ(C):順番を考慮しない
🎯 次のステップへ進む前に
例題を復習して、確率の基本計算ができるようになったらステップ7に進みましょう!
次は「統計の基礎」を学びます。
📝

学習メモ

数学基礎 - Step 6

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE