STEP 8:仮説検定の基礎

🔬 STEP 8: 仮説検定の基礎

帰無仮説、対立仮説、p値の考え方を理解しよう

📖 このステップで学ぶこと

仮説検定は統計学で最も重要な手法の1つです。データから科学的な結論を導く方法を学びます。

📝 練習問題: 20問
🎯 到達目標: 仮説検定の考え方を説明できる、帰無仮説と対立仮説を正しく設定できる、有意水準と棄却域の意味を理解する、第一種の誤り・第二種の誤りを説明できる、p値の意味を正しく理解する

1️⃣ 仮説検定の考え方(背理法的アプローチ)

仮説検定とは

仮説検定(hypothesis testing)
標本データから、母集団についての仮説が正しいかどうかを統計的に判断する方法

基本的な考え方:
「差がない」という仮説を立てて、それを否定できるかを調べる
背理法と同じ論理

仮説検定の流れ

仮説検定の手順(5ステップ)

仮説を立てる
 帰無仮説H₀と対立仮説H₁を設定

有意水準を決める
 α = 0.05(5%)が一般的

検定統計量を計算
 標本データから計算

棄却域を求める(またはp値を計算)
 有意水準から決まる

判定
 検定統計量が棄却域に入れば帰無仮説を棄却
【背理法との対応】

数学の背理法:
「Aでない」と仮定 → 矛盾が生じる → 「A」が正しい

仮説検定:
「効果がない」と仮定 → データと矛盾 → 「効果がある」と結論
        
【イメージで理解:新薬の効果を調べる】

「効果がない」(H₀)という仮説を立てる
        ↓
データを取る(患者100人に投与)
        ↓
もし「効果がない」のに、
こんな良い結果が出る確率は0.01%しかない
        ↓
「効果がない」という仮説は間違っているだろう
        ↓
「効果がある」と結論
        

2️⃣ 帰無仮説H₀と対立仮説H₁の設定

帰無仮説(Null Hypothesis)

帰無仮説 H₀
「差がない」「効果がない」「関係がない」という仮説

記号: H₀(エイチゼロ、エイチノート)

例:
• μ = μ₀(母平均はμ₀に等しい)
• μ₁ = μ₂(2つの母平均は等しい)
• p = p₀(母比率はp₀に等しい)

対立仮説(Alternative Hypothesis)

対立仮説 H₁
帰無仮説を否定する仮説。証明したい主張

記号: H₁(エイチワン)またはHₐ

3つの形:
• μ ≠ μ₀(両側検定)
• μ > μ₀(右片側検定)
• μ < μ₀(左片側検定)
⚡ なぜ「差がない」を帰無仮説にするのか?

背理法と同じ論理:
「Aでない」を仮定して矛盾を導く → 「A」が正しい

統計学では:
「効果がない」を仮定してデータと矛盾 → 「効果がある」と結論

これにより、客観的で科学的な判断ができる!
例題1: 新薬の効果を調べる実験。
従来の薬の平均効果時間は50分。
新薬の方が効果が長いかを調べたい。
帰無仮説と対立仮説を設定しなさい。
解答:
H₀: μ = 50(新薬の効果時間は50分)
H₁: μ > 50(新薬の効果時間は50分より長い)



【ステップ1: 問題文から「証明したいこと」を確認】

「新薬の方が効果が長いかを調べたい」
→ 証明したいこと = 「新薬の効果時間 > 50分」



【ステップ2: 対立仮説H₁を決める】

証明したいことを対立仮説にする:
H₁: μ > 50(新薬の効果時間は50分より長い)



【ステップ3: 帰無仮説H₀を決める】

対立仮説の否定(差がない状態)を帰無仮説にする:
H₀: μ = 50(新薬の効果時間は50分と同じ)



【ステップ4: 検定の種類を確認】

H₁: μ > 50 なので「右片側検定

【3種類の検定】
両側検定:   H₁: μ ≠ μ₀(等しくない)
右片側検定: H₁: μ > μ₀(より大きい)← 今回はこれ
左片側検定: H₁: μ < μ₀(より小さい)

---

【仮説設定のコツ】
1. 証明したいことを対立仮説H₁にする
2. 帰無仮説H₀は「差がない」「等しい」の形
3. H₁の不等号の向きで検定の種類が決まる
   ・「大きいか」→ 右片側(>)
   ・「小さいか」→ 左片側(<)
   ・「異なるか」→ 両側(≠)

---

【よくある間違い】
❌ H₀: μ ≠ 50, H₁: μ = 50
→ H₀とH₁が逆!

❌ H₀: μ < 50, H₁: μ > 50
→ H₀は「=」の形にする

✅ H₀: μ = 50, H₁: μ > 50
→ 正しい設定

3️⃣ 有意水準(α)と棄却域

有意水準

有意水準(significance level)
記号: α(アルファ)

帰無仮説を棄却する基準
「帰無仮説が正しいのに、誤って棄却してしまう確率の上限」

よく使われる値:
• α = 0.05(5%)← 最も一般的
• α = 0.01(1%)← より厳しい基準
• α = 0.10(10%)← より緩い基準

棄却域

棄却域(rejection region)
検定統計量がこの範囲に入ったら、帰無仮説を棄却する領域

採択域(acceptance region)
検定統計量がこの範囲なら、帰無仮説を棄却しない領域

有意水準αによって棄却域が決まる
⚡ 両側検定と片側検定の棄却域

両側検定(H₁: μ ≠ μ₀)
棄却域: |Z| > z(α/2)
α=0.05なら |Z| > 1.96

右片側検定(H₁: μ > μ₀)
棄却域: Z > z(α)
α=0.05なら Z > 1.645

左片側検定(H₁: μ < μ₀)
棄却域: Z < -z(α)
α=0.05なら Z < -1.645
【図で理解:α=0.05の場合】

【両側検定】α=0.05
両側に2.5%ずつ振り分け
         ←── 95% ──→
    ┌────────────────────┐
2.5%│     採択域         │2.5%
────┴────────────────────┴────
  -1.96       0       1.96
 ← 棄却域              棄却域 →

【右片側検定】α=0.05
右側に5%
         ←── 95% ──→
    ┌─────────────────────┐
    │     採択域          │5%
────┴─────────────────────┴────
            0          1.645
                       棄却域 →
        

4️⃣ 第一種の誤り(α)・第二種の誤り(β)

仮説検定の判定結果

4つの可能性

  H₀が真実 H₁が真実
H₀を棄却しない ✅ 正しい判定 ❌ 第二種の誤り(β)
H₀を棄却 ❌ 第一種の誤り(α) ✅ 正しい判定

第一種の誤り

第一種の誤り(Type I error)
帰無仮説H₀が真実なのに、誤って棄却してしまう誤り

確率: α(有意水準)

例:
効果がない薬を「効果がある」と判断
→「偽陽性(False Positive)」

第二種の誤り

第二種の誤り(Type II error)
対立仮説H₁が真実なのに、帰無仮説を棄却できない誤り

確率: β(ベータ)

例:
効果がある薬を「効果がない」と判断
→「偽陰性(False Negative)」

検出力(power)
1 - β = 正しく帰無仮説を棄却できる確率
【覚え方:医療検査のイメージ】

病気の検査で考えると:

第一種の誤り(α)= 偽陽性
・健康なのに「病気」と診断
・不必要な治療を受けてしまう

第二種の誤り(β)= 偽陰性
・病気なのに「健康」と診断
・治療の機会を逃してしまう

どちらも避けたいが、完全には避けられない!
        
⚡ αとβのトレードオフ

αを小さくする(厳しい基準)
→ βが大きくなる(見逃しが増える)

通常はαを制御して、βは結果的に決まる
サンプルサイズを増やせば、両方を小さくできる!

5️⃣ p値の意味と解釈

p値とは

p値(p-value)
帰無仮説が正しいと仮定したとき、
観測されたデータ(またはそれより極端なデータ)が
得られる確率

判定:
• p値 < α → 帰無仮説を棄却(有意)
• p値 ≥ α → 帰無仮説を棄却しない(有意でない)
⚠️ p値のよくある誤解

❌ 間違い:
「帰無仮説が正しい確率がp値」

✅ 正しい:
「帰無仮説が正しいとしたとき、このデータが出る確率がp値」

p値は仮説の確率ではない!
データの確率である!
例題2: ある検定でp値 = 0.03 だった。
α = 0.05 のとき、どう判定するか?
解答: 帰無仮説を棄却する(有意)

---

【ステップ1: 与えられた情報を整理】
・p値 = 0.03
・有意水準: α = 0.05
・求めるもの: H₀を棄却するかどうか

---

【ステップ2: 判定ルールを確認】

p値とαの比較:
• p値 < α → H₀を棄却(有意)
• p値 ≥ α → H₀を棄却しない(有意でない)

---

【ステップ3: 比較する】

p値(0.03) と α(0.05) を比較:

0.03 < 0.05

p値 < α なので...

---

【ステップ4: 結論を述べる】

帰無仮説H₀を棄却する(有意)

---

【p値の意味を確認】
p値 = 0.03 の意味:
「帰無仮説が正しいなら、
 こんなデータが出る確率は3%しかない」

3%しかないことが起きた!
→ 帰無仮説は間違っていそう
→ 帰無仮説を棄却

---

【結果の書き方の例】
報告文の例:
「p = 0.03 < 0.05 より、有意水準5%で
 帰無仮説を棄却する。
 したがって、(対立仮説の内容)と
 結論できる。」

---

【p値の目安】
p < 0.001  : 非常に強い証拠(***)
p < 0.01   : 強い証拠(**)
p < 0.05   : 有意(*)
p ≥ 0.05   : 有意でない(n.s.)

※ただし、0.049と0.051は本質的にほぼ同じ
💡 p値のポイント
小さいほど有意: p値が小さいほど帰無仮説を否定する証拠が強い
αと比較: p < α なら有意
連続的な指標: 0.049と0.051は本質的にほぼ同じ
誤解に注意: 仮説の確率ではなく、データの確率

📝 練習問題(20問)

このステップの理解度を確認しましょう。16問以上正解できれば次のステップへ進めます。

問題 1

帰無仮説

仮説検定で、最初に「差がない」という仮説を立てる。この仮説を何というか?

解答: 帰無仮説(H₀)

【解き方】
null hypothesis
「差がない」「効果がない」を表す仮説
問題 2

対立仮説

証明したい主張を表す仮説を何というか?

解答: 対立仮説(H₁)

【解き方】
alternative hypothesis
帰無仮説を否定する仮説
問題 3

有意水準

一般的に最もよく使われる有意水準は?

解答: 0.05(5%)

【解き方】
α = 0.05 が標準的
より厳しくは0.01、緩くは0.10
問題 4

仮説の設定

新薬の効果が50より大きいかを検定したい。帰無仮説は?

解答: H₀: μ = 50

【解き方】
対立仮説: H₁: μ > 50(右片側検定)
帰無仮説は「=」の形にする
問題 5

両側検定

両側検定の対立仮説の形は?

解答: H₁: μ ≠ μ₀

【解き方】
「等しくない(≠)」の形
大小どちらの方向でも検出したい場合
問題 6

棄却域(両側)

α=0.05の両側検定で、棄却域は?

解答: |Z| > 1.96

【解き方】
Z < -1.96 または Z > 1.96
両側に2.5%ずつ振り分け
問題 7

棄却域(片側)

α=0.05の右片側検定で、棄却域は?

解答: Z > 1.645

【解き方】
片側なのでα=0.05をそのまま使う
z(0.05) = 1.645
問題 8

第一種の誤り

H₀が真なのに、誤って棄却する誤りを何というか?

解答: 第一種の誤り

【解き方】
確率α、偽陽性(False Positive)
例:健康なのに「病気」と診断
問題 9

第二種の誤り

H₁が真なのに、H₀を棄却できない誤りを何というか?

解答: 第二種の誤り

【解き方】
確率β、偽陰性(False Negative)
例:病気なのに「健康」と診断
問題 10

αとβ

αを小さくすると、βはどうなるか?

解答: 大きくなる

【解き方】
トレードオフの関係
基準を厳しくすると見逃しが増える
問題 11

p値の意味

p値の正しい意味は?

解答: H₀が正しいとき、観測データ以上に極端なデータが得られる確率

【解き方】
仮説の確率ではない
データの確率である
問題 12

p値による判定

p=0.03, α=0.05 のとき、H₀をどう判定するか?

解答: 棄却する(有意)

【解き方】
p(0.03) < α(0.05) なので棄却
問題 13

有意

「統計的に有意」とはどういう意味か?

解答: 帰無仮説を棄却できること

【解き方】
偶然とは考えにくい差がある
p値 < 有意水準α
問題 14

検出力

検出力(power)の定義は?

解答: 1 - β

【解き方】
H₁が真のとき、正しくH₀を棄却できる確率
大きいほど良い(通常0.8以上を目指す)
問題 15

判定の結論

H₀を棄却したとき、どう結論するか?

解答: 対立仮説H₁を採択する(支持する)

【解き方】
有意差がある、効果があると結論
問題 16

判定の結論2

H₀を棄却できなかったとき、どう結論するか?

解答: H₀を棄却できない(H₀を採択するとは言わない)

【解き方】
「差があるとは言えない」と結論
「差がない」とは断言しない
問題 17

背理法

仮説検定はどんな論理と同じか?

解答: 背理法

【解き方】
「Aでない」と仮定→矛盾→「A」が正しい
「効果がない」を仮定→データと矛盾→「効果がある」
問題 18

片側と両側

「効果がある(大きくなる)」ことを証明したいとき、片側・両側どちらを使うか?

解答: 片側検定(右片側)

【解き方】
方向が決まっている(大きくなる)ので片側
H₁: μ > μ₀ の形
問題 19

サンプルサイズの効果

サンプルサイズを大きくすると、αとβはどうなるか?

解答: αは変わらない、βは小さくなる

【解き方】
αは設定値(自分で決める)
βは減少(検出力1-βは向上)
問題 20

p値の大小

p=0.001とp=0.04、どちらがより強い証拠か?

解答: p=0.001の方が強い証拠

【解き方】
p値が小さいほど帰無仮説を否定する証拠が強い
0.001 < 0.04 なのでp=0.001が強い

⚠️ よくあるつまずきポイントと対策

H₀とH₁を逆に設定してしまう

対策: 「証明したいこと」を対立仮説H₁にしましょう。

  • H₀は「差がない」「=」の形
  • H₁は「差がある」「証明したいこと」
  • 例:効果があることを証明したい → H₁: μ > μ₀

p値の意味を誤解する

対策: 「仮説の確率」ではなく「データの確率」と覚えましょう。

  • ❌「H₀が正しい確率が5%」
  • ✅「H₀が正しいなら、こんなデータが出る確率が5%」
  • p値は条件付き確率!

「棄却できない」を「正しい」と誤解

対策: 「棄却できない ≠ H₀が正しい」を覚えましょう。

  • 「差があるとは言えない」が正しい結論
  • 「差がない」とは断言できない
  • サンプルサイズが小さいと差を検出できないことがある

両側と片側を間違える

対策: 対立仮説の形で判断しましょう。

  • 「異なる」「等しくない」 → 両側(≠)
  • 「より大きい」「増える」 → 右片側(>)
  • 「より小さい」「減る」 → 左片側(<)

📚 このステップのまとめ

🎯 学習したこと

  • 仮説検定の流れ: 帰無仮説→検定統計量→判定
  • H₀とH₁: 「差がない」vs「差がある」
  • 有意水準α: 0.05が一般的、第一種の誤りの確率
  • 棄却域: 両側と片側で異なる
  • 2つの誤り: α(偽陽性)、β(偽陰性)
  • p値: H₀下でのデータの確率、p<αなら棄却
💡 次のステップへ進む前に
練習問題で16問以上(80%以上)正解できたら、STEP 9に進みましょう!

仮説検定の論理をしっかり理解することが重要です。
特にp値の正しい解釈を身につけましょう!
📝

学習メモ

統計検定2級対策 - Step 8

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE