🔬 STEP 8: 仮説検定の基礎
帰無仮説、対立仮説、p値の考え方を理解しよう
📖 このステップで学ぶこと
仮説検定は統計学で最も重要な手法の1つです。データから科学的な結論を導く方法を学びます。
📝 練習問題: 20問
🎯 到達目標: 仮説検定の考え方を説明できる、帰無仮説と対立仮説を正しく設定できる、有意水準と棄却域の意味を理解する、第一種の誤り・第二種の誤りを説明できる、p値の意味を正しく理解する
🎯 到達目標: 仮説検定の考え方を説明できる、帰無仮説と対立仮説を正しく設定できる、有意水準と棄却域の意味を理解する、第一種の誤り・第二種の誤りを説明できる、p値の意味を正しく理解する
1️⃣ 仮説検定の考え方(背理法的アプローチ)
仮説検定とは
仮説検定(hypothesis testing)
標本データから、母集団についての仮説が正しいかどうかを統計的に判断する方法
基本的な考え方:
「差がない」という仮説を立てて、それを否定できるかを調べる
→背理法と同じ論理
標本データから、母集団についての仮説が正しいかどうかを統計的に判断する方法
基本的な考え方:
「差がない」という仮説を立てて、それを否定できるかを調べる
→背理法と同じ論理
仮説検定の流れ
仮説検定の手順(5ステップ)
① 仮説を立てる
帰無仮説H₀と対立仮説H₁を設定
② 有意水準を決める
α = 0.05(5%)が一般的
③ 検定統計量を計算
標本データから計算
④ 棄却域を求める(またはp値を計算)
有意水準から決まる
⑤ 判定
検定統計量が棄却域に入れば帰無仮説を棄却
① 仮説を立てる
帰無仮説H₀と対立仮説H₁を設定
② 有意水準を決める
α = 0.05(5%)が一般的
③ 検定統計量を計算
標本データから計算
④ 棄却域を求める(またはp値を計算)
有意水準から決まる
⑤ 判定
検定統計量が棄却域に入れば帰無仮説を棄却
【背理法との対応】
数学の背理法:
「Aでない」と仮定 → 矛盾が生じる → 「A」が正しい
仮説検定:
「効果がない」と仮定 → データと矛盾 → 「効果がある」と結論
【イメージで理解:新薬の効果を調べる】
「効果がない」(H₀)という仮説を立てる
↓
データを取る(患者100人に投与)
↓
もし「効果がない」のに、
こんな良い結果が出る確率は0.01%しかない
↓
「効果がない」という仮説は間違っているだろう
↓
「効果がある」と結論
2️⃣ 帰無仮説H₀と対立仮説H₁の設定
帰無仮説(Null Hypothesis)
帰無仮説 H₀
「差がない」「効果がない」「関係がない」という仮説
記号: H₀(エイチゼロ、エイチノート)
例:
• μ = μ₀(母平均はμ₀に等しい)
• μ₁ = μ₂(2つの母平均は等しい)
• p = p₀(母比率はp₀に等しい)
「差がない」「効果がない」「関係がない」という仮説
記号: H₀(エイチゼロ、エイチノート)
例:
• μ = μ₀(母平均はμ₀に等しい)
• μ₁ = μ₂(2つの母平均は等しい)
• p = p₀(母比率はp₀に等しい)
対立仮説(Alternative Hypothesis)
対立仮説 H₁
帰無仮説を否定する仮説。証明したい主張
記号: H₁(エイチワン)またはHₐ
3つの形:
• μ ≠ μ₀(両側検定)
• μ > μ₀(右片側検定)
• μ < μ₀(左片側検定)
帰無仮説を否定する仮説。証明したい主張
記号: H₁(エイチワン)またはHₐ
3つの形:
• μ ≠ μ₀(両側検定)
• μ > μ₀(右片側検定)
• μ < μ₀(左片側検定)
⚡ なぜ「差がない」を帰無仮説にするのか?
背理法と同じ論理:
「Aでない」を仮定して矛盾を導く → 「A」が正しい
統計学では:
「効果がない」を仮定してデータと矛盾 → 「効果がある」と結論
これにより、客観的で科学的な判断ができる!
背理法と同じ論理:
「Aでない」を仮定して矛盾を導く → 「A」が正しい
統計学では:
「効果がない」を仮定してデータと矛盾 → 「効果がある」と結論
これにより、客観的で科学的な判断ができる!
例題1: 新薬の効果を調べる実験。
従来の薬の平均効果時間は50分。
新薬の方が効果が長いかを調べたい。
帰無仮説と対立仮説を設定しなさい。
従来の薬の平均効果時間は50分。
新薬の方が効果が長いかを調べたい。
帰無仮説と対立仮説を設定しなさい。
解答:
H₀: μ = 50(新薬の効果時間は50分)
H₁: μ > 50(新薬の効果時間は50分より長い)
—
【ステップ1: 問題文から「証明したいこと」を確認】
「新薬の方が効果が長いかを調べたい」
→ 証明したいこと = 「新薬の効果時間 > 50分」
—
【ステップ2: 対立仮説H₁を決める】
証明したいことを対立仮説にする:
H₁: μ > 50(新薬の効果時間は50分より長い)
—
【ステップ3: 帰無仮説H₀を決める】
対立仮説の否定(差がない状態)を帰無仮説にする:
H₀: μ = 50(新薬の効果時間は50分と同じ)
—
【ステップ4: 検定の種類を確認】
H₁: μ > 50 なので「右片側検定」
【3種類の検定】
---
【仮説設定のコツ】
---
【よくある間違い】
H₀: μ = 50(新薬の効果時間は50分)
H₁: μ > 50(新薬の効果時間は50分より長い)
—
【ステップ1: 問題文から「証明したいこと」を確認】
「新薬の方が効果が長いかを調べたい」
→ 証明したいこと = 「新薬の効果時間 > 50分」
—
【ステップ2: 対立仮説H₁を決める】
証明したいことを対立仮説にする:
H₁: μ > 50(新薬の効果時間は50分より長い)
—
【ステップ3: 帰無仮説H₀を決める】
対立仮説の否定(差がない状態)を帰無仮説にする:
H₀: μ = 50(新薬の効果時間は50分と同じ)
—
【ステップ4: 検定の種類を確認】
H₁: μ > 50 なので「右片側検定」
【3種類の検定】
両側検定: H₁: μ ≠ μ₀(等しくない) 右片側検定: H₁: μ > μ₀(より大きい)← 今回はこれ 左片側検定: H₁: μ < μ₀(より小さい)
---
【仮説設定のコツ】
1. 証明したいことを対立仮説H₁にする 2. 帰無仮説H₀は「差がない」「等しい」の形 3. H₁の不等号の向きで検定の種類が決まる ・「大きいか」→ 右片側(>) ・「小さいか」→ 左片側(<) ・「異なるか」→ 両側(≠)
---
【よくある間違い】
❌ H₀: μ ≠ 50, H₁: μ = 50 → H₀とH₁が逆! ❌ H₀: μ < 50, H₁: μ > 50 → H₀は「=」の形にする ✅ H₀: μ = 50, H₁: μ > 50 → 正しい設定
3️⃣ 有意水準(α)と棄却域
有意水準
有意水準(significance level)
記号: α(アルファ)
帰無仮説を棄却する基準
「帰無仮説が正しいのに、誤って棄却してしまう確率の上限」
よく使われる値:
• α = 0.05(5%)← 最も一般的
• α = 0.01(1%)← より厳しい基準
• α = 0.10(10%)← より緩い基準
記号: α(アルファ)
帰無仮説を棄却する基準
「帰無仮説が正しいのに、誤って棄却してしまう確率の上限」
よく使われる値:
• α = 0.05(5%)← 最も一般的
• α = 0.01(1%)← より厳しい基準
• α = 0.10(10%)← より緩い基準
棄却域
棄却域(rejection region)
検定統計量がこの範囲に入ったら、帰無仮説を棄却する領域
採択域(acceptance region)
検定統計量がこの範囲なら、帰無仮説を棄却しない領域
有意水準αによって棄却域が決まる
検定統計量がこの範囲に入ったら、帰無仮説を棄却する領域
採択域(acceptance region)
検定統計量がこの範囲なら、帰無仮説を棄却しない領域
有意水準αによって棄却域が決まる
⚡ 両側検定と片側検定の棄却域
両側検定(H₁: μ ≠ μ₀)
棄却域: |Z| > z(α/2)
α=0.05なら |Z| > 1.96
右片側検定(H₁: μ > μ₀)
棄却域: Z > z(α)
α=0.05なら Z > 1.645
左片側検定(H₁: μ < μ₀)
棄却域: Z < -z(α)
α=0.05なら Z < -1.645
両側検定(H₁: μ ≠ μ₀)
棄却域: |Z| > z(α/2)
α=0.05なら |Z| > 1.96
右片側検定(H₁: μ > μ₀)
棄却域: Z > z(α)
α=0.05なら Z > 1.645
左片側検定(H₁: μ < μ₀)
棄却域: Z < -z(α)
α=0.05なら Z < -1.645
【図で理解:α=0.05の場合】
【両側検定】α=0.05
両側に2.5%ずつ振り分け
←── 95% ──→
┌────────────────────┐
2.5%│ 採択域 │2.5%
────┴────────────────────┴────
-1.96 0 1.96
← 棄却域 棄却域 →
【右片側検定】α=0.05
右側に5%
←── 95% ──→
┌─────────────────────┐
│ 採択域 │5%
────┴─────────────────────┴────
0 1.645
棄却域 →
4️⃣ 第一種の誤り(α)・第二種の誤り(β)
仮説検定の判定結果
4つの可能性
| H₀が真実 | H₁が真実 | |
|---|---|---|
| H₀を棄却しない | ✅ 正しい判定 | ❌ 第二種の誤り(β) |
| H₀を棄却 | ❌ 第一種の誤り(α) | ✅ 正しい判定 |
第一種の誤り
第一種の誤り(Type I error)
帰無仮説H₀が真実なのに、誤って棄却してしまう誤り
確率: α(有意水準)
例:
効果がない薬を「効果がある」と判断
→「偽陽性(False Positive)」
帰無仮説H₀が真実なのに、誤って棄却してしまう誤り
確率: α(有意水準)
例:
効果がない薬を「効果がある」と判断
→「偽陽性(False Positive)」
第二種の誤り
第二種の誤り(Type II error)
対立仮説H₁が真実なのに、帰無仮説を棄却できない誤り
確率: β(ベータ)
例:
効果がある薬を「効果がない」と判断
→「偽陰性(False Negative)」
検出力(power)
1 - β = 正しく帰無仮説を棄却できる確率
対立仮説H₁が真実なのに、帰無仮説を棄却できない誤り
確率: β(ベータ)
例:
効果がある薬を「効果がない」と判断
→「偽陰性(False Negative)」
検出力(power)
1 - β = 正しく帰無仮説を棄却できる確率
【覚え方:医療検査のイメージ】
病気の検査で考えると:
第一種の誤り(α)= 偽陽性
・健康なのに「病気」と診断
・不必要な治療を受けてしまう
第二種の誤り(β)= 偽陰性
・病気なのに「健康」と診断
・治療の機会を逃してしまう
どちらも避けたいが、完全には避けられない!
⚡ αとβのトレードオフ
αを小さくする(厳しい基準)
→ βが大きくなる(見逃しが増える)
通常はαを制御して、βは結果的に決まる
サンプルサイズを増やせば、両方を小さくできる!
αを小さくする(厳しい基準)
→ βが大きくなる(見逃しが増える)
通常はαを制御して、βは結果的に決まる
サンプルサイズを増やせば、両方を小さくできる!
5️⃣ p値の意味と解釈
p値とは
p値(p-value)
帰無仮説が正しいと仮定したとき、
観測されたデータ(またはそれより極端なデータ)が
得られる確率
判定:
• p値 < α → 帰無仮説を棄却(有意)
• p値 ≥ α → 帰無仮説を棄却しない(有意でない)
帰無仮説が正しいと仮定したとき、
観測されたデータ(またはそれより極端なデータ)が
得られる確率
判定:
• p値 < α → 帰無仮説を棄却(有意)
• p値 ≥ α → 帰無仮説を棄却しない(有意でない)
⚠️ p値のよくある誤解
❌ 間違い:
「帰無仮説が正しい確率がp値」
✅ 正しい:
「帰無仮説が正しいとしたとき、このデータが出る確率がp値」
p値は仮説の確率ではない!
データの確率である!
❌ 間違い:
「帰無仮説が正しい確率がp値」
✅ 正しい:
「帰無仮説が正しいとしたとき、このデータが出る確率がp値」
p値は仮説の確率ではない!
データの確率である!
例題2: ある検定でp値 = 0.03 だった。
α = 0.05 のとき、どう判定するか?
α = 0.05 のとき、どう判定するか?
解答: 帰無仮説を棄却する(有意)
---
【ステップ1: 与えられた情報を整理】
---
【ステップ2: 判定ルールを確認】
p値とαの比較:
• p値 < α → H₀を棄却(有意)
• p値 ≥ α → H₀を棄却しない(有意でない)
---
【ステップ3: 比較する】
p値(0.03) と α(0.05) を比較:
0.03 < 0.05
p値 < α なので...
---
【ステップ4: 結論を述べる】
帰無仮説H₀を棄却する(有意)
---
【p値の意味を確認】
---
【結果の書き方の例】
---
【p値の目安】
---
【ステップ1: 与えられた情報を整理】
・p値 = 0.03 ・有意水準: α = 0.05 ・求めるもの: H₀を棄却するかどうか
---
【ステップ2: 判定ルールを確認】
p値とαの比較:
• p値 < α → H₀を棄却(有意)
• p値 ≥ α → H₀を棄却しない(有意でない)
---
【ステップ3: 比較する】
p値(0.03) と α(0.05) を比較:
0.03 < 0.05
p値 < α なので...
---
【ステップ4: 結論を述べる】
帰無仮説H₀を棄却する(有意)
---
【p値の意味を確認】
p値 = 0.03 の意味: 「帰無仮説が正しいなら、 こんなデータが出る確率は3%しかない」 3%しかないことが起きた! → 帰無仮説は間違っていそう → 帰無仮説を棄却
---
【結果の書き方の例】
報告文の例: 「p = 0.03 < 0.05 より、有意水準5%で 帰無仮説を棄却する。 したがって、(対立仮説の内容)と 結論できる。」
---
【p値の目安】
p < 0.001 : 非常に強い証拠(***) p < 0.01 : 強い証拠(**) p < 0.05 : 有意(*) p ≥ 0.05 : 有意でない(n.s.) ※ただし、0.049と0.051は本質的にほぼ同じ
💡 p値のポイント
• 小さいほど有意: p値が小さいほど帰無仮説を否定する証拠が強い
• αと比較: p < α なら有意
• 連続的な指標: 0.049と0.051は本質的にほぼ同じ
• 誤解に注意: 仮説の確率ではなく、データの確率
• 小さいほど有意: p値が小さいほど帰無仮説を否定する証拠が強い
• αと比較: p < α なら有意
• 連続的な指標: 0.049と0.051は本質的にほぼ同じ
• 誤解に注意: 仮説の確率ではなく、データの確率
📝 練習問題(20問)
このステップの理解度を確認しましょう。16問以上正解できれば次のステップへ進めます。
問題 1
帰無仮説
仮説検定で、最初に「差がない」という仮説を立てる。この仮説を何というか?
解答: 帰無仮説(H₀)
【解き方】
null hypothesis
「差がない」「効果がない」を表す仮説
【解き方】
null hypothesis
「差がない」「効果がない」を表す仮説
問題 2
対立仮説
証明したい主張を表す仮説を何というか?
解答: 対立仮説(H₁)
【解き方】
alternative hypothesis
帰無仮説を否定する仮説
【解き方】
alternative hypothesis
帰無仮説を否定する仮説
問題 3
有意水準
一般的に最もよく使われる有意水準は?
解答: 0.05(5%)
【解き方】
α = 0.05 が標準的
より厳しくは0.01、緩くは0.10
【解き方】
α = 0.05 が標準的
より厳しくは0.01、緩くは0.10
問題 4
仮説の設定
新薬の効果が50より大きいかを検定したい。帰無仮説は?
解答: H₀: μ = 50
【解き方】
対立仮説: H₁: μ > 50(右片側検定)
帰無仮説は「=」の形にする
【解き方】
対立仮説: H₁: μ > 50(右片側検定)
帰無仮説は「=」の形にする
問題 5
両側検定
両側検定の対立仮説の形は?
解答: H₁: μ ≠ μ₀
【解き方】
「等しくない(≠)」の形
大小どちらの方向でも検出したい場合
【解き方】
「等しくない(≠)」の形
大小どちらの方向でも検出したい場合
問題 6
棄却域(両側)
α=0.05の両側検定で、棄却域は?
解答: |Z| > 1.96
【解き方】
Z < -1.96 または Z > 1.96
両側に2.5%ずつ振り分け
【解き方】
Z < -1.96 または Z > 1.96
両側に2.5%ずつ振り分け
問題 7
棄却域(片側)
α=0.05の右片側検定で、棄却域は?
解答: Z > 1.645
【解き方】
片側なのでα=0.05をそのまま使う
z(0.05) = 1.645
【解き方】
片側なのでα=0.05をそのまま使う
z(0.05) = 1.645
問題 8
第一種の誤り
H₀が真なのに、誤って棄却する誤りを何というか?
解答: 第一種の誤り
【解き方】
確率α、偽陽性(False Positive)
例:健康なのに「病気」と診断
【解き方】
確率α、偽陽性(False Positive)
例:健康なのに「病気」と診断
問題 9
第二種の誤り
H₁が真なのに、H₀を棄却できない誤りを何というか?
解答: 第二種の誤り
【解き方】
確率β、偽陰性(False Negative)
例:病気なのに「健康」と診断
【解き方】
確率β、偽陰性(False Negative)
例:病気なのに「健康」と診断
問題 10
αとβ
αを小さくすると、βはどうなるか?
解答: 大きくなる
【解き方】
トレードオフの関係
基準を厳しくすると見逃しが増える
【解き方】
トレードオフの関係
基準を厳しくすると見逃しが増える
問題 11
p値の意味
p値の正しい意味は?
解答: H₀が正しいとき、観測データ以上に極端なデータが得られる確率
【解き方】
仮説の確率ではない
データの確率である
【解き方】
仮説の確率ではない
データの確率である
問題 12
p値による判定
p=0.03, α=0.05 のとき、H₀をどう判定するか?
解答: 棄却する(有意)
【解き方】
p(0.03) < α(0.05) なので棄却
【解き方】
p(0.03) < α(0.05) なので棄却
問題 13
有意
「統計的に有意」とはどういう意味か?
解答: 帰無仮説を棄却できること
【解き方】
偶然とは考えにくい差がある
p値 < 有意水準α
【解き方】
偶然とは考えにくい差がある
p値 < 有意水準α
問題 14
検出力
検出力(power)の定義は?
解答: 1 - β
【解き方】
H₁が真のとき、正しくH₀を棄却できる確率
大きいほど良い(通常0.8以上を目指す)
【解き方】
H₁が真のとき、正しくH₀を棄却できる確率
大きいほど良い(通常0.8以上を目指す)
問題 15
判定の結論
H₀を棄却したとき、どう結論するか?
解答: 対立仮説H₁を採択する(支持する)
【解き方】
有意差がある、効果があると結論
【解き方】
有意差がある、効果があると結論
問題 16
判定の結論2
H₀を棄却できなかったとき、どう結論するか?
解答: H₀を棄却できない(H₀を採択するとは言わない)
【解き方】
「差があるとは言えない」と結論
「差がない」とは断言しない
【解き方】
「差があるとは言えない」と結論
「差がない」とは断言しない
問題 17
背理法
仮説検定はどんな論理と同じか?
解答: 背理法
【解き方】
「Aでない」と仮定→矛盾→「A」が正しい
「効果がない」を仮定→データと矛盾→「効果がある」
【解き方】
「Aでない」と仮定→矛盾→「A」が正しい
「効果がない」を仮定→データと矛盾→「効果がある」
問題 18
片側と両側
「効果がある(大きくなる)」ことを証明したいとき、片側・両側どちらを使うか?
解答: 片側検定(右片側)
【解き方】
方向が決まっている(大きくなる)ので片側
H₁: μ > μ₀ の形
【解き方】
方向が決まっている(大きくなる)ので片側
H₁: μ > μ₀ の形
問題 19
サンプルサイズの効果
サンプルサイズを大きくすると、αとβはどうなるか?
解答: αは変わらない、βは小さくなる
【解き方】
αは設定値(自分で決める)
βは減少(検出力1-βは向上)
【解き方】
αは設定値(自分で決める)
βは減少(検出力1-βは向上)
問題 20
p値の大小
p=0.001とp=0.04、どちらがより強い証拠か?
解答: p=0.001の方が強い証拠
【解き方】
p値が小さいほど帰無仮説を否定する証拠が強い
0.001 < 0.04 なのでp=0.001が強い
【解き方】
p値が小さいほど帰無仮説を否定する証拠が強い
0.001 < 0.04 なのでp=0.001が強い
⚠️ よくあるつまずきポイントと対策
H₀とH₁を逆に設定してしまう
対策: 「証明したいこと」を対立仮説H₁にしましょう。
- H₀は「差がない」「=」の形
- H₁は「差がある」「証明したいこと」
- 例:効果があることを証明したい → H₁: μ > μ₀
p値の意味を誤解する
対策: 「仮説の確率」ではなく「データの確率」と覚えましょう。
- ❌「H₀が正しい確率が5%」
- ✅「H₀が正しいなら、こんなデータが出る確率が5%」
- p値は条件付き確率!
「棄却できない」を「正しい」と誤解
対策: 「棄却できない ≠ H₀が正しい」を覚えましょう。
- 「差があるとは言えない」が正しい結論
- 「差がない」とは断言できない
- サンプルサイズが小さいと差を検出できないことがある
両側と片側を間違える
対策: 対立仮説の形で判断しましょう。
- 「異なる」「等しくない」 → 両側(≠)
- 「より大きい」「増える」 → 右片側(>)
- 「より小さい」「減る」 → 左片側(<)
📚 このステップのまとめ
🎯 学習したこと
- 仮説検定の流れ: 帰無仮説→検定統計量→判定
- H₀とH₁: 「差がない」vs「差がある」
- 有意水準α: 0.05が一般的、第一種の誤りの確率
- 棄却域: 両側と片側で異なる
- 2つの誤り: α(偽陽性)、β(偽陰性)
- p値: H₀下でのデータの確率、p<αなら棄却
💡 次のステップへ進む前に
練習問題で16問以上(80%以上)正解できたら、STEP 9に進みましょう!
仮説検定の論理をしっかり理解することが重要です。
特にp値の正しい解釈を身につけましょう!
練習問題で16問以上(80%以上)正解できたら、STEP 9に進みましょう!
仮説検定の論理をしっかり理解することが重要です。
特にp値の正しい解釈を身につけましょう!
学習メモ
統計検定2級対策 - Step 8
📋 過去のメモ一覧
▼