STEP 10:その他の検定手法

🔍 STEP 10: その他の検定手法

母比率の検定、等分散性の検定、2標本の検定をマスターしよう

📖 このステップで学ぶこと

母比率の検定等分散性の検定(F検定)2標本の平均の差の検定を学びます。

📝 練習問題: 20問
🎯 到達目標: 母比率の検定ができる、等分散性の検定(F検定)ができる、2標本の平均の差の検定ができる、各検定の前提条件を理解する

1️⃣ 母比率の検定

母比率の検定

H₀: p = p₀
H₁: p ≠ p₀(または p > p₀ または p < p₀)

検定統計量:
Z = (p – p₀) / √[p₀(1-p₀)/n]

条件: np₀ ≥ 5 かつ n(1-p₀) ≥ 5
H₀下でZ ~ N(0, 1)
⚡ 母比率の検定のポイント

分母に注意!
信頼区間: √[p(1-p)/n] ← 標本比率を使う
検定: √[p₀(1-p₀)/n] ← 帰無仮説の値p₀を使う

検定ではH₀が正しいと仮定するので、p₀を使う!
例題1: 新製品の不良率を5%以下にしたい。
200個検査したら8個が不良品だった。
不良率5%以下といえるか?(α=0.05、左片側検定)
解答: 5%以下とはいえない(有意差なし)



【ステップ1: 与えられた情報を整理】
・サンプルサイズ: n = 200
・不良品の数: X = 8
・標本比率: p-hat = 8/200 = 0.04(4%)
・帰無仮説の値: p₀ = 0.05(5%)
・有意水準: α = 0.05
・検定の種類: 左片側検定(「以下」)



【ステップ2: 仮説を設定】

H₀: p = 0.05(不良率は5%)
H₁: p < 0.05(不良率は5%より低い)

「5%以下」→ 「5%より低い」を証明したい → 左片側検定



【ステップ3: 正規近似の条件を確認】

np₀ = 200 × 0.05 = 10 ≥ 5 ✓
n(1-p₀) = 200 × 0.95 = 190 ≥ 5 ✓

条件を満たすので正規近似が使える



【ステップ4: 検定統計量を計算】

公式:
Z = (p-hat – p₀) / √[p₀(1-p₀)/n]

分母(標準誤差)を計算:
SE = √[p₀(1-p₀)/n]
= √[0.05 × 0.95 / 200]
= √[0.0475 / 200]
= √0.0002375
= 0.0154

検定統計量Zを計算:
Z = (p-hat – p₀) / SE
= (0.04 – 0.05) / 0.0154
= -0.01 / 0.0154
= -0.649



【ステップ5: 棄却域を確認】

α = 0.05 の左片側検定:
棄却域: Z < -1.645

         ←── 95% ──→
5%  ┌─────────────────────┐
    │     採択域          │
────┴─────────────────────────
  -1.645       0
← 棄却域



【ステップ6: 判定】

Z = -0.649

-0.649 > -1.645 なので棄却域に入らない



【ステップ7: 結論】

H₀を棄却できない

「有意水準5%で、不良率が5%以下であるとはいえない」



【計算のまとめ】
Z = (p-hat - p₀) / √[p₀(1-p₀)/n]
  = (0.04 - 0.05) / √[0.05×0.95/200]
  = -0.01 / 0.0154
  = -0.649

Z = -0.649 > -1.645(棄却域に入らない)
→ H₀を棄却できない → 有意差なし



【結果の解釈】
標本では不良率4%だったが、
これは「たまたま」かもしれない。

「本当に不良率5%のときでも、
 4%という結果は十分ありえる」
→ 5%より低いとは断言できない

注意: 「5%である」と証明したわけではない!

2️⃣ 等分散性の検定(F検定)

F検定(F-test)
2つの母集団の分散が等しいかを検定

H₀: σ₁² = σ₂²
H₁: σ₁² ≠ σ₂²

検定統計量:
F = s₁² / s₂²(大きい方を分子)

H₀下で F ~ F(n₁-1, n₂-1)
例題2: A群(n₁=10, s₁²=25)、B群(n₂=8, s₂²=16)。
等分散といえるか?(α=0.10、両側検定)
F(9, 7, 0.05) = 3.68
解答: 等分散といえる(有意差なし)



【ステップ1: 与えられた情報を整理】
・A群: n₁ = 10, s₁² = 25
・B群: n₂ = 8, s₂² = 16
・有意水準: α = 0.10(両側検定)
・F(9, 7, 0.05) = 3.68



【ステップ2: 仮説を設定】

H₀: σ₁² = σ₂²(等分散)
H₁: σ₁² ≠ σ₂²(等分散でない)



【ステップ3: 検定統計量を計算】

F検定のルール: 大きい方を分子にする

s₁² = 25 > s₂² = 16 なので…

F = s₁² / s₂² = 25 / 16 = 1.5625



【ステップ4: 自由度を確認】

分子の自由度: n₁ – 1 = 10 – 1 = 9
分母の自由度: n₂ – 1 = 8 – 1 = 7

F ~ F(9, 7)



【ステップ5: 棄却域を確認】

両側検定 α = 0.10 なので、片側 α/2 = 0.05

棄却域: F > F(9, 7, 0.05) = 3.68

※大きい方を分子にしたので、
  上側の棄却域だけ見ればよい

    ┌───────────────────┐
    │    採択域        │5%
────┴───────────────────┴────
    0                3.68
                    棄却域 →



【ステップ6: 判定】

F = 1.5625 < 3.68 なので棄却域に入らない



【ステップ7: 結論】

H₀を棄却できない

「有意水準10%で、等分散といえる」
(正確には「等分散でないとはいえない」)



【F検定の使いどころ】
F検定は「2標本t検定の前検定」としてよく使う

等分散性を確認してから:
・等分散 → 通常の2標本t検定
・等分散でない → Welchのt検定

今回は等分散と判断できたので、
2標本t検定ではプールした分散を使える
💡 F検定のポイント
大きい方を分子: 常に F ≥ 1
2標本t検定の前: 等分散かどうかを確認
正規性の仮定: 母集団が正規分布に従う必要

3️⃣ 2標本の平均の差の検定

対応のない場合(独立な2標本)

等分散の場合

H₀: μ₁ = μ₂
H₁: μ₁ ≠ μ₂(または μ₁ > μ₂ または μ₁ < μ₂)

プールした分散:
s²ₚ = [(n₁-1)s₁² + (n₂-1)s₂²] / (n₁+n₂-2)

検定統計量:
T = (X₁ – X₂) / √[s²ₚ(1/n₁ + 1/n₂)]

自由度: ν = n₁ + n₂ – 2
等分散でない場合(Welchの検定)

検定統計量:
T = (X₁ – X₂) / √(s₁²/n₁ + s₂²/n₂)

自由度は複雑な式で計算(近似値を使用)
例題3: A群(n₁=10, X₁=75, s₁²=20)
B群(n₂=8, X₂=70, s₂²=18)
等分散として、平均に差があるか?(α=0.05、両側検定)
t(16, 0.025) = 2.120
解答: 平均に差があるといえる(有意)



【ステップ1: 与えられた情報を整理】
・A群: n₁ = 10, X̄₁ = 75, s₁² = 20
・B群: n₂ = 8, X̄₂ = 70, s₂² = 18
・有意水準: α = 0.05(両側検定)
・t(16, 0.025) = 2.120
・仮定: 等分散



【ステップ2: 仮説を設定】

H₀: μ₁ = μ₂(A群とB群の平均は等しい)
H₁: μ₁ ≠ μ₂(A群とB群の平均は異なる)



【ステップ3: 自由度を計算】

ν = n₁ + n₂ – 2 = 10 + 8 – 2 = 16



【ステップ4: プールした分散を計算】

公式:
s²ₚ = [(n₁-1)s₁² + (n₂-1)s₂²] / (n₁+n₂-2)

分子を計算:
(n₁-1)s₁² = 9 × 20 = 180
(n₂-1)s₂² = 7 × 18 = 126
合計 = 180 + 126 = 306

分母:
n₁ + n₂ – 2 = 16

プールした分散:
s²ₚ = 306 / 16 = 19.125



【ステップ5: 標準誤差を計算】

SE = √[s²ₚ × (1/n₁ + 1/n₂)]

まず括弧内を計算:
1/n₁ + 1/n₂ = 1/10 + 1/8 = 0.1 + 0.125 = 0.225

s²ₚ × (1/n₁ + 1/n₂) = 19.125 × 0.225 = 4.303

SE = √4.303 = 2.074



【ステップ6: 検定統計量を計算】

T = (X̄₁ – X̄₂) / SE
= (75 – 70) / 2.074
= 5 / 2.074
= 2.410



【ステップ7: 棄却域を確認】

両側検定 α = 0.05 なので、両側にα/2 = 0.025ずつ

棄却域: |T| > t(16, 0.025) = 2.120

         ←── 95% ──→
    ┌────────────────────┐
2.5%│     採択域         │2.5%
────┴────────────────────┴────
  -2.120       0       2.120
 ← 棄却域              棄却域 →



【ステップ8: 判定】

|T| = |2.410| = 2.410

2.410 > 2.120 なので棄却域に入る



【ステップ9: 結論】

H₀を棄却する

「有意水準5%で、A群とB群の平均に差があるといえる」



【計算のまとめ】
s²ₚ = (9×20 + 7×18) / 16 = 306/16 = 19.125
SE = √[19.125 × (1/10 + 1/8)] = √4.303 = 2.074
T = (75 - 70) / 2.074 = 2.410

|T| = 2.410 > 2.120(棄却域)
→ H₀を棄却 → 平均に差がある

対応のある場合(対標本)

対標本t検定
同じ対象の前後比較など

差 d = X₁ – X₂ を計算

H₀: μd = 0
H₁: μd ≠ 0

検定統計量:
T = d / (sd/√n)

自由度: ν = n – 1
例題4: 10人のダイエット前後の体重。
d = -2.5kg, sd = 3.0kg
効果があるといえるか?(α=0.05、左片側検定)
t(9, 0.05) = 1.833
解答: 効果があるといえる(有意)



【ステップ1: 与えられた情報を整理】
・対象数: n = 10人
・差の平均: d̄ = -2.5kg(マイナス=減った)
・差の標準偏差: sd = 3.0kg
・有意水準: α = 0.05
・検定の種類: 左片側検定(「減った」= 効果あり)
・t(9, 0.05) = 1.833



【ステップ2: 仮説を設定】

差 d = (後) – (前) = 体重の変化
d < 0 なら体重が減った = ダイエット効果あり

H₀: μd = 0(効果なし、変化なし)
H₁: μd < 0(効果あり、体重減少)



【ステップ3: 自由度を確認】

ν = n – 1 = 10 – 1 = 9



【ステップ4: 検定統計量を計算】

標準誤差を計算:
SE = sd / √n = 3.0 / √10 = 3.0 / 3.162 = 0.949

検定統計量Tを計算:
T = d̄ / SE
= -2.5 / 0.949
= -2.634



【ステップ5: 棄却域を確認】

α = 0.05 の左片側検定:
棄却域: T < -t(9, 0.05) = -1.833

         ←── 95% ──→
5%  ┌─────────────────────┐
    │     採択域          │
────┴─────────────────────────
  -1.833       0
← 棄却域



【ステップ6: 判定】

T = -2.634 < -1.833 なので棄却域に入る



【ステップ7: 結論】

H₀を棄却する

「有意水準5%で、ダイエット効果があるといえる」



【対標本t検定のポイント】
・同じ人の前後比較 → 対応あり
・差dを計算してから、1標本t検定と同じ形
・自由度はペア数-1(n-1)
・2標本t検定より検出力が高い(個人差を除去)

4️⃣ 各検定の前提条件と使い分け

検定手法の選択フローチャート

1標本の場合:
• 平均の検定 → z検定(σ既知)またはt検定(σ未知)
• 比率の検定 → z検定(正規近似)

2標本の場合:
• 分散の検定 → F検定
• 平均の検定 →
  対応なし:2標本t検定(等分散)またはWelch検定(等分散でない)
  対応あり:対標本t検定
⚡ 対応の有無の判断

対応あり:
• 同じ対象の前後比較(ダイエット、治療効果)
• ペアになっている(双子、夫婦)
• マッチングされている

対応なし:
• 完全に独立した2群
• 異なる対象の比較
【2標本t検定の手順】

① 対応の有無を確認
    ・対応あり → 対標本t検定へ
    ・対応なし → ②へ

② F検定で等分散性を確認
    ・等分散 → 2標本t検定(プールした分散)
    ・等分散でない → Welchのt検定

③ 検定統計量を計算し、判定
        

📝 練習問題(20問)

このステップの理解度を確認しましょう。16問以上正解できれば次のステップへ進めます。

問題 1

母比率検定の統計量

母比率の検定統計量の公式は?

解答: Z = (p-hat – p₀) / √[p₀(1-p₀)/n]

【解き方】
H₀下でp₀を使う(標本比率p-hatではない)
信頼区間との違いに注意!
問題 2

F検定の用途

F検定は何を検定するか?

解答: 2つの母分散が等しいかどうか

【解き方】
等分散性の検定
2標本t検定の前検定として使用
問題 3

F統計量

F検定の検定統計量の計算方法は?

解答: F = s₁² / s₂²(大きい方を分子)

【解き方】
常に F ≥ 1 になるようにする
大きい方の分散を分子に置く
問題 4

対応の有無

同じ人の治療前後を比較するとき、対応あり・なしどちら?

解答: 対応あり

【解き方】
対標本t検定を使う
差dを計算してから検定
問題 5

対標本t検定

対標本t検定の検定統計量は?

解答: T = d̄ / (sd/√n)

【解き方】
差の平均を検定
自由度はn-1
問題 6

等分散の仮定

2標本t検定の前に何を確認すべきか?

解答: 等分散かどうか(F検定で確認)

【解き方】
等分散でないならWelch検定を使う
問題 7

プールした分散

等分散の2標本t検定で、プールした分散を使う理由は?

解答: より正確な推定のため(2つの標本の情報を統合)

【解き方】
共通の分散を仮定
情報を有効活用できる
問題 8

母比率検定の計算

n=100, X=35, p₀=0.3のとき、検定統計量Zは?

解答: Z ≈ 1.09

【解き方】
p-hat = 35/100 = 0.35
SE = √[0.30×0.70/100] = √0.0021 = 0.0458
Z = (0.35-0.30)/0.0458 ≈ 1.09
問題 9

F検定の自由度

n₁=10, n₂=8のF検定で、F統計量の自由度は?

解答: (9, 7)

【解き方】
(n₁-1, n₂-1) = (10-1, 8-1) = (9, 7)
大きい方を分子にした場合
問題 10

2標本t検定の自由度

等分散の2標本t検定(n₁=12, n₂=10)で、自由度は?

解答: 20

【解き方】
n₁ + n₂ – 2 = 12 + 10 – 2 = 20
問題 11

対標本の自由度

対標本t検定(n=15ペア)で、自由度は?

解答: 14

【解き方】
n – 1 = 15 – 1 = 14
ペア数から1を引く
問題 12

Welch検定

Welch検定を使うのはどんなとき?

解答: 等分散でないとき

【解き方】
F検定で等分散が棄却されたとき
プールした分散を使わない
問題 13

検定の選択1

2つのクラスの平均点を比較したい。何検定を使うか?

解答: 2標本t検定(対応なし)

【解き方】
まずF検定で等分散性を確認
独立した2群なので対応なし
問題 14

検定の選択2

新薬の効果を前後比較したい。何検定を使うか?

解答: 対標本t検定

【解き方】
同じ対象の前後なので対応あり
差dを計算して検定
問題 15

検定の選択3

不良品率が10%以下か調べたい。何検定を使うか?

解答: 母比率の検定(左片側)

【解き方】
H₁: p < 0.10(10%より低い)
比率の検定なのでz検定
問題 16

母比率検定の条件

母比率の検定で正規近似を使う条件は?

解答: np₀ ≥ 5 かつ n(1-p₀) ≥ 5

【解き方】
標本サイズが十分大きい
帰無仮説のp₀を使って確認
問題 17

F検定の前提

F検定の前提条件は?

解答: 両方の母集団が正規分布に従う

【解き方】
正規性の仮定が重要
正規性が疑わしい場合は注意
問題 18

片側F検定

F検定は通常、片側・両側どちらを使うか?

解答: 両側検定(ただし片側のF値のみ使用)

【解き方】
大きい方を分子にするため
上側の棄却域だけ見ればよい
問題 19

総合問題1

s₁²=30, s₂²=20のとき、F統計量は?

解答: F = 1.5

【解き方】
大きい方を分子: 30/20 = 1.5
常にF ≥ 1になる
問題 20

総合問題2

対標本でn=10, d̄=-3, sd=5。検定統計量Tは?

解答: T ≈ -1.897

【解き方】
SE = sd/√n = 5/√10 = 5/3.162 = 1.581
T = d̄/SE = -3/1.581 ≈ -1.897

⚠️ よくあるつまずきポイントと対策

母比率検定の分母でp-hatを使ってしまう

対策: 検定では帰無仮説の値p₀を使いましょう。

  • 信頼区間: √[p-hat(1-p-hat)/n] ← 標本比率を使う
  • 検定: √[p₀(1-p₀)/n] ← 帰無仮説の値を使う
  • 検定ではH₀が正しいと仮定するので、p₀を使う

F検定で小さい方を分子にしてしまう

対策: 「大きい方を分子」と覚えましょう。

  • F = (大きい分散)/(小さい分散)
  • 常にF ≥ 1になる
  • 上側の棄却域だけ見ればよい

対応あり・なしを間違える

対策: 「同じ対象か?」で判断しましょう。

  • 対応あり: 同じ人の前後、双子、ペア
  • 対応なし: 別々の人、独立した2群
  • 対応ありの方が検出力が高い

自由度を間違える

対策: 検定の種類ごとに覚えましょう。

  • F検定: (n₁-1, n₂-1)
  • 2標本t検定(等分散): n₁+n₂-2
  • 対標本t検定: n-1(ペア数-1)

📚 このステップのまとめ

🎯 学習したこと

  • 母比率の検定: Z=(p-hat-p₀)/√[p₀(1-p₀)/n]
  • F検定: F=s₁²/s₂²、等分散性の検定
  • 2標本t検定: 等分散ならプールした分散
  • 対標本t検定: 差を検定、対応あり
  • Welch検定: 等分散でないとき
  • 使い分け: 対応の有無、等分散性
💡 次のステップへ進む前に
練習問題で16問以上(80%以上)正解できたら、STEP 11に進みましょう!

各検定の使い分けが重要です。
対応の有無、等分散性を正しく判断しましょう!
📝

学習メモ

統計検定2級対策 - Step 10

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE