📏 STEP 6: 推定の基礎(母平均の推定)
点推定と区間推定を理解し、信頼区間の計算をマスターしよう
📖 このステップで学ぶこと
いよいよ推測統計学の実践に入ります。点推定と区間推定の違い、信頼区間の意味と計算方法を学びます。
🎯 到達目標: 点推定と区間推定の違いを説明できる、母平均の信頼区間が計算できる(σ既知・未知)、信頼区間の意味を正しく理解する、信頼係数と信頼区間の幅の関係がわかる
1️⃣ 点推定と区間推定の概念
推定とは
標本から母集団のパラメータ(母数)を推測すること
推定したいもの:
• 母平均 μ
• 母分散 σ²
• 母比率 p など
点推定(Point Estimation)
母数を1つの値で推定すること
例:
• 母平均μの点推定量: 標本平均 X
• 母分散σ²の点推定量: 不偏分散 s²
推定量(estimator)
推定に使う統計量
推定値(estimate)
実際に計算された値
区間推定(Interval Estimation)
母数が含まれると期待される区間を推定すること
信頼区間(confidence interval)
母数が一定の確率で含まれる区間
[下側信頼限界, 上側信頼限界]
点推定: μ = 50(1つの値)
• シンプルだが、どれくらい信頼できるか不明
区間推定: μ ∈ [48, 52](区間)
• 信頼度が分かる(例: 95%の確率で含まれる)
• より実用的!
2️⃣ 信頼区間の意味(95%信頼区間など)
信頼係数と信頼度
記号: 1 – α
よく使われる値:
• 0.95(95%信頼区間)
• 0.99(99%信頼区間)
• 0.90(90%信頼区間)
有意水準(significance level)
α = 1 – 信頼係数
例: 95%信頼区間 → α = 0.05
信頼区間の正しい解釈
❌ 間違い:
「母平均μが95%の確率で[48, 52]に含まれる」
✅ 正しい:
「同じ方法で100回区間推定したら、約95回は真の母平均μを含む区間が得られる」
母平均μは固定された値(確率変数ではない)
確率的に変動するのは信頼区間の方!
100人が同じサイズの標本を取って信頼区間を計算すると:
• 約95人の区間が真のμを含む
• 約5人の区間は外れる(μを含まない)
自分が計算した区間が「95人側」か「5人側」かは分からない!
だから「95%の信頼度」という言い方をする
3️⃣ 母平均の信頼区間の計算(母分散既知)
母分散σ²が既知の場合
標準正規分布(z分布)を使う
X – z(α/2) × σ/√n ≤ μ ≤ X + z(α/2) × σ/√n
または
X ± z(α/2) × σ/√n
z(α/2): 標準正規分布の上側α/2点
• 95%信頼区間: z(0.025) = 1.96
• 99%信頼区間: z(0.005) = 2.58
• 90%信頼区間: z(0.05) = 1.645
サイズ25の標本を抽出したら、標本平均が52だった。
母平均μの95%信頼区間を求めなさい。
—
【ステップ1: 与えられた情報を整理】
・サンプルサイズ: n = 25 ・標本平均: X̄ = 52 ・母標準偏差: σ = 10(σ² = 100より) ・信頼係数: 95%(α = 0.05) ・母分散: 既知 → z分布を使う
—
【ステップ2: 使う公式を確認】
母分散既知なので:
X ± z(α/2) × σ/√n
—
【ステップ3: z値を確認】
95%信頼区間なので:
α = 0.05
α/2 = 0.025
z(0.025) = 1.96
【なぜα/2なのか?】
←── 95% ──→
┌────────────────────┐
2.5%│ │2.5%
────┴────────────────────┴────
-1.96 0 1.96
両側に2.5%ずつ = 合計5%が外側
中央95%が信頼区間に対応
—
【ステップ4: 標準誤差を計算】
SE = σ / √n
= 10 / √25
= 10 / 5
= 2
—
【ステップ5: 信頼区間の幅を計算】
z(α/2) × SE = 1.96 × 2 = 3.92
—
【ステップ6: 信頼区間を計算】
下側信頼限界:
X – 3.92 = 52 – 3.92 = 48.08
上側信頼限界:
X + 3.92 = 52 + 3.92 = 55.92
—
【答え】
95%信頼区間: [48.08, 55.92]
—
【結果の解釈】
「同じ方法で100回推定すると、約95回は
真の母平均μがこの区間[48.08, 55.92]に含まれる」
【計算のまとめ】
信頼区間 = X̄ ± z(α/2) × σ/√n
= 52 ± 1.96 × 10/5
= 52 ± 1.96 × 2
= 52 ± 3.92
= [48.08, 55.92]
• z分布使用: 標準正規分布
• 公式: X ± z(α/2) × σ/√n
• 実務: 母分散が既知なことは稀
• z値: 95%なら1.96、99%なら2.58
4️⃣ 母平均の信頼区間の計算(母分散未知)
母分散σ²が未知の場合
t分布を使う(自由度 n-1)
X – t(n-1, α/2) × s/√n ≤ μ ≤ X + t(n-1, α/2) × s/√n
または
X ± t(n-1, α/2) × s/√n
t(n-1, α/2): 自由度n-1のt分布の上側α/2点
s: 標本標準偏差(不偏標準偏差)
σが未知なので、標本標準偏差sで代用
→ 推定の不確実性が増える
→ z分布より裾が厚いt分布を使う
自由度が大きくなると(n ≥ 30程度)、
t分布はz分布に近づく
標本平均 X = 48、不偏標準偏差 s = 8 だった。
母平均μの95%信頼区間を求めなさい。
(t(15, 0.025) = 2.131)
—
【ステップ1: 与えられた情報を整理】
・サンプルサイズ: n = 16 ・標本平均: X̄ = 48 ・標本標準偏差: s = 8(不偏標準偏差) ・信頼係数: 95%(α = 0.05) ・母分散: 未知 → t分布を使う
—
【ステップ2: 使う公式を確認】
母分散未知なので:
X ± t(n-1, α/2) × s/√n
—
【ステップ3: 自由度を計算】
自由度 = n – 1 = 16 – 1 = 15
—
【ステップ4: t値を確認】
95%信頼区間、自由度15なので:
t(15, 0.025) = 2.131(問題文より)
【z値との比較】
z(0.025) = 1.96 t(15, 0.025) = 2.131 t値の方が大きい! → 信頼区間がz分布より広くなる → 母分散未知の「不確実性」を反映
—
【ステップ5: 標準誤差を計算】
SE = s / √n
= 8 / √16
= 8 / 4
= 2
—
【ステップ6: 信頼区間の幅を計算】
t(n-1, α/2) × SE = 2.131 × 2 = 4.262
—
【ステップ7: 信頼区間を計算】
下側信頼限界:
X – 4.262 = 48 – 4.262 = 43.738
上側信頼限界:
X + 4.262 = 48 + 4.262 = 52.262
—
【答え】
95%信頼区間: [43.738, 52.262]
—
【σ既知の場合と比較】
もしσ = 8が既知だったら(z分布使用): 48 ± 1.96 × 2 = [44.08, 51.92] 幅 = 7.84 今回(t分布使用): 48 ± 2.131 × 2 = [43.738, 52.262] 幅 = 8.524 → t分布の方が幅が広い(0.684広い) → 母分散が未知という不確実性を反映
—
【実務での重要ポイント】
実際の統計分析では、母分散σは未知のことがほとんど
→ 通常はt分布を使う!
• t分布使用: 自由度 n-1
• 公式: X ± t(n-1, α/2) × s/√n
• 実務: 通常はこちらを使う
• t値: z値より大きい(特にnが小さいとき)
5️⃣ 信頼係数と信頼区間の幅の関係
信頼係数を変えると
信頼係数が大きい → 区間が広い
• 99%信頼区間: z = 2.58(広い)
• 95%信頼区間: z = 1.96(中間)
• 90%信頼区間: z = 1.645(狭い)
トレードオフ:
信頼度を上げる ⇔ 区間が広くなる(精度が下がる)
サンプルサイズと区間の幅
区間の幅 = 2 × z(α/2) × σ/√n
nが大きい → 区間が狭い(精度が高い)
例: n = 100 のとき、√n = 10
n = 400 のとき、√n = 20
→ 4倍のサンプルで幅が1/2に
サンプルサイズを何倍にすればよいか?
—
【ステップ1: 信頼区間の幅の式を確認】
信頼区間の幅 W は:
W = 2 × z(α/2) × σ/√n
信頼係数(95%)とσは変えないので、
幅は 1/√n に比例する
W ∝ 1/√n
—
【ステップ2: 幅を1/2にする条件を立てる】
現在のサンプルサイズを n、新しいサンプルサイズを n’ とする
W’ = (1/2) × W
1/√n’ = (1/2) × (1/√n)
—
【ステップ3: n’を求める】
1/√n’ = 1/(2√n)
√n’ = 2√n
両辺を2乗:
n’ = 4n
—
【答え】
サンプルサイズを4倍にする必要がある
—
【一般化: 幅を1/k倍にするには】
幅を 1/2 にする → n を 4倍(= 2²倍) 幅を 1/3 にする → n を 9倍(= 3²倍) 幅を 1/10 にする → n を 100倍(= 10²倍) 一般に: 幅を 1/k 倍にするには n を k² 倍
—
【実務での示唆】
・精度を上げるにはサンプルサイズを大きくする
・しかし、2倍の精度には4倍のサンプルが必要
・コストとのバランスが重要!
例: n=100 で幅が10の場合
n=400 にすれば幅は5になる(1/2)
n=10000 にすれば幅は1になる(1/10)
📝 練習問題(20問)
このステップの理解度を確認しましょう。16問以上正解できれば次のステップへ進めます。
点推定
母平均μの点推定量として最も適切なものは?
【解き方】
E(X) = μ なので、Xは不偏推定量
(期待値が母数に等しい)
信頼区間の解釈
「母平均の95%信頼区間が[48, 52]」の正しい解釈は?
【解き方】
母平均μ自体は確率変数ではない
「μが95%で含まれる」は誤り
95%信頼区間のz値
母分散既知で95%信頼区間を作るとき、使うz値は?
【解き方】
95%信頼区間: α = 0.05, α/2 = 0.025
z(0.025) = 1.96
信頼区間の計算(σ既知)
n=36, X=100, σ=12 のとき、母平均の95%信頼区間は?
【解き方】
SE = σ/√n = 12/6 = 2
100 ± 1.96×2 = 100 ± 3.92
= [96.08, 103.92]
99%信頼区間
問題4で、99%信頼区間を作るとき使うz値は?(z(0.005)=2.58)
【解き方】
99%信頼区間: α=0.01, α/2=0.005
z(0.005) = 2.58
信頼区間の幅
95%信頼区間と99%信頼区間、どちらが広いか?
【解き方】
信頼度を上げると区間が広くなる
z = 2.58 > 1.96
t分布を使う条件
母平均の推定でt分布を使うのはどんなとき?
【解き方】
標本標準偏差sで代用するため
推定の不確実性が増える
自由度
n=20の標本でt分布を使うとき、自由度は?
【解き方】
自由度 = n – 1 = 20 – 1 = 19
信頼区間の計算(σ未知)
n=25, X=50, s=10, t(24,0.025)=2.064 のとき、95%信頼区間は?
【解き方】
SE = s/√n = 10/5 = 2
50 ± 2.064×2 = 50 ± 4.128
= [45.872, 54.128]
zとtの比較
同じ信頼係数で、z値とt値(n=10)はどちらが大きいか?
【解き方】
nが小さいとt分布の裾が厚い
→ t値 > z値
サンプルサイズの効果
信頼区間の幅を半分にするには、サンプルサイズを何倍にすればよいか?
【解き方】
幅 ∝ 1/√n
幅を1/2にする → √nを2倍 → nを4倍
標準誤差
σ=20, n=100 のとき、標準誤差は?
【解き方】
SE = σ/√n = 20/√100 = 20/10 = 2
有意水準
95%信頼区間の有意水準αは?
【解き方】
α = 1 – 信頼係数 = 1 – 0.95 = 0.05
90%信頼区間
90%信頼区間を作るとき使うz値は?
【解き方】
90%信頼区間: α=0.10, α/2=0.05
z(0.05) = 1.645
実務での選択
実務で母平均を推定するとき、通常はz分布とt分布のどちらを使うか?
【解き方】
母分散が既知なことは稀なため
通常はt分布を使う
信頼区間と点推定
点推定より区間推定の方が優れている理由は?
【解き方】
区間の幅で推定の不確実性が分かる
大標本
nが十分大きいとき(n≥30程度)、t分布は何に近づくか?
【解き方】
自由度が大きいと t分布 → z分布
信頼区間の幅の計算
95%信頼区間で、n=100, σ=20 のとき、信頼区間の幅は?
【解き方】
幅 = 2 × z × σ/√n
= 2 × 1.96 × 20/10
= 2 × 1.96 × 2 = 7.84
不偏推定量
標本平均Xが母平均μの不偏推定量である理由は?
【解き方】
期待値が母数に等しい → 不偏推定量
総合問題
n=16, X=75, s=12, t(15,0.025)=2.131 のとき、母平均の95%信頼区間の下限は?
【解き方】
SE = s/√n = 12/4 = 3
下限 = 75 – 2.131×3
= 75 – 6.393 = 68.607
⚠️ よくあるつまずきポイントと対策
信頼区間の意味を誤解
対策: 「確率的に変動するのは区間の方」と覚えましょう。
- ❌「μが95%で含まれる」
- ✅「95%の確率でμを含む区間が得られる」
- μは固定値、変動するのは信頼区間
z分布とt分布の使い分けを間違える
対策: 母分散の既知/未知で判断しましょう。
- σ既知 → z分布(標準正規分布)
- σ未知 → t分布(自由度n-1)
- 実務ではほとんどt分布を使う
α/2を忘れる
対策: 両側検定なので両端に振り分けることを忘れずに。
- 95%信頼区間 → α = 0.05 → α/2 = 0.025
- z(0.025) = 1.96(α/2を使う!)
- 図を描いて確認するとよい
サンプルサイズと精度の関係
対策: √nに反比例することを覚えましょう。
- 幅を1/2にする → nを4倍に
- 幅を1/3にする → nを9倍に
- 精度向上にはコストがかかる!
📚 このステップのまとめ
🎯 学習したこと
- 点推定と区間推定: 1つの値 vs 区間
- 信頼区間の意味: 100回中95回含まれる区間
- σ既知: X ± z(α/2)×σ/√n(z分布)
- σ未知: X ± t(n-1,α/2)×s/√n(t分布)
- 信頼係数と幅: 信頼度↑ → 幅↑
- サンプルサイズ: n↑ → 幅↓(精度↑)
練習問題で16問以上(80%以上)正解できたら、STEP 7に進みましょう!
信頼区間の正しい解釈が最重要です。
「母平均が95%の確率で含まれる」は誤り!
「95%の確率で母平均を含む区間が得られる」が正解です。
学習メモ
統計検定2級対策 - Step 6