STEP 6:推定の基礎(母平均の推定)

📏 STEP 6: 推定の基礎(母平均の推定)

点推定と区間推定を理解し、信頼区間の計算をマスターしよう

📖 このステップで学ぶこと

いよいよ推測統計学の実践に入ります。点推定区間推定の違い、信頼区間の意味と計算方法を学びます。

📝 練習問題: 20問
🎯 到達目標: 点推定と区間推定の違いを説明できる、母平均の信頼区間が計算できる(σ既知・未知)、信頼区間の意味を正しく理解する、信頼係数と信頼区間の幅の関係がわかる

1️⃣ 点推定と区間推定の概念

推定とは

推定(estimation)
標本から母集団のパラメータ(母数)を推測すること

推定したいもの:
• 母平均 μ
• 母分散 σ²
• 母比率 p など

点推定(Point Estimation)

点推定
母数を1つの値で推定すること

例:
• 母平均μの点推定量: 標本平均 X
• 母分散σ²の点推定量: 不偏分散 s²

推定量(estimator)
推定に使う統計量

推定値(estimate)
実際に計算された値

区間推定(Interval Estimation)

区間推定
母数が含まれると期待される区間を推定すること

信頼区間(confidence interval)
母数が一定の確率で含まれる区間

[下側信頼限界, 上側信頼限界]
⚡ 点推定と区間推定の違い

点推定: μ = 50(1つの値)
• シンプルだが、どれくらい信頼できるか不明

区間推定: μ ∈ [48, 52](区間)
• 信頼度が分かる(例: 95%の確率で含まれる)
• より実用的!

2️⃣ 信頼区間の意味(95%信頼区間など)

信頼係数と信頼度

信頼係数(confidence coefficient)
記号: 1 – α

よく使われる値:
• 0.95(95%信頼区間)
• 0.99(99%信頼区間)
• 0.90(90%信頼区間)

有意水準(significance level)
α = 1 – 信頼係数
例: 95%信頼区間 → α = 0.05

信頼区間の正しい解釈

⚠️ 信頼区間の意味(よくある誤解)

❌ 間違い:
「母平均μが95%の確率で[48, 52]に含まれる」

✅ 正しい:
「同じ方法で100回区間推定したら、約95回は真の母平均μを含む区間が得られる」

母平均μは固定された値(確率変数ではない)
確率的に変動するのは信頼区間の方!
【イメージで理解】

100人が同じサイズの標本を取って信頼区間を計算すると:
• 約95人の区間が真のμを含む
• 約5人の区間は外れる(μを含まない)

自分が計算した区間が「95人側」か「5人側」かは分からない!
だから「95%の信頼度」という言い方をする

3️⃣ 母平均の信頼区間の計算(母分散既知)

母分散σ²が既知の場合

母平均μの信頼区間(σ既知)

標準正規分布(z分布)を使う

X – z(α/2) × σ/√n ≤ μ ≤ X + z(α/2) × σ/√n

または

X ± z(α/2) × σ/√n

z(α/2): 標準正規分布の上側α/2点
• 95%信頼区間: z(0.025) = 1.96
• 99%信頼区間: z(0.005) = 2.58
• 90%信頼区間: z(0.05) = 1.645
例題1: 母分散σ² = 100(σ = 10)の正規母集団から、
サイズ25の標本を抽出したら、標本平均が52だった。
母平均μの95%信頼区間を求めなさい。
解答: [48.08, 55.92]



【ステップ1: 与えられた情報を整理】
・サンプルサイズ: n = 25
・標本平均: X̄ = 52
・母標準偏差: σ = 10(σ² = 100より)
・信頼係数: 95%(α = 0.05)
・母分散: 既知 → z分布を使う



【ステップ2: 使う公式を確認】

母分散既知なので:
X ± z(α/2) × σ/√n



【ステップ3: z値を確認】

95%信頼区間なので:
α = 0.05
α/2 = 0.025
z(0.025) = 1.96

【なぜα/2なのか?】
         ←── 95% ──→
    ┌────────────────────┐
2.5%│                    │2.5%
────┴────────────────────┴────
  -1.96       0       1.96

両側に2.5%ずつ = 合計5%が外側
中央95%が信頼区間に対応



【ステップ4: 標準誤差を計算】

SE = σ / √n
= 10 / √25
= 10 / 5
= 2



【ステップ5: 信頼区間の幅を計算】

z(α/2) × SE = 1.96 × 2 = 3.92



【ステップ6: 信頼区間を計算】

下側信頼限界:
X – 3.92 = 52 – 3.92 = 48.08

上側信頼限界:
X + 3.92 = 52 + 3.92 = 55.92



【答え】
95%信頼区間: [48.08, 55.92]



【結果の解釈】
「同じ方法で100回推定すると、約95回は
真の母平均μがこの区間[48.08, 55.92]に含まれる」

【計算のまとめ】
信頼区間 = X̄ ± z(α/2) × σ/√n
         = 52 ± 1.96 × 10/5
         = 52 ± 1.96 × 2
         = 52 ± 3.92
         = [48.08, 55.92]
💡 母分散既知のポイント
z分布使用: 標準正規分布
公式: X ± z(α/2) × σ/√n
実務: 母分散が既知なことは稀
z値: 95%なら1.96、99%なら2.58

4️⃣ 母平均の信頼区間の計算(母分散未知)

母分散σ²が未知の場合

母平均μの信頼区間(σ未知)

t分布を使う(自由度 n-1)

X – t(n-1, α/2) × s/√n ≤ μ ≤ X + t(n-1, α/2) × s/√n

または

X ± t(n-1, α/2) × s/√n

t(n-1, α/2): 自由度n-1のt分布の上側α/2点
s: 標本標準偏差(不偏標準偏差)
⚡ なぜt分布を使うのか?

σが未知なので、標本標準偏差sで代用
→ 推定の不確実性が増える
→ z分布より裾が厚いt分布を使う

自由度が大きくなると(n ≥ 30程度)、
t分布はz分布に近づく
例題2: サイズ16の標本を抽出したら、
標本平均 X = 48、不偏標準偏差 s = 8 だった。
母平均μの95%信頼区間を求めなさい。
(t(15, 0.025) = 2.131)
解答: [43.738, 52.262]



【ステップ1: 与えられた情報を整理】
・サンプルサイズ: n = 16
・標本平均: X̄ = 48
・標本標準偏差: s = 8(不偏標準偏差)
・信頼係数: 95%(α = 0.05)
・母分散: 未知 → t分布を使う



【ステップ2: 使う公式を確認】

母分散未知なので:
X ± t(n-1, α/2) × s/√n



【ステップ3: 自由度を計算】

自由度 = n – 1 = 16 – 1 = 15



【ステップ4: t値を確認】

95%信頼区間、自由度15なので:
t(15, 0.025) = 2.131(問題文より)

【z値との比較】
z(0.025) = 1.96
t(15, 0.025) = 2.131

t値の方が大きい!
→ 信頼区間がz分布より広くなる
→ 母分散未知の「不確実性」を反映



【ステップ5: 標準誤差を計算】

SE = s / √n
= 8 / √16
= 8 / 4
= 2



【ステップ6: 信頼区間の幅を計算】

t(n-1, α/2) × SE = 2.131 × 2 = 4.262



【ステップ7: 信頼区間を計算】

下側信頼限界:
X – 4.262 = 48 – 4.262 = 43.738

上側信頼限界:
X + 4.262 = 48 + 4.262 = 52.262



【答え】
95%信頼区間: [43.738, 52.262]



【σ既知の場合と比較】
もしσ = 8が既知だったら(z分布使用):
48 ± 1.96 × 2 = [44.08, 51.92]
幅 = 7.84

今回(t分布使用):
48 ± 2.131 × 2 = [43.738, 52.262]
幅 = 8.524

→ t分布の方が幅が広い(0.684広い)
→ 母分散が未知という不確実性を反映



【実務での重要ポイント】
実際の統計分析では、母分散σは未知のことがほとんど
→ 通常はt分布を使う!
💡 母分散未知のポイント
t分布使用: 自由度 n-1
公式: X ± t(n-1, α/2) × s/√n
実務: 通常はこちらを使う
t値: z値より大きい(特にnが小さいとき)

5️⃣ 信頼係数と信頼区間の幅の関係

信頼係数を変えると

信頼係数と区間の幅

信頼係数が大きい → 区間が広い
• 99%信頼区間: z = 2.58(広い)
• 95%信頼区間: z = 1.96(中間)
• 90%信頼区間: z = 1.645(狭い)

トレードオフ:
信頼度を上げる ⇔ 区間が広くなる(精度が下がる)

サンプルサイズと区間の幅

サンプルサイズの効果

区間の幅 = 2 × z(α/2) × σ/√n

nが大きい → 区間が狭い(精度が高い)

例: n = 100 のとき、√n = 10
  n = 400 のとき、√n = 20
  → 4倍のサンプルで幅が1/2に
例題3: 95%信頼区間の幅を1/2にするには、
サンプルサイズを何倍にすればよいか?
解答: 4倍



【ステップ1: 信頼区間の幅の式を確認】

信頼区間の幅 W は:
W = 2 × z(α/2) × σ/√n

信頼係数(95%)とσは変えないので、
幅は 1/√n に比例する

W ∝ 1/√n



【ステップ2: 幅を1/2にする条件を立てる】

現在のサンプルサイズを n、新しいサンプルサイズを n’ とする

W’ = (1/2) × W

1/√n’ = (1/2) × (1/√n)



【ステップ3: n’を求める】

1/√n’ = 1/(2√n)

√n’ = 2√n

両辺を2乗:
n’ = 4n



【答え】
サンプルサイズを4倍にする必要がある



【一般化: 幅を1/k倍にするには】
幅を 1/2 にする → n を 4倍(= 2²倍)
幅を 1/3 にする → n を 9倍(= 3²倍)
幅を 1/10 にする → n を 100倍(= 10²倍)

一般に: 幅を 1/k 倍にするには n を k² 倍



【実務での示唆】
・精度を上げるにはサンプルサイズを大きくする
・しかし、2倍の精度には4倍のサンプルが必要
・コストとのバランスが重要!

例: n=100 で幅が10の場合
    n=400 にすれば幅は5になる(1/2)
    n=10000 にすれば幅は1になる(1/10)

📝 練習問題(20問)

このステップの理解度を確認しましょう。16問以上正解できれば次のステップへ進めます。

問題 1

点推定

母平均μの点推定量として最も適切なものは?

解答: 標本平均 X

【解き方】
E(X) = μ なので、Xは不偏推定量
(期待値が母数に等しい)
問題 2

信頼区間の解釈

「母平均の95%信頼区間が[48, 52]」の正しい解釈は?

解答: 同じ方法で100回推定すれば、約95回は真の母平均を含む区間が得られる

【解き方】
母平均μ自体は確率変数ではない
「μが95%で含まれる」は誤り
問題 3

95%信頼区間のz値

母分散既知で95%信頼区間を作るとき、使うz値は?

解答: 1.96

【解き方】
95%信頼区間: α = 0.05, α/2 = 0.025
z(0.025) = 1.96
問題 4

信頼区間の計算(σ既知)

n=36, X=100, σ=12 のとき、母平均の95%信頼区間は?

解答: [96.08, 103.92]

【解き方】
SE = σ/√n = 12/6 = 2
100 ± 1.96×2 = 100 ± 3.92
= [96.08, 103.92]
問題 5

99%信頼区間

問題4で、99%信頼区間を作るとき使うz値は?(z(0.005)=2.58)

解答: 2.58

【解き方】
99%信頼区間: α=0.01, α/2=0.005
z(0.005) = 2.58
問題 6

信頼区間の幅

95%信頼区間と99%信頼区間、どちらが広いか?

解答: 99%信頼区間の方が広い

【解き方】
信頼度を上げると区間が広くなる
z = 2.58 > 1.96
問題 7

t分布を使う条件

母平均の推定でt分布を使うのはどんなとき?

解答: 母分散σ²が未知のとき

【解き方】
標本標準偏差sで代用するため
推定の不確実性が増える
問題 8

自由度

n=20の標本でt分布を使うとき、自由度は?

解答: 19

【解き方】
自由度 = n – 1 = 20 – 1 = 19
問題 9

信頼区間の計算(σ未知)

n=25, X=50, s=10, t(24,0.025)=2.064 のとき、95%信頼区間は?

解答: [45.872, 54.128]

【解き方】
SE = s/√n = 10/5 = 2
50 ± 2.064×2 = 50 ± 4.128
= [45.872, 54.128]
問題 10

zとtの比較

同じ信頼係数で、z値とt値(n=10)はどちらが大きいか?

解答: t値の方が大きい

【解き方】
nが小さいとt分布の裾が厚い
→ t値 > z値
問題 11

サンプルサイズの効果

信頼区間の幅を半分にするには、サンプルサイズを何倍にすればよいか?

解答: 4倍

【解き方】
幅 ∝ 1/√n
幅を1/2にする → √nを2倍 → nを4倍
問題 12

標準誤差

σ=20, n=100 のとき、標準誤差は?

解答: 2

【解き方】
SE = σ/√n = 20/√100 = 20/10 = 2
問題 13

有意水準

95%信頼区間の有意水準αは?

解答: 0.05

【解き方】
α = 1 – 信頼係数 = 1 – 0.95 = 0.05
問題 14

90%信頼区間

90%信頼区間を作るとき使うz値は?

解答: 1.645

【解き方】
90%信頼区間: α=0.10, α/2=0.05
z(0.05) = 1.645
問題 15

実務での選択

実務で母平均を推定するとき、通常はz分布とt分布のどちらを使うか?

解答: t分布

【解き方】
母分散が既知なことは稀なため
通常はt分布を使う
問題 16

信頼区間と点推定

点推定より区間推定の方が優れている理由は?

解答: 推定の信頼度(精度)が分かるから

【解き方】
区間の幅で推定の不確実性が分かる
問題 17

大標本

nが十分大きいとき(n≥30程度)、t分布は何に近づくか?

解答: 標準正規分布(z分布)

【解き方】
自由度が大きいと t分布 → z分布
問題 18

信頼区間の幅の計算

95%信頼区間で、n=100, σ=20 のとき、信頼区間の幅は?

解答: 7.84

【解き方】
幅 = 2 × z × σ/√n
= 2 × 1.96 × 20/10
= 2 × 1.96 × 2 = 7.84
問題 19

不偏推定量

標本平均Xが母平均μの不偏推定量である理由は?

解答: E(X) = μ だから

【解き方】
期待値が母数に等しい → 不偏推定量
問題 20

総合問題

n=16, X=75, s=12, t(15,0.025)=2.131 のとき、母平均の95%信頼区間の下限は?

解答: 68.607

【解き方】
SE = s/√n = 12/4 = 3
下限 = 75 – 2.131×3
= 75 – 6.393 = 68.607

⚠️ よくあるつまずきポイントと対策

信頼区間の意味を誤解

対策: 「確率的に変動するのは区間の方」と覚えましょう。

  • ❌「μが95%で含まれる」
  • ✅「95%の確率でμを含む区間が得られる」
  • μは固定値、変動するのは信頼区間

z分布とt分布の使い分けを間違える

対策: 母分散の既知/未知で判断しましょう。

  • σ既知 → z分布(標準正規分布)
  • σ未知 → t分布(自由度n-1)
  • 実務ではほとんどt分布を使う

α/2を忘れる

対策: 両側検定なので両端に振り分けることを忘れずに。

  • 95%信頼区間 → α = 0.05 → α/2 = 0.025
  • z(0.025) = 1.96(α/2を使う!)
  • 図を描いて確認するとよい

サンプルサイズと精度の関係

対策: √nに反比例することを覚えましょう。

  • 幅を1/2にする → nを4倍に
  • 幅を1/3にする → nを9倍に
  • 精度向上にはコストがかかる!

📚 このステップのまとめ

🎯 学習したこと

  • 点推定と区間推定: 1つの値 vs 区間
  • 信頼区間の意味: 100回中95回含まれる区間
  • σ既知: X ± z(α/2)×σ/√n(z分布)
  • σ未知: X ± t(n-1,α/2)×s/√n(t分布)
  • 信頼係数と幅: 信頼度↑ → 幅↑
  • サンプルサイズ: n↑ → 幅↓(精度↑)
💡 次のステップへ進む前に
練習問題で16問以上(80%以上)正解できたら、STEP 7に進みましょう!

信頼区間の正しい解釈が最重要です。
「母平均が95%の確率で含まれる」は誤り!
「95%の確率で母平均を含む区間が得られる」が正解です。
📝

学習メモ

統計検定2級対策 - Step 6

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE