STEP 5:標本分布

🎲 STEP 5: 標本分布

標本平均の分布と中心極限定理を理解し、推測統計学の扉を開こう

📖 このステップで学ぶこと

ここからは推測統計学の世界に入ります。標本平均の分布中心極限定理標本分散の分布t分布・カイ二乗分布・F分布を学びます。

📝 練習問題: 15問
🎯 到達目標: 標本平均の分布の性質を説明できる、中心極限定理の意味と重要性を理解する、標本分散の分布を理解する、t分布・カイ二乗分布・F分布の概要がわかる

1️⃣ 標本平均の分布(期待値と分散)

母集団から標本を抽出したとき、標本平均はどんな分布に従うでしょうか?

母集団と標本

母集団(population)
調査対象となる全体の集合
母平均: μ、母分散: σ²、母標準偏差: σ

標本(sample)
母集団から抽出されたデータ
標本サイズ: n
標本平均: X = (X₁ + X₂ + … + Xₙ) / n

標本平均の期待値

標本平均の期待値

母平均がμの母集団から、サイズnの標本を抽出したとき:

E(X) = μ

意味: 標本平均の期待値は母平均に等しい
(標本平均は母平均の不偏推定量

標本平均の分散

標本平均の分散

母分散がσ²の母集団から、サイズnの標本を抽出したとき:

V(X) = σ² / n

標準誤差(standard error):
SE = √V(X) = σ / √n

意味: サンプルサイズnが大きいほど、標本平均のばらつきは小さくなる
⚡ なぜ σ²/n なのか?

X₁, X₂, …, Xₙ が独立で、それぞれの分散がσ²のとき:

V(X) = V((X₁ + … + Xₙ)/n)
= (1/n²) × V(X₁ + … + Xₙ)
= (1/n²) × (σ² + … + σ²)(独立なので)
= (1/n²) × nσ²
= σ²/n

nが大きいほど、1/nが小さくなり、ばらつきが減る!
例題1: 母平均50、母標準偏差10の母集団から、
サイズ25の標本を抽出する。
標本平均Xの期待値と標準偏差を求めなさい。
解答:
E(X) = 50
σ(X) = 2



【与えられた情報を整理】
母集団のパラメータ:
・母平均: μ = 50
・母標準偏差: σ = 10
・母分散: σ² = 100

標本:
・サンプルサイズ: n = 25



【ステップ1: 標本平均の期待値を求める】

公式:
E(X) = μ

標本平均の期待値は、母平均に等しい!

E(X) = 50

【意味】
何度も標本を取って平均を計算すると、
その平均値の平均は母平均50に近づく



【ステップ2: 標本平均の分散を求める】

公式:
V(X) = σ² / n

V(X) = 100 / 25 = 4



【ステップ3: 標本平均の標準偏差(標準誤差)を求める】

公式:
σ(X) = σ / √n = √(σ²/n)

σ(X) = √4 = 2

または
σ(X) = 10 / √25 = 10 / 5 = 2



【結果の解釈】
元のデータ:      平均50、標準偏差10
標本平均(n=25):  平均50、標準偏差2

標本平均の標準偏差は元の 1/5 になった!
(√25 = 5 で割られている)

【重要ポイント】
• サンプルサイズを増やすと標準誤差が小さくなる
• n=25 → 標準偏差は 1/√25 = 1/5 倍
• n=100 → 標準偏差は 1/√100 = 1/10 倍

これが「たくさんデータを集めると推定精度が上がる」理由!

2️⃣ 中心極限定理の理解と応用

中心極限定理は統計学で最も重要な定理の1つです。

中心極限定理(Central Limit Theorem)

中心極限定理(CLT)

母集団の分布がどんな形でも、
サンプルサイズnが十分大きければ、
標本平均Xの分布は正規分布に近づく!

X → N(μ, σ²/n)(nが大きいとき)

標準化すると:
Z = (X – μ) / (σ/√n) → N(0, 1)
⚡ 中心極限定理の驚くべき点

• 母集団が正規分布でなくても良い!
• 一様分布でも、指数分布でも、どんな分布でも
• サンプルサイズが大きければ、標本平均は正規分布に

実用的な目安: n ≥ 30 で正規分布に近似できる
(母集団が極端に歪んでいなければ、n ≥ 10 でも可)
例題2: サイコロを100回振る。出た目の平均をXとする。
(サイコロの目の期待値=3.5、分散=35/12)

(1) Xの期待値と標準偏差
(2) P(3.3 ≤ X ≤ 3.7) を求めなさい。
解答:
(1) E(X) = 3.5, σ(X) ≒ 0.171
(2) 約0.758(75.8%)



【与えられた情報を整理】
サイコロの目(1〜6)の母集団:
・母平均: μ = (1+2+3+4+5+6)/6 = 3.5
・母分散: σ² = 35/12 ≒ 2.917
・母標準偏差: σ = √(35/12) ≒ 1.708

標本:
・サンプルサイズ: n = 100(100回振る)



【(1) 標本平均の期待値と標準偏差】

ステップ1: 期待値
E(X) = μ = 3.5

ステップ2: 分散
V(X) = σ²/n = (35/12)/100 = 35/1200

ステップ3: 標準偏差(標準誤差)
σ(X) = √(35/1200)
= √35 / √1200
= 5.916… / 34.64…
0.171



【(2) P(3.3 ≤ X ≤ 3.7) を求める】

ステップ1: 中心極限定理を適用
n = 100 は十分大きい(≥30)ので、中心極限定理より:
X ~ N(3.5, 35/1200) 近似的に

ステップ2: 標準化

X = 3.3 のとき:
Z = (3.3 – 3.5) / 0.171
= -0.2 / 0.171
-1.17

X = 3.7 のとき:
Z = (3.7 – 3.5) / 0.171
= 0.2 / 0.171
1.17

ステップ3: 確率を計算
P(3.3 ≤ X ≤ 3.7) = P(-1.17 ≤ Z ≤ 1.17)

正規分布表より:
Φ(1.17) ≒ 0.879
Φ(-1.17) = 1 – Φ(1.17) ≒ 0.121

P(-1.17 ≤ Z ≤ 1.17) = 0.879 – 0.121 = 0.758



【結果の解釈】
サイコロを100回振ったとき、
出た目の平均が 3.3〜3.7 の範囲に入る確率は約76%

・真の平均は 3.5
・100回の平均は、約76%の確率で 3.3〜3.7 に収まる
・標準誤差が小さい(0.171)ので、真の平均の近くに集まる

【なぜこれが重要か】
サイコロの目は「正規分布ではない」(一様分布に近い)
でも、100回の平均は「正規分布に従う」(中心極限定理!)
これが推測統計学の基礎になる
💡 中心極限定理のポイント
どんな分布でも: 母集団の形は問わない
nが大きいと: 標本平均は正規分布に
推測統計の基礎: これがあるから推定・検定ができる
実用上: n ≥ 30 が目安

3️⃣ 標本分散の分布

標本平均だけでなく、標本分散の性質も理解しましょう。

標本分散

標本分散(sample variance)

s² = Σ(Xᵢ – X)² / n

不偏分散(unbiased variance)

s² = Σ(Xᵢ – X)² / (n-1)

※nではなく(n-1)で割る → 不偏推定量になる
⚡ なぜ(n-1)で割るのか?

• nで割ると、母分散を過小評価してしまう
• (n-1)で割ると、E(s²) = σ²(不偏)
• (n-1)を自由度(degrees of freedom)という

自由度 = データ数 – 推定したパラメータ数
(平均を推定したので、n – 1)
例題3: 次のデータの標本分散と不偏分散を求めなさい。
データ: 2, 4, 6, 8, 10
解答:
標本分散(nで割る): 8
不偏分散(n-1で割る): 10



【ステップ1: 平均を計算】

X = (2 + 4 + 6 + 8 + 10) / 5
= 30 / 5
= 6



【ステップ2: 偏差と偏差の2乗を計算】
Xᵢ | Xᵢ - X̄ | (Xᵢ - X̄)²
───┼────────┼──────────
2  | 2 - 6 = -4 | 16
4  | 4 - 6 = -2 |  4
6  | 6 - 6 =  0 |  0
8  | 8 - 6 =  2 |  4
10 | 10 - 6 = 4 | 16
───┴────────┴──────────
合計               40

Σ(Xᵢ – X)² = 16 + 4 + 0 + 4 + 16 = 40



【ステップ3: 標本分散を計算(nで割る)】

標本分散 = Σ(Xᵢ – X)² / n
= 40 / 5
= 8



【ステップ4: 不偏分散を計算(n-1で割る)】

不偏分散 = Σ(Xᵢ – X)² / (n-1)
= 40 / 4
= 10



【2つの分散の違い】
標本分散(nで割る):
・そのデータ集合のばらつきを表す
・母分散の推定には向かない(過小評価)

不偏分散(n-1で割る):
・母分散を推定するための値
・E(s²) = σ² となる(不偏性)
・統計的推測では通常こちらを使う

【自由度の直感的理解】
5個のデータの平均が6と分かっている場合、
4個のデータを自由に決めれば、5個目は自動的に決まる
→ 自由に動ける個数 = 5 – 1 = 4(自由度)

標本分散の期待値

不偏分散の期待値

s² = Σ(Xᵢ – X)² / (n-1) のとき:

E(s²) = σ²

これが不偏分散を使う理由!

4️⃣ t分布・カイ二乗分布・F分布の導入

推測統計で使う重要な分布を紹介します。

t分布(Student’s t-distribution)

t分布

母分散σ²が未知のとき、

T = (X – μ) / (s/√n)

は自由度(n-1)のt分布に従う

記号: T ~ t(n-1)
t分布の特徴

• 標準正規分布に似ているが、裾が厚い
• 自由度が大きいほど、標準正規分布に近づく
• 自由度30以上で、ほぼ標準正規分布
• 左右対称、平均0
例題4: 母分散が未知の母集団から、サイズ16の標本を抽出した。
標本平均X = 52、標本標準偏差 s = 8 だった。
t統計量を求め、どの分布に従うか答えなさい(帰無仮説: μ = 50)。
解答:
t統計量 = 1.0
自由度15のt分布に従う: t ~ t(15)



【ステップ1: 与えられた情報を整理】
・サンプルサイズ: n = 16
・標本平均: X̄ = 52
・標本標準偏差: s = 8
・帰無仮説の母平均: μ₀ = 50
・母分散: 未知



【ステップ2: t統計量の公式を確認】

母分散が未知なので、t統計量を使う:
T = (X – μ₀) / (s / √n)



【ステップ3: 各部分を計算】

分子(標本平均と帰無仮説の差):
X – μ₀ = 52 – 50 = 2

分母(標準誤差の推定値):
s / √n = 8 / √16 = 8 / 4 = 2



【ステップ4: t統計量を計算】

T = 2 / 2 = 1.0



【ステップ5: 自由度を確認】

自由度 = n – 1 = 16 – 1 = 15



【結論】
t統計量 T = 1.0 は自由度15のt分布に従う
T ~ t(15)



【z統計量との違い】
母分散が既知のとき:
Z = (X̄ - μ) / (σ / √n) ~ N(0,1)
→ 正規分布表を使う

母分散が未知のとき:
T = (X̄ - μ) / (s / √n) ~ t(n-1)
→ t分布表を使う

※ sはσの推定値なので、不確実性が増す
※ その分、裾が厚くなる(t分布)

カイ二乗分布(Chi-square distribution)

カイ二乗分布

Z₁, Z₂, …, Zₙ が独立で N(0,1) に従うとき、

χ² = Z₁² + Z₂² + … + Zₙ²

は自由度nのカイ二乗分布に従う

記号: χ² ~ χ²(n)
カイ二乗分布の特徴

• 常に正の値をとる(0以上)
• 左右非対称(右に裾が長い)
• 自由度が大きいほど、正規分布に近づく
• 期待値 = n、分散 = 2n

F分布(F-distribution)

F分布

χ₁² ~ χ²(m)、χ₂² ~ χ²(n) が独立のとき、

F = (χ₁²/m) / (χ₂²/n)

は自由度(m, n)のF分布に従う

記号: F ~ F(m, n)
F分布の特徴

• 常に正の値をとる
• 左右非対称(右に裾が長い)
• 2つの分散の比を扱うときに使う
• 等分散性の検定で使用
💡 3つの分布の使い分け
t分布: 母分散未知のときの平均の推定・検定
カイ二乗分布: 分散の推定・検定、適合度検定
F分布: 2つの分散の比の検定(等分散性)

📝 練習問題(15問)

このステップの理解度を確認しましょう。12問以上正解できれば次のステップへ進めます。

問題 1

標本平均の期待値

母平均80、母標準偏差12の母集団から、サイズ36の標本を抽出する。標本平均の期待値は?

解答: 80

【解き方】
E(X) = μ = 80
標本平均の期待値は母平均に等しい
問題 2

標本平均の分散

問題1で、標本平均の分散を求めなさい。

解答: 4

【解き方】
σ² = 12² = 144
V(X) = σ²/n = 144/36 = 4
問題 3

標準誤差

問題1で、標本平均の標準誤差を求めなさい。

解答: 2

【解き方】
SE = σ/√n = 12/√36 = 12/6 = 2
問題 4

サンプルサイズの効果

母標準偏差20の母集団から、サイズnの標本を抽出する。標本平均の標準誤差を2にするには、nはいくつ必要か?

解答: n = 100

【解き方】
SE = σ/√n = 2 を解く
20/√n = 2
√n = 10
n = 100
問題 5

母集団が正規分布

X ~ N(60, 25) の母集団から、サイズ16の標本を抽出する。標本平均Xの分布は?

解答: X ~ N(60, 25/16)

【解き方】
母集団が正規分布なら、nに関係なく標本平均も正規分布
E(X) = 60
V(X) = 25/16 = 1.5625
問題 6

中心極限定理の適用

母平均50、母標準偏差10の母集団(分布不明)から、サイズ100の標本を抽出する。Xはおよそどんな分布に従うか?

解答: X ~ N(50, 1) 近似的に

【解き方】
n=100は十分大きいので中心極限定理より
X ~ N(50, 100/100) = N(50, 1)
問題 7

標準化して確率計算

問題6で、P(49 ≤ X ≤ 51) を求めなさい。(Φ(1) = 0.8413)

解答: 0.6826

【解き方】
σ(X) = √1 = 1
Z = (49-50)/1 = -1
Z = (51-50)/1 = 1
P = Φ(1) – Φ(-1) = 0.8413 – 0.1587 = 0.6826
問題 8

一様分布の標本平均

0から10の一様分布(平均5、分散100/12)から、サイズ60の標本。Xの標準偏差は?

解答: 約0.373

【解き方】
V(X) = (100/12)/60 = 100/720
σ(X) = √(100/720) = 10/√720 ≒ 0.373
問題 9

CLTの目安

中心極限定理を使って正規分布近似するとき、一般的なサンプルサイズの目安は?

解答: n ≥ 30

【解き方】
実用的には n ≥ 30 で十分正規分布に近似できる
問題 10

二項分布の正規近似

X ~ B(100, 0.3) のとき、中心極限定理により X/100 はどんな分布に近似できるか?

解答: N(0.3, 0.0021) 近似的に

【解き方】
E(X/100) = np/100 = 30/100 = 0.3
V(X/100) = np(1-p)/100² = 21/10000 = 0.0021
問題 11

自由度

サイズ20の標本から不偏分散を計算するとき、自由度は?

解答: 19

【解き方】
自由度 = n – 1 = 20 – 1 = 19
問題 12

t分布の自由度

サイズ25の標本で、母分散未知のときt統計量を計算する。t分布の自由度は?

解答: 24

【解き方】
t分布の自由度 = n – 1 = 25 – 1 = 24
問題 13

分布の使い分け

母分散既知で母平均を推定するとき、使う分布は?

解答: 標準正規分布(z分布)

【解き方】
Z = (X-μ)/(σ/√n) ~ N(0,1)
母分散が既知なら正規分布を使える
問題 14

t分布と正規分布

t分布で、自由度が無限大に近づくと、どの分布に近づくか?

解答: 標準正規分布 N(0,1)

【解き方】
自由度∞で、t分布 → N(0,1)
実用上、自由度30以上でほぼ正規分布
問題 15

F分布の用途

F分布は主にどのような検定で使われるか?

解答: 等分散性の検定(2つの母分散の比の検定)

【解き方】
F = s₁²/s₂² の分布を調べる
分散分析(ANOVA)でも使用

⚠️ よくあるつまずきポイントと対策

標準偏差と標準誤差の混同

対策: 2つの違いを明確に理解しましょう。

  • 標準偏差 σ: 個々のデータのばらつき
  • 標準誤差 SE = σ/√n: 標本平均のばらつき
  • 標準誤差は常に標準偏差より小さい(n>1のとき)

中心極限定理の誤解

対策: 「何が正規分布になるか」を正確に理解しましょう。

  • 正規分布になるのは「標本平均」であって「元のデータ」ではない
  • 母集団が正規分布でなくても、標本平均は正規分布に近づく
  • n ≥ 30 が実用的な目安

n-1で割る理由がわからない

対策: 「自由度」の概念を理解しましょう。

  • 平均を計算済み → 1つの制約がある
  • n個のデータのうち、自由に動けるのは(n-1)個
  • n-1で割ると不偏推定量になる

t分布と正規分布の使い分け

対策: 母分散が既知か未知かで判断しましょう。

  • 母分散既知 → 正規分布(z分布)
  • 母分散未知 → t分布
  • 実際の問題では、母分散は未知のことがほとんど → t分布を使う

📚 このステップのまとめ

🎯 学習したこと

  • 標本平均の分布: E(X)=μ、V(X)=σ²/n、SE=σ/√n
  • 中心極限定理: nが大きいとXは正規分布に近づく
  • 標本分散: 不偏分散はn-1で割る、自由度=n-1
  • t分布: 母分散未知のとき、自由度n-1
  • カイ二乗分布: 分散の推定・検定に使用
  • F分布: 2つの分散の比の検定に使用
💡 次のステップへ進む前に
練習問題で12問以上(80%以上)正解できたら、STEP 6に進みましょう!

このステップは推測統計学の基礎です。
特に中心極限定理は、これからの推定・検定の土台になります。
σ²/nの意味をしっかり理解しましょう!
📝

学習メモ

統計検定2級対策 - Step 5

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE