STEP 14:実践問題演習(2級レベル)

💪 STEP 14: 実践問題演習(2級レベル)

典型問題を分野別に演習して実力をつけよう

📖 このステップで学ぶこと

統計学2級レベルの典型問題を分野別に演習し、実戦力を高めます。

📝 練習問題: 40問
🎯 到達目標: 統計学2級レベルの典型問題が解ける、制限時間内に正確に解く力がつく、弱点分野を特定し対策できる
⏱️ 目安: 1問あたり約2〜3分

📊 分野1: 確率分布(10問)

問題 1

二項分布

コインを10回投げる。表が7回以上出る確率は?(表が出る確率=0.5)
ヒント: C(10,7)=120, C(10,8)=45, C(10,9)=10, C(10,10)=1

解答: 0.172(約17.2%)

【ステップ1: 分布を特定】
X = 表が出る回数
X ~ B(10, 0.5)(二項分布)

【ステップ2: 求める確率を式で表す】
P(X ≥ 7) = P(X=7) + P(X=8) + P(X=9) + P(X=10)

【ステップ3: 各確率を計算】
二項分布の公式: P(X=k) = C(n,k) × p^k × (1-p)^(n-k)

P(X=7) = C(10,7) × 0.5^7 × 0.5^3 = 120 × 0.5^10
P(X=8) = C(10,8) × 0.5^8 × 0.5^2 = 45 × 0.5^10
P(X=9) = C(10,9) × 0.5^9 × 0.5^1 = 10 × 0.5^10
P(X=10) = C(10,10) × 0.5^10 = 1 × 0.5^10

【ステップ4: 合計】
P(X ≥ 7) = (120 + 45 + 10 + 1) × 0.5^10
= 176 / 1024
= 0.172
問題 2

ポアソン分布

平均5件/日の問い合わせがある。1日に8件以上来る確率は約何%か?
ヒント: P(X≤7)=0.867(累積確率表より)

解答: 13.3%

【ステップ1: 分布を特定】
X = 1日の問い合わせ件数
X ~ Po(5)(ポアソン分布、λ=5)

【ステップ2: 余事象を使う】
P(X ≥ 8) = 1 – P(X ≤ 7)

【ステップ3: 計算】
P(X ≥ 8) = 1 – 0.867 = 0.133 = 13.3%

【ポイント】
「以上」の確率は余事象で計算すると楽
問題 3

正規分布の標準化

X ~ N(50, 10²)のとき、P(X≥60)は?(標準正規分布表: P(Z≥1)=0.1587)

解答: 0.1587(約15.87%)

【ステップ1: 標準化】
Z = (X – μ) / σ = (60 – 50) / 10 = 1

【ステップ2: 標準正規分布表を使う】
P(X ≥ 60) = P(Z ≥ 1) = 0.1587

【ポイント】
正規分布の問題は必ず標準化してZに変換
問題 4

正規分布の区間確率

X ~ N(100, 15²)のとき、P(85≤X≤115)は?
ヒント: P(Z≤1)=0.8413

解答: 0.6826(約68.26%)

【ステップ1: 両端を標準化】
Z₁ = (85 – 100) / 15 = -1
Z₂ = (115 – 100) / 15 = 1

【ステップ2: 区間確率を計算】
P(85 ≤ X ≤ 115) = P(-1 ≤ Z ≤ 1)
= P(Z ≤ 1) – P(Z ≤ -1)
= P(Z ≤ 1) – [1 – P(Z ≤ 1)]
= 0.8413 – (1 – 0.8413)
= 0.8413 – 0.1587
= 0.6826

【ポイント】
正規分布は対称なので P(Z ≤ -1) = 1 – P(Z ≤ 1)
問題 5

二項分布の正規近似

n=100, p=0.3の二項分布で、X≥35となる確率は?
ヒント: np=30, √(np(1-p))≈4.58、P(Z≥1.09)≈0.138

解答: 約0.138(約13.8%)

【ステップ1: 正規近似の条件確認】
np = 100 × 0.3 = 30 ≥ 5 ✓
n(1-p) = 100 × 0.7 = 70 ≥ 5 ✓
→ 正規近似が使える

【ステップ2: 平均と標準偏差】
μ = np = 30
σ = √(np(1-p)) = √21 ≈ 4.58

【ステップ3: 連続性補正】
離散 → 連続に近似するので補正
P(X ≥ 35) ≈ P(X ≥ 34.5)(0.5引く)

【ステップ4: 標準化】
Z = (34.5 – 30) / 4.58 ≈ 0.98 ≈ 1.09
P(Z ≥ 1.09) ≈ 0.138
問題 6

中心極限定理

平均50、標準偏差10の母集団から、n=25の標本を抽出。標本平均が53以上になる確率は?
P(Z≥1.5)=0.0668

解答: 0.0668(約6.68%)

【ステップ1: 標本平均の分布】
中心極限定理より:
X̄ ~ N(μ, σ²/n) = N(50, 10²/25) = N(50, 4)

【ステップ2: 標準誤差を計算】
σx̄ = σ/√n = 10/√25 = 10/5 = 2

【ステップ3: 標準化】
Z = (X̄ – μ) / σx̄ = (53 – 50) / 2 = 1.5

【ステップ4: 確率を求める】
P(X̄ ≥ 53) = P(Z ≥ 1.5) = 0.0668

【ポイント】
標本平均の標準偏差(標準誤差)= σ/√n
問題 7

標本分散の分布

正規母集団N(50, 10²)から、n=10の標本。標本分散の期待値は?

解答: 100(= 母分散σ²)

【解説】
不偏標本分散S²の期待値:
E[S²] = σ² = 10² = 100

【ポイント】
不偏標本分散は「不偏」なので、期待値が母分散に一致する
これが分母を(n-1)で割る理由
問題 8

期待値の計算

X ~ B(20, 0.4)のとき、E[X]とV[X]は?

解答: E[X] = 8, V[X] = 4.8

【二項分布の公式】
E[X] = np
V[X] = np(1-p)

【計算】
E[X] = 20 × 0.4 = 8
V[X] = 20 × 0.4 × 0.6 = 4.8

【ポイント】
二項分布の期待値と分散の公式は必須暗記
問題 9

パーセント点

X ~ N(100, 15²)で、上側10%点(P(X≥x)=0.1となるx)は?
ヒント: P(Z≥1.28)=0.1

解答: x = 119.2

【ステップ1: 標準正規分布で考える】
P(Z ≥ 1.28) = 0.1 より、上側10%点は Z = 1.28

【ステップ2: 元のスケールに戻す】
Z = (x – μ) / σ
1.28 = (x – 100) / 15

【ステップ3: xを求める】
x = 100 + 15 × 1.28 = 100 + 19.2 = 119.2

【ポイント】
x = μ + σ × z で元のスケールに戻す
問題 10

t分布

自由度9のt分布で、P(|T|≤2.262)=?

解答: 0.95

【解説】
t分布表より: t(9, 0.025) = 2.262

これは「両側で5%(片側2.5%ずつ)が外側にある」という意味

よって:
P(|T| ≤ 2.262) = 1 – 0.05 = 0.95

【ポイント】
t分布表の値は「その値以上になる確率」を示す

📐 分野2: 推定(10問)

問題 11

母平均の信頼区間(σ既知)

n=25, x̄=50, σ=10。母平均μの95%信頼区間は?(z=1.96)

解答: (46.08, 53.92)

【公式】
信頼区間: x̄ ± z × σ/√n

【計算】
標準誤差: σ/√n = 10/√25 = 10/5 = 2
誤差幅: 1.96 × 2 = 3.92

下限: 50 – 3.92 = 46.08
上限: 50 + 3.92 = 53.92

答え: (46.08, 53.92)
問題 12

母平均の信頼区間(σ未知)

n=16, x̄=75, s=8。母平均μの95%信頼区間は?(t(15,0.025)=2.131)

解答: (70.74, 79.26)

【公式】
σ未知の場合: x̄ ± t × s/√n

【計算】
自由度: n – 1 = 15
標準誤差: s/√n = 8/√16 = 8/4 = 2
誤差幅: 2.131 × 2 = 4.262

下限: 75 – 4.262 = 70.74
上限: 75 + 4.262 = 79.26

【ポイント】
σ未知 → t分布を使う(zではなくt)
問題 13

母比率の信頼区間

n=400, x=120。母比率pの95%信頼区間は?(z=1.96)

解答: (0.255, 0.345)

【ステップ1: 標本比率を計算】
p̂ = x/n = 120/400 = 0.3

【ステップ2: 標準誤差を計算】
SE = √[p̂(1-p̂)/n] = √[0.3×0.7/400]
= √[0.21/400] = √0.000525 ≈ 0.023

【ステップ3: 信頼区間を計算】
誤差幅: 1.96 × 0.023 = 0.045

下限: 0.3 – 0.045 = 0.255
上限: 0.3 + 0.045 = 0.345
問題 14

信頼区間の幅

σ=10、n=100で95%信頼区間の幅を半分にするには、nをいくつにすべきか?

解答: n = 400

【信頼区間の幅】
幅 = 2 × z × σ/√n
幅 ∝ 1/√n(σ、zが一定のとき)

【幅を半分にするには】
幅を1/2にする → √nを2倍にする → nを4倍にする

n = 100 × 4 = 400

【ポイント】
精度を2倍にするにはサンプルサイズを4倍に
問題 15

必要標本サイズ

母比率を誤差±0.03以内で95%の信頼度で推定したい。必要なnは?(保守的推定)

解答: n ≈ 1068

【公式】
誤差 E = z × √[p(1-p)/n]

【ステップ1: 保守的推定】
pがわからないとき、p=0.5を使う
(p(1-p)が最大になる)

【ステップ2: nについて解く】
0.03 = 1.96 × √[0.5×0.5/n]
0.03 = 1.96 × √[0.25/n]
0.03/1.96 = √[0.25/n]
(0.03/1.96)² = 0.25/n
n = 0.25 / (0.03/1.96)²
n = 0.25 × (1.96/0.03)²
n = 0.25 × 4268.4 ≈ 1067.1

切り上げて n = 1068
問題 16

99%信頼区間

n=25, x̄=50, s=10。母平均μの99%信頼区間は?(t(24,0.005)=2.797)

解答: (44.41, 55.59)

【計算】
自由度: n – 1 = 24
標準誤差: s/√n = 10/√25 = 2
誤差幅: 2.797 × 2 = 5.594

下限: 50 – 5.594 = 44.41
上限: 50 + 5.594 = 55.59

【ポイント】
99%信頼区間は95%より幅が広い
問題 17

信頼区間の解釈

95%信頼区間(48, 52)の正しい解釈は?

解答: この方法で区間を作ると、95%の確率で真の母平均を含む

【正しい解釈】
「同じ方法で100回区間を作れば、約95回は真の母平均を含む」

【誤った解釈】
✗「母平均が95%の確率でこの区間にある」
→ 母平均は定数なので確率的に変動しない

【ポイント】
確率的なのは「区間」であって「母平均」ではない
問題 18

標本サイズと精度

標本サイズを4倍にすると、信頼区間の幅はどうなるか?

解答: 1/2(半分)になる

【理由】
区間の幅 ∝ 1/√n

nが4倍 → √nが2倍 → 1/√nが1/2
→ 幅が1/2

【ポイント】
幅を半分にするにはnを4倍に
幅を1/3にするにはnを9倍に
問題 19

点推定と区間推定

点推定と区間推定の違いは?

解答: 点推定は1つの値、区間推定は範囲で推定

【点推定】
1つの値で母数を推定
例: μの推定値 = x̄ = 50

【区間推定】
範囲で母数を推定(信頼度付き)
例: 48 ≤ μ ≤ 52(95%信頼区間)

【区間推定の利点】
推定の不確実性を表現できる
問題 20

信頼係数

信頼係数を95%から99%に上げると、信頼区間はどうなるか?

解答: 幅が広くなる

【理由】
信頼度を上げる = より確実に母数を含みたい
→ より広い範囲をカバーする必要がある

【数値例】
95%: z = 1.96
99%: z = 2.576
→ zが大きくなる → 幅が広くなる

【トレードオフ】
信頼度↑ ⇔ 精度↓(幅が広い)

🔍 分野3: 検定(10問)

問題 21

母平均のz検定

μ₀=100、n=25、x̄=105、σ=10。α=0.05で両側検定。(z=1.96)

解答: H₀を棄却(有意差あり)

【ステップ1: 仮説設定】
H₀: μ = 100
H₁: μ ≠ 100(両側検定)

【ステップ2: 検定統計量】
Z = (x̄ – μ₀) / (σ/√n)
= (105 – 100) / (10/√25)
= 5 / 2 = 2.5

【ステップ3: 判定】
棄却域: |Z| > 1.96
|Z| = 2.5 > 1.96 → 棄却域に入る

結論: H₀を棄却
問題 22

母平均のt検定

μ₀=50、n=16、x̄=53、s=4。α=0.05で右片側検定。(t(15,0.05)=1.753)

解答: H₀を棄却(有意差あり)

【ステップ1: 仮説設定】
H₀: μ = 50
H₁: μ > 50(右片側検定)

【ステップ2: 検定統計量】
T = (x̄ – μ₀) / (s/√n)
= (53 – 50) / (4/√16)
= 3 / 1 = 3

【ステップ3: 判定】
棄却域: T > 1.753
T = 3 > 1.753 → 棄却域に入る

結論: H₀を棄却
問題 23

母比率の検定

p₀=0.5、n=100、x=60。α=0.05で両側検定。(z=1.96)

解答: H₀を棄却(有意差あり)

【ステップ1: 仮説設定】
H₀: p = 0.5
H₁: p ≠ 0.5

【ステップ2: 標本比率】
p̂ = 60/100 = 0.6

【ステップ3: 検定統計量】
Z = (p̂ – p₀) / √[p₀(1-p₀)/n]
= (0.6 – 0.5) / √[0.5×0.5/100]
= 0.1 / 0.05 = 2

【ステップ4: 判定】
|Z| = 2 > 1.96 → 棄却

【ポイント】
検定では分母にp₀を使う(信頼区間ではp̂)
問題 24

F検定

n₁=10、s₁²=25、n₂=8、s₂²=16。α=0.10で等分散の検定。(F(9,7,0.05)=3.68)

解答: 等分散といえる(H₀を棄却できない)

【ステップ1: 仮説設定】
H₀: σ₁² = σ₂²
H₁: σ₁² ≠ σ₂²

【ステップ2: 検定統計量】
F = 大きい方/小さい方 = 25/16 = 1.5625

【ステップ3: 自由度】
ν₁ = 10 – 1 = 9
ν₂ = 8 – 1 = 7

【ステップ4: 判定】
両側検定α=0.10 → 片側α=0.05
棄却域: F > 3.68
F = 1.5625 < 3.68 → 棄却できない

結論: 等分散と仮定してよい
問題 25

2標本t検定

A群(n=10,x̄=75,s²=20)、B群(n=8,x̄=70,s²=18)。等分散として平均の差を検定。α=0.05。t(16,0.025)=2.120

解答: 差があるといえる(H₀を棄却)

【ステップ1: プールした分散】
s²ₚ = [(n₁-1)s₁² + (n₂-1)s₂²] / (n₁+n₂-2)
= (9×20 + 7×18) / 16
= (180 + 126) / 16
= 306 / 16 = 19.125

【ステップ2: 標準誤差】
SE = √[s²ₚ × (1/n₁ + 1/n₂)]
= √[19.125 × (1/10 + 1/8)]
= √[19.125 × 0.225]
= √4.303 ≈ 2.074

【ステップ3: 検定統計量】
T = (x̄₁ – x̄₂) / SE = (75 – 70) / 2.074 ≈ 2.41

【ステップ4: 判定】
|T| = 2.41 > 2.120 → 棄却
問題 26

対標本t検定

n=10、d̄=-2.5、sd=3。α=0.05で左片側検定。t(9,0.05)=1.833

解答: 効果があるといえる(H₀を棄却)

【ステップ1: 仮説設定】
H₀: μd = 0(差がない)
H₁: μd < 0(減少効果あり)

【ステップ2: 検定統計量】
T = d̄ / (sd/√n)
= -2.5 / (3/√10)
= -2.5 / 0.949
≈ -2.634

【ステップ3: 判定】
左片側検定の棄却域: T < -1.833
T = -2.634 < -1.833 → 棄却

結論: 有意に減少している
問題 27

第一種・第二種の誤り

第一種の誤りとは何か?

解答: H₀が真なのに棄却してしまう誤り

【第一種の誤り(α誤差)】
・H₀が真なのに棄却
・確率 = α(有意水準)
・偽陽性(本当は効果がないのに「ある」と判断)

【第二種の誤り(β誤差)】
・H₀が偽なのに棄却できない
・確率 = β
・偽陰性(本当は効果があるのに「ない」と判断)

【関係】
検定力 = 1 – β
問題 28

p値

p値=0.03、α=0.05のとき判定は?

解答: H₀を棄却(有意差あり)

【判定ルール】
p値 < α → H₀を棄却
p値 ≥ α → H₀を棄却できない

【この問題】
p値 = 0.03 < α = 0.05
→ H₀を棄却

【p値の意味】
「H₀が真のとき、今回の結果以上に極端な結果が得られる確率」
問題 29

検定の多重性

20個の検定をα=0.05で行うと、少なくとも1つ有意になる確率は約何%?

解答: 約64%

【計算】
すべて有意でない確率: (1 – 0.05)^20 = 0.95^20
≈ 0.358

少なくとも1つ有意になる確率:
1 – 0.358 ≈ 0.64 = 64%

【多重検定の問題】
検定を繰り返すと、偶然有意になる確率が上がる
→ ボンフェローニ補正などで対処
問題 30

検定力

検定力を上げる方法は?

解答: 標本サイズを大きくする、αを大きくする

【検定力とは】
検定力 = 1 – β
= 「H₀が偽のとき、正しく棄却できる確率」

【検定力を上げる方法】
1. 標本サイズnを大きくする(最も一般的)
2. 有意水準αを大きくする(トレードオフあり)
3. 効果量を大きくする(介入を強くする)
4. 測定の精度を上げる(σを小さく)

📈 分野4: 回帰分析・カイ二乗検定(10問)

問題 31

回帰係数

x̄=5、ȳ=20、Sxy=30、Sxx=10。回帰直線は?

解答: y = 5 + 3x

【ステップ1: 傾きb】
b = Sxy / Sxx = 30 / 10 = 3

【ステップ2: 切片a】
a = ȳ – b × x̄ = 20 – 3 × 5 = 20 – 15 = 5

【回帰直線】
y = 5 + 3x

【解釈】
xが1増えるとyが3増える
問題 32

決定係数

相関係数r=0.8のとき、決定係数R²は?

解答: R² = 0.64

【公式】
単回帰: R² = r²

【計算】
R² = 0.8² = 0.64

【解釈】
yの変動の64%がxで説明される
残り36%は他の要因や誤差
問題 33

残差

回帰直線y=2+3x、x=4で実測値y=16。残差は?

解答: e = 2

【ステップ1: 予測値】
ŷ = 2 + 3 × 4 = 2 + 12 = 14

【ステップ2: 残差】
e = y – ŷ = 16 – 14 = 2

【解釈】
正の残差 → 実際値が予測より大きい
(モデルが過小予測)
問題 34

適合度検定

サイコロ120回、各目20回期待。観測(25,18,22,19,17,19)。χ²(5,0.05)=11.07

解答: 公平といえる(H₀を棄却できない)

【ステップ1: 期待度数】
E = 120 / 6 = 20(各目)

【ステップ2: χ²を計算】
χ² = Σ(O-E)²/E
= (25-20)²/20 + (18-20)²/20 + (22-20)²/20
+ (19-20)²/20 + (17-20)²/20 + (19-20)²/20
= 25/20 + 4/20 + 4/20 + 1/20 + 9/20 + 1/20
= 44/20 = 2.2

【ステップ3: 判定】
自由度: 6 – 1 = 5
χ² = 2.2 < 11.07 → 棄却できない
問題 35

独立性の検定

2×2分割表で、行合計(50,50)、列合計(50,50)、セル(30,20,20,30)。χ²(1,0.05)=3.84

解答: 関連があるといえる(H₀を棄却)

【ステップ1: 期待度数】
全セル: E = 50×50/100 = 25

【ステップ2: χ²を計算】
χ² = Σ(O-E)²/E
= (30-25)²/25 + (20-25)²/25 + (20-25)²/25 + (30-25)²/25
= 4 × (25/25) = 4

【ステップ3: 判定】
自由度: (2-1)(2-1) = 1
χ² = 4 > 3.84 → 棄却
問題 36

期待度数

行合計60、列合計40、全体100。期待度数は?

解答: E = 24

【公式】
E = (行合計 × 列合計) / 全体合計

【計算】
E = (60 × 40) / 100 = 2400 / 100 = 24

【意味】
「独立ならこの値になるはず」という期待値
問題 37

R²の解釈

R²=0.9の意味は?

解答: yの変動の90%がxで説明される

【解釈】
・当てはまりが非常に良い
・yの変動の90%がモデルで説明できる
・残り10%は他の要因や誤差

【注意】
R²が高くても因果関係があるとは限らない
問題 38

回帰直線の性質

回帰直線が必ず通る点は?

解答: 点(x̄, ȳ)(データの重心)

【理由】
切片の公式: a = ȳ – bx̄
これを回帰直線に代入すると:
y = a + bx = (ȳ – bx̄) + bx
x = x̄ のとき: y = ȳ

→ 点(x̄, ȳ)を必ず通る
問題 39

カイ二乗検定の条件

カイ二乗検定を適用する条件は?

解答: 各セルの期待度数が5以上

【条件】
すべてのセルで E ≥ 5

【満たさない場合の対策】
・カテゴリを統合
・フィッシャーの正確検定を使用
・2×2表ならイエーツの補正
問題 40

総合問題

回帰分析で高いR²が得られた。因果関係があるといえるか?

解答: いえない

【理由】
R²が高い = 相関関係が強い
相関関係 ≠ 因果関係

【因果関係がいえない理由】
・交絡因子の可能性
・逆の因果の可能性
・偶然の相関の可能性

【因果関係を主張するには】
・無作為化比較試験
・時間的先行性
・もっともらしいメカニズム

📋 分野別チェックリスト

確率分布(問題1-10)
□ 二項分布の計算ができる
□ ポアソン分布の計算ができる
□ 正規分布の標準化ができる
□ 中心極限定理を理解している
□ t分布のパーセント点が読める
推定(問題11-20)
□ 母平均の信頼区間(σ既知・未知)
□ 母比率の信頼区間
□ 必要標本サイズの計算
□ 信頼区間の正しい解釈
□ 信頼係数と幅の関係
検定(問題21-30)
□ z検定・t検定の計算
□ 母比率の検定
□ F検定(等分散性)
□ 2標本t検定・対標本t検定
□ p値の解釈
回帰・カイ二乗(問題31-40)
□ 回帰係数の計算
□ 決定係数R²の解釈
□ 残差の計算
□ 適合度検定・独立性検定
□ 期待度数の計算

📚 このステップのまとめ

🎯 分野別の重要ポイント

  • 確率分布: 二項・ポアソン・正規分布の計算、中心極限定理
  • 推定: 信頼区間の計算、標本サイズの決定
  • 検定: z検定・t検定・F検定・2標本検定
  • 回帰・カイ二乗: 回帰係数、R²、適合度検定、独立性の検定
💡 次のステップへ進む前に
練習問題で32問以上(80%以上)正解できたら、模擬試験に進みましょう!

時間配分の目安: 1問あたり約2〜3分
弱点分野は該当するSTEPに戻って復習しましょう!
📝

学習メモ

統計検定2級対策 - Step 14

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE