📚 STEP 1: 3級内容の完全理解
統計学3級レベルの全範囲を復習し、2級学習の強固な土台を築こう
📖 このステップで学ぶこと
統計学2級レベルを目指すには、3級の内容を完璧に理解していることが絶対条件です。このステップでは、3級の全範囲を復習し、計算スピードを向上させ、概念を正確に理解します。このステップをしっかりクリアすることで、2級の学習がスムーズに進みます。
🎯 到達目標: 3級の全範囲を正確に理解し、計算を素早く正確にでき、概念を他人に説明できるレベルになる
1️⃣ データの整理と要約(3級の復習)
まずは、記述統計の基本を復習しましょう。データを整理し、要約する方法です。
度数分布表とヒストグラム
データを階級(区間)に分けて、各階級のデータ数(度数)をまとめた表
重要ポイント:
• 階級幅は等しくする
• 階級数は5〜15個が目安
• 階級値 = (階級の下限 + 上限) ÷ 2
ヒストグラム
度数分布表を棒グラフで表したもの
• 横軸:階級、縦軸:度数
• 棒と棒の間に隙間がない
階級 度数
60~70 5
70~80 12
80~90 18
90~100 10
階級幅: 10
階級値: 65, 75, 85, 95
【階級幅の求め方】
ステップ1: 1つの階級を確認
60~70という階級を見る
ステップ2: 上限から下限を引く
階級幅 = 70 – 60 = 10
ステップ3: 他の階級も確認(すべて同じ幅であることを確認)
• 70~80: 80 – 70 = 10 ✓
• 80~90: 90 – 80 = 10 ✓
• 90~100: 100 – 90 = 10 ✓
—
【階級値の求め方】
階級値の公式:
階級値 = (下限 + 上限) ÷ 2
各階級の階級値:
• 60~70の階級値 = (60 + 70) ÷ 2 = 130 ÷ 2 = 65
• 70~80の階級値 = (70 + 80) ÷ 2 = 150 ÷ 2 = 75
• 80~90の階級値 = (80 + 90) ÷ 2 = 170 ÷ 2 = 85
• 90~100の階級値 = (90 + 100) ÷ 2 = 190 ÷ 2 = 95
【ポイント】
階級値は「その階級を代表する値」として、平均値などの計算に使います。
代表値(平均値・中央値・最頻値)
すべてのデータの合計 ÷ データ数
記号: x(エックスバー)
• 外れ値の影響を受けやすい
中央値(median)
データを小さい順に並べたときの真ん中の値
• 外れ値の影響を受けにくい
• データ数が偶数の場合は真ん中2つの平均
最頻値(mode)
最も頻繁に出現する値
• 質的データにも使える
5, 8, 3, 8, 10, 8, 12
平均値: 7.7(小数第2位を四捨五入)
中央値: 8
最頻値: 8
【平均値の計算】
ステップ1: すべてのデータを足す
5 + 8 + 3 + 8 + 10 + 8 + 12 = 54
ステップ2: データの個数を数える
7個
ステップ3: 合計 ÷ 個数
54 ÷ 7 = 7.714… ≒ 7.7
—
【中央値の計算】
ステップ1: データを小さい順に並べ替える
元のデータ: 5, 8, 3, 8, 10, 8, 12
並べ替え後: 3, 5, 8, 8, 8, 10, 12
ステップ2: 真ん中の位置を求める
データ数が7個(奇数)なので、真ん中は (7+1)÷2 = 4番目
ステップ3: 4番目の値を読み取る
3, 5, 8, 8, 8, 10, 12
↑
中央値 = 8
—
【最頻値の計算】
ステップ1: 各値の出現回数を数える
• 3: 1回
• 5: 1回
• 8: 3回 ← 最も多い!
• 10: 1回
• 12: 1回
ステップ2: 最も多く出現する値を答える
最頻値 = 8(3回出現)
【3つの代表値の比較】
このデータでは、平均値(7.7)、中央値(8)、最頻値(8)がほぼ同じ値
→ 外れ値がなく、比較的対称なデータ分布と言える
四分位数と箱ひげ図
データを4等分する3つの値
• 第1四分位数(Q1): 下位25%の位置
• 第2四分位数(Q2): 中央値
• 第3四分位数(Q3): 上位25%の位置
四分位範囲(IQR)
IQR = Q3 – Q1
• データのばらつきを表す
箱ひげ図
5つの数値(最小値、Q1、Q2、Q3、最大値)を箱と線で表したグラフ
3, 5, 7, 8, 10, 12, 15, 18, 20
データ数n = 9
Q1 = 6
Q2 = 10(中央値)
Q3 = 16.5
【四分位数を求める手順】
ステップ1: データが昇順に並んでいることを確認
3, 5, 7, 8, 10, 12, 15, 18, 20 ← すでに昇順 ✓
ステップ2: Q2(中央値)を求める
データ数 = 9個(奇数)
中央の位置 = (9+1)÷2 = 5番目
3, 5, 7, 8, 10, 12, 15, 18, 20
↑
Q2 = 10
ステップ3: 下半分のデータからQ1を求める
中央値より左側のデータ: 3, 5, 7, 8(4個)
4個(偶数)なので、真ん中2つの平均
3, 5, 7, 8
↑ ↑
Q1 = (5 + 7) ÷ 2 = 12 ÷ 2 = 6
ステップ4: 上半分のデータからQ3を求める
中央値より右側のデータ: 12, 15, 18, 20(4個)
4個(偶数)なので、真ん中2つの平均
12, 15, 18, 20
↑ ↑
Q3 = (15 + 18) ÷ 2 = 33 ÷ 2 = 16.5
—
【四分位範囲(IQR)の計算】
IQR = Q3 – Q1 = 16.5 – 6 = 10.5
【箱ひげ図のイメージ】
最小値 Q1 Q2 Q3 最大値
3 6 10 16.5 20
|——[====|====]——|
箱の部分
• 度数分布表: データを階級に分けて整理
• 代表値: 平均値、中央値、最頻値でデータの中心を表す
• 四分位数: データの分布を4分割して理解
• 外れ値がある場合は中央値が有用
2️⃣ データのばらつき(分散・標準偏差)
データがどれくらい散らばっているかを数値で表す方法を復習します。
偏差・分散・標準偏差
各データと平均値との差
偏差 = データの値 – 平均値
分散(variance)
偏差の2乗の平均
s² = Σ(xᵢ – x)² ÷ n
• ばらつきの大きさを表す
• 単位は元のデータの2乗
標準偏差(standard deviation)
分散の平方根
s = √(分散)
• ばらつきを元のデータと同じ単位で表す
• 標準偏差が大きい = ばらつきが大きい
2, 4, 6, 8, 10
平均値: 6
分散: 8
標準偏差: 2.83(小数第3位を四捨五入)
【分散を求める5ステップ】
ステップ1: 平均値を計算
平均値 = (2 + 4 + 6 + 8 + 10) ÷ 5
= 30 ÷ 5
= 6
ステップ2: 各データの偏差を計算(データ – 平均)
| データ | 偏差(データ – 6) |
|——–|——————-|
| 2 | 2 – 6 = -4 |
| 4 | 4 – 6 = -2 |
| 6 | 6 – 6 = 0 |
| 8 | 8 – 6 = 2 |
| 10 | 10 – 6 = 4 |
【確認】偏差の合計は必ず0になる
(-4) + (-2) + 0 + 2 + 4 = 0 ✓
ステップ3: 偏差を2乗する
| データ | 偏差 | 偏差² |
|——–|——|——-|
| 2 | -4 | (-4)² = 16 |
| 4 | -2 | (-2)² = 4 |
| 6 | 0 | 0² = 0 |
| 8 | 2 | 2² = 4 |
| 10 | 4 | 4² = 16 |
ステップ4: 偏差の2乗の合計を求める
16 + 4 + 0 + 4 + 16 = 40
ステップ5: データ数で割る(分散)
分散 = 40 ÷ 5 = 8
—
【標準偏差の計算】
標準偏差 = √(分散) = √8 = 2.828… ≒ 2.83
【計算の意味】
• 分散 = 8(単位はcm²など2乗の単位)
• 標準偏差 = 2.83(元の単位に戻る)
→ 「データは平均から約2.83離れている」と解釈できる
変動係数
CV = (標準偏差 ÷ 平均値) × 100
使い方:
• 単位が異なるデータのばらつきを比較できる
• 平均値に対する相対的なばらつきを表す
• CVが大きい = ばらつきが大きい
B組の平均体重は50kg、標準偏差は6kg。
どちらのばらつきが大きいか、変動係数を使って判断しなさい。
【なぜ変動係数を使うのか?】
標準偏差だけで比較すると:
• A組の身長: 標準偏差 = 8cm
• B組の体重: 標準偏差 = 6kg
→ 単位が違う(cmとkg)ので直接比較できない!
→ 変動係数を使えば単位なしの数値になり比較可能
—
【A組(身長)の変動係数】
ステップ1: 公式を確認
CV = (標準偏差 ÷ 平均値) × 100
ステップ2: 数値を代入
CV = (8 ÷ 160) × 100
= 0.05 × 100
= 5%
—
【B組(体重)の変動係数】
ステップ1: 公式を確認
CV = (標準偏差 ÷ 平均値) × 100
ステップ2: 数値を代入
CV = (6 ÷ 50) × 100
= 0.12 × 100
= 12%
—
【比較と結論】
• A組(身長)のCV = 5%
• B組(体重)のCV = 12%
12% > 5% なので、
B組の体重の方が相対的にばらつきが大きい
【解釈】
• A組の身長は、平均に対して5%程度のばらつき
• B組の体重は、平均に対して12%程度のばらつき
→ 平均値の大きさを考慮すると、B組の方がばらついている
• 分散: 偏差の2乗の平均(単位が2乗)
• 標準偏差: 分散の平方根(元の単位)
• 変動係数: 単位が違うデータのばらつきを比較
• 標準偏差が大きい = データが平均から離れている
3️⃣ 相関関係
2つのデータの関係性を数値で表す相関係数を復習します。
散布図と相関
2つのデータの関係を点で表したグラフ
横軸:一方の変数、縦軸:もう一方の変数
相関の種類:
• 正の相関: 一方が増えると、もう一方も増える
• 負の相関: 一方が増えると、もう一方が減る
• 無相関: 明確な関係が見られない
相関係数
2つのデータの直線的な関係の強さを表す数値
範囲:
-1 ≦ r ≦ 1
解釈:
• r = 1: 完全な正の相関
• r = 0.7〜0.9: 強い正の相関
• r = 0.4〜0.6: 中程度の正の相関
• r = 0〜0.3: 弱い正の相関
• r = 0: 無相関
• r = -0.3〜0: 弱い負の相関
• r = -0.6〜-0.4: 中程度の負の相関
• r = -0.9〜-0.7: 強い負の相関
• r = -1: 完全な負の相関
(1) r = 0.85
(2) r = -0.45
(3) r = 0.12
(1) r = 0.85 → 強い正の相関
(2) r = -0.45 → 中程度の負の相関
(3) r = 0.12 → 弱い正の相関(ほぼ無相関)
【(1) r = 0.85 の判断】
ステップ1: 符号を確認
r = 0.85 > 0 → 正の相関
ステップ2: 絶対値で強さを判断
|r| = 0.85
0.7 ≦ 0.85 ≦ 1.0 の範囲
→ 強い相関
結論: 強い正の相関
→ 一方が増えると、もう一方もかなり増える傾向
—
【(2) r = -0.45 の判断】
ステップ1: 符号を確認
r = -0.45 < 0 → 負の相関
ステップ2: 絶対値で強さを判断
|r| = 0.45
0.4 ≦ 0.45 ≦ 0.6 の範囲
→ 中程度の相関
結論: 中程度の負の相関
→ 一方が増えると、もう一方がやや減る傾向
—
【(3) r = 0.12 の判断】
ステップ1: 符号を確認
r = 0.12 > 0 → 正の相関
ステップ2: 絶対値で強さを判断
|r| = 0.12
0 ≦ 0.12 ≦ 0.3 の範囲
→ 弱い相関(ほぼ無相関に近い)
結論: 弱い正の相関
→ 関係はほとんどないに等しい
【相関係数の目安(まとめ)】
| |r| の範囲 | 相関の強さ |
|———–|———–|
| 0.7〜1.0 | 強い相関 |
| 0.4〜0.7 | 中程度の相関 |
| 0.2〜0.4 | 弱い相関 |
| 0〜0.2 | ほぼ無相関 |
相関と因果関係
相関関係 ≠ 因果関係
• 相関があっても、一方が原因で他方が結果とは限らない
• 第3の変数(交絡因子)が両方に影響している可能性
• 偶然の相関である可能性
例:
アイスクリームの売上と水難事故の件数には正の相関がある
→ しかし、アイスクリームが水難事故の原因ではない
→ 第3の変数「気温」が両方に影響している
• 散布図: 2つのデータの関係を視覚的に確認
• 相関係数: -1〜1の値で関係の強さを表す
• 正の相関: 一方↑→もう一方↑
• 負の相関: 一方↑→もう一方↓
• 相関 ≠ 因果(相関があっても因果関係があるとは限らない)
4️⃣ 確率の基礎
統計学2級レベルでは確率の知識が必須です。3級の確率をしっかり復習しましょう。
確率の定義
ある事象が起こる可能性を数値で表したもの
確率 = (事象Aが起こる場合の数) ÷ (すべての場合の数)
記号: P(A)(確率probability)
性質:
• 0 ≦ P(A) ≦ 1
• P(A) = 0: 絶対に起こらない
• P(A) = 1: 必ず起こる
• すべての事象の確率の合計 = 1
【確率を求める3ステップ】
ステップ1: 「すべての場合」を数える
サイコロの目: 1, 2, 3, 4, 5, 6
すべての場合 = 6通り
ステップ2: 「条件を満たす場合」を数える
偶数の目: 2, 4, 6
偶数が出る場合 = 3通り
ステップ3: 確率の公式に代入
P(偶数) = 条件を満たす場合 ÷ すべての場合
= 3 ÷ 6
= 1/2 = 0.5
【解釈】
サイコロを1回振ると、50%の確率(2回に1回)で偶数が出る
和の法則と積の法則
事象Aまたは事象Bが起こる確率
排反(どちらか一方しか起こらない)の場合:
P(AまたはB) = P(A) + P(B)
積の法則(かつ)
事象Aと事象Bが両方とも起こる確率
独立(一方の結果が他方に影響しない)の場合:
P(AかつB) = P(A) × P(B)
(1) サイコロを振って、1または6が出る確率
(2) コインを2回投げて、両方とも表が出る確率
(1) P(1または6) = 1/3
(2) P(表かつ表) = 1/4
【(1) 1または6が出る確率】
なぜ「和の法則」を使うのか?
• 「1が出る」と「6が出る」は同時に起こらない(排反)
• 「または」なので確率を足す
ステップ1: それぞれの確率を求める
P(1が出る) = 1/6
P(6が出る) = 1/6
ステップ2: 和の法則で足す
P(1または6) = P(1) + P(6)
= 1/6 + 1/6
= 2/6
= 1/3
—
【(2) 両方とも表が出る確率】
なぜ「積の法則」を使うのか?
• 1回目と2回目は独立(1回目の結果は2回目に影響しない)
• 「かつ」なので確率を掛ける
ステップ1: それぞれの確率を求める
P(1回目が表) = 1/2
P(2回目が表) = 1/2
ステップ2: 積の法則で掛ける
P(両方とも表) = P(1回目表) × P(2回目表)
= 1/2 × 1/2
= 1/4
【確認】樹形図で考える
1回目 2回目 結果
表 ───→ 表表 ← これ!
表 ─┤
裏 ───→ 表裏
─┤
表 ───→ 裏表
裏 ─┤
裏 ───→ 裏裏
4通りのうち「表表」は1通り → 1/4 ✓
条件付き確率(基礎)
ある条件のもとで、別の事象が起こる確率
記号: P(B|A)
意味: 「Aが起こったという条件のもとで、Bが起こる確率」
公式:
P(B|A) = P(A∩B) ÷ P(A)
※2級でさらに詳しく学習します
• 確率: 0〜1の値で可能性を表す
• 和の法則: 「または」→ 足し算(排反の場合)
• 積の法則: 「かつ」→ 掛け算(独立の場合)
• サイコロ、コイン、カードの問題は確実に解けるように
5️⃣ 確率分布入門(3級レベル)
2級で本格的に学ぶ確率分布の基礎を復習します。
確率変数と確率分布
確率的に決まる値
記号: X, Y など大文字
例: サイコロの目(1〜6のどれかになる)
確率分布(probability distribution)
確率変数がそれぞれの値を取る確率をまとめたもの
• すべての確率の合計 = 1
期待値(平均)
確率変数の平均値
記号: E(X)(expectedの意味)
計算式:
E(X) = x₁×P(X=x₁) + x₂×P(X=x₂) + …
意味: 何回も試行したときの平均値
【期待値を求める手順】
ステップ1: 確率分布を作成
サイコロの目Xと、各目が出る確率P(X)
| X(目)| P(X)(確率)|
|——–|————-|
| 1 | 1/6 |
| 2 | 1/6 |
| 3 | 1/6 |
| 4 | 1/6 |
| 5 | 1/6 |
| 6 | 1/6 |
【確認】確率の合計 = 1/6 × 6 = 1 ✓
ステップ2: 各値に確率を掛ける
| X | P(X) | X × P(X) |
|—|——|———-|
| 1 | 1/6 | 1 × 1/6 = 1/6 |
| 2 | 1/6 | 2 × 1/6 = 2/6 |
| 3 | 1/6 | 3 × 1/6 = 3/6 |
| 4 | 1/6 | 4 × 1/6 = 4/6 |
| 5 | 1/6 | 5 × 1/6 = 5/6 |
| 6 | 1/6 | 6 × 1/6 = 6/6 |
ステップ3: すべて足し合わせる
E(X) = 1/6 + 2/6 + 3/6 + 4/6 + 5/6 + 6/6
= (1+2+3+4+5+6) / 6
= 21 / 6
= 3.5
—
【期待値の意味】
• サイコロを何回も振ると、出た目の平均は3.5に近づく
• 注意: 3.5という目は実際には出ない(1〜6のどれかが出る)
• 「長期的な平均」「理論上の平均」と考える
【簡便な計算方法】
確率がすべて等しい(1/6)なので:
E(X) = (1+2+3+4+5+6) × (1/6)
= 21 × (1/6) = 3.5
正規分布(概要)
左右対称の釣鐘型(ベル型)の分布
特徴:
• 平均値を中心に左右対称
• 平均値 = 中央値 = 最頻値
• 自然界や社会現象で最も多く見られる分布
例:
• 身長、体重
• テストの点数
• 測定誤差
※2級で詳しく学習します
• 確率変数: 確率的に決まる値
• 期待値: 確率変数の平均値
• 正規分布: 釣鐘型の重要な分布
• 2級ではこれらを深く学習します
📝 練習問題(30問)- 3級総合復習テスト
3級の全範囲を網羅した総合問題です。25問以上正解できれば次のステップへ進めます。
度数分布表
階級60~70、70~80、80~90、90~100の度数分布表がある。階級幅はいくらか。
【解き方】
階級幅 = 上限 – 下限
= 70 – 60 = 10
すべての階級で同じ幅(10)になります。
階級値
階級75~85の階級値を求めなさい。
【解き方】
階級値 = (下限 + 上限) ÷ 2
= (75 + 85) ÷ 2
= 160 ÷ 2 = 80
平均値の計算
次のデータの平均値を求めなさい: 4, 7, 9, 10, 15
【解き方】
平均値 = 合計 ÷ データ数
= (4+7+9+10+15) ÷ 5
= 45 ÷ 5 = 9
中央値の計算
次のデータの中央値を求めなさい: 3, 7, 5, 12, 9
【解き方】
ステップ1: 小さい順に並べる
3, 5, 7, 9, 12
ステップ2: 真ん中の値を見つける
5個なので3番目が真ん中
3, 5, 7, 9, 12
中央値 = 7
最頻値
次のデータの最頻値を求めなさい: 2, 5, 5, 8, 5, 10
【解き方】
各値の出現回数を数える:
• 2: 1回
• 5: 3回 ← 最多!
• 8: 1回
• 10: 1回
最頻値 = 5(3回出現)
四分位数
データ: 2, 4, 6, 8, 10, 12, 14
第1四分位数(Q1)を求めなさい。
【解き方】
ステップ1: Q2(中央値)を求める
7個の真ん中 = 4番目 = 8
ステップ2: 下半分のデータを取り出す
2, 4, 6(中央値より左側)
ステップ3: 下半分の中央値 = Q1
2, 4, 6
Q1 = 4
偏差
平均値が20のとき、データ25の偏差はいくらか。
【解き方】
偏差 = データ – 平均値
= 25 – 20 = 5
「平均より5大きい」という意味
分散の計算
データ: 2, 4, 6 の分散を求めなさい。
【解き方】
ステップ1: 平均値 = (2+4+6)÷3 = 4
ステップ2: 各偏差を求める
2-4 = -2、4-4 = 0、6-4 = 2
ステップ3: 偏差を2乗する
(-2)² = 4、0² = 0、2² = 4
ステップ4: 分散を計算
分散 = (4+0+4) ÷ 3 = 8/3 ≒ 2.67
標準偏差
分散が25のとき、標準偏差はいくらか。
【解き方】
標準偏差 = √(分散)
= √25 = 5
変動係数
平均値50、標準偏差10のとき、変動係数は何%か。
【解き方】
変動係数 = (標準偏差 ÷ 平均値) × 100
= (10 ÷ 50) × 100
= 0.2 × 100 = 20%
相関係数の解釈
相関係数r = 0.82 のとき、相関の強さを答えなさい。
【判断方法】
・r = 0.82 > 0 → 正の相関
・|r| = 0.82 は 0.7〜1.0 の範囲 → 強い相関
よって「強い正の相関」
相関係数の範囲
相関係数rの取りうる値の範囲を答えなさい。
【解説】
相関係数は必ず-1から1の間の値を取ります。
• r = -1: 完全な負の相関
• r = 0: 無相関
• r = 1: 完全な正の相関
負の相関
「気温が上がると暖房の使用量が減る」これは何相関か。
【判断方法】
• 気温↑ → 暖房使用量↓
• 一方が増えると、もう一方が減る
→ 負の相関
相関と因果
「相関関係があれば必ず因果関係がある」この文は正しいか。
【解説】
相関関係 ≠ 因果関係
相関があっても、因果関係があるとは限りません。
第3の変数(交絡因子)が両方に影響している可能性があります。
例: アイスの売上↑と水難事故↑は相関あるが、
原因は「気温」という第3の変数
散布図の読み取り
散布図で右上がりの傾向が見られるとき、何相関か。
【判断方法】
• 右上がり = x↑ のとき y↑ = 正の相関
• 右下がり = x↑ のとき y↓ = 負の相関
確率の計算
サイコロを1回振って、3以下の目が出る確率を求めなさい。
【解き方】
3以下の目: 1, 2, 3(3通り)
すべての目: 1, 2, 3, 4, 5, 6(6通り)
確率 = 3÷6 = 1/2
和の法則
カードが1~5まである。1または5を引く確率は?
【解き方】
「1を引く」と「5を引く」は排反(同時に起こらない)
P(1) = 1/5
P(5) = 1/5
P(1または5) = 1/5 + 1/5 = 2/5(和の法則)
積の法則
コインを2回投げて、両方とも裏が出る確率は?
【解き方】
1回目と2回目は独立(互いに影響しない)
P(1回目裏) = 1/2
P(2回目裏) = 1/2
P(両方裏) = 1/2 × 1/2 = 1/4(積の法則)
余事象
サイコロで5以上が出る確率が1/3のとき、4以下が出る確率は?
【解き方】
「5以上」と「4以下」は余事象(合わせて全体)
P(4以下) = 1 – P(5以上)
= 1 – 1/3 = 2/3
確率の範囲
確率Pの取りうる値の範囲を答えなさい。
【解説】
• P = 0: 絶対に起こらない
• P = 1: 必ず起こる
• 確率は必ず0以上1以下
期待値の計算
確率変数Xの確率分布が、P(X=1)=0.3, P(X=2)=0.5, P(X=3)=0.2 のとき、
期待値E(X)を求めなさい。
【解き方】
E(X) = Σ x × P(X=x)
= 1×0.3 + 2×0.5 + 3×0.2
= 0.3 + 1.0 + 0.6
= 1.9
確率の合計
すべての確率の合計はいくつか。
【解説】
確率分布では、すべての確率を足すと必ず1になります。
P(X=x₁) + P(X=x₂) + … = 1
正規分布の特徴
正規分布のグラフの形を答えなさい。
【解説】
正規分布は平均値を中心に左右対称の釣鐘型です。
平均値 = 中央値 = 最頻値 となります。
母集団と標本
日本の成人全員の身長を知りたいとき、1000人を調査した。
母集団と標本をそれぞれ答えなさい。
母集団: 日本の成人全員
標本: 調査した1000人
【解説】
• 母集団: 知りたい対象全体
• 標本: 実際に調べた一部
無作為抽出
無作為抽出の目的は何か。簡潔に答えなさい。
【解説】
無作為に選ぶことで、母集団を正しく代表する標本が得られます。
偏った選び方をすると、正確な推測ができません。
ヒストグラム
ヒストグラムの特徴として正しいものはどれか。
(1) 棒と棒の間に隙間がある
(2) 棒と棒の間に隙間がない
【解説】
• ヒストグラム: 連続的なデータ → 隙間なし
• 棒グラフ: 離散的なデータ → 隙間あり
箱ひげ図
箱ひげ図で「箱」が表すものは何か。
【解説】
• 箱の左端: Q1(第1四分位数)
• 箱の中の線: Q2(中央値)
• 箱の右端: Q3(第3四分位数)
標準偏差の意味
標準偏差が大きいとき、データはどのような状態か。
【解説】
標準偏差はデータのばらつきの大きさを表します。
• 大きい = ばらつき大(平均から離れている)
• 小さい = ばらつき小(平均に近い)
外れ値の影響
平均値と中央値のうち、外れ値の影響を受けにくいのはどちらか。
【解説】
• 中央値: 順序だけで決まる → 外れ値の影響を受けにくい
• 平均値: すべてのデータを使う → 外れ値の影響を大きく受ける
外れ値がある場合は中央値が有用です。
統計的推測
標本から母集団の性質を推測することを何というか。
【解説】
標本調査の結果から、母集団全体の性質を推測することを
統計的推測といいます。2級のメインテーマです。
📚 このステップのまとめ
🎯 復習した内容
- データの整理と要約: 度数分布表、ヒストグラム、代表値、四分位数
- ばらつき: 偏差、分散、標準偏差、変動係数
- 相関関係: 散布図、相関係数、相関≠因果
- 確率の基礎: 確率の定義、和の法則、積の法則
- 確率分布入門: 期待値、正規分布の概要
練習問題で25問以上(83%以上)正解できたら、STEP 2aに進みましょう!
もし点数が低かった場合:
• 統計学3級レベルの内容をもう一度復習
• 特に間違えた分野を重点的に学習
• このステップの問題を繰り返し解く
3級の内容が完璧になってから2級に進むことが、学習の最短ルートです!
学習メモ
統計検定2級対策 - Step 1