🔬 STEP 13: 実験計画法の基礎
無作為化、対照群、交絡因子、バイアスを理解しよう
📖 このステップで学ぶこと
無作為化、対照群と実験群、交絡因子、バイアス、盲検法を学びます。
📝 練習問題: 10問
🎯 到達目標: 無作為化の重要性を説明できる、対照群と実験群の違いがわかる、交絡因子とバイアスを理解する、簡単な実験計画が設計できる
🎯 到達目標: 無作為化の重要性を説明できる、対照群と実験群の違いがわかる、交絡因子とバイアスを理解する、簡単な実験計画が設計できる
1️⃣ 無作為化(ランダム化)
無作為化(Randomization)
被験者を実験群と対照群にランダムに割り付ける
目的:
• 既知の交絡因子を均等に分散
• 未知の交絡因子も均等に分散
• 選択バイアスを防ぐ
• 因果関係の推論を可能にする
被験者を実験群と対照群にランダムに割り付ける
目的:
• 既知の交絡因子を均等に分散
• 未知の交絡因子も均等に分散
• 選択バイアスを防ぐ
• 因果関係の推論を可能にする
例題1: 新薬の効果を調べる実験で、無作為化の有無による違いを説明しなさい。
無作為化がないと因果関係を主張できない
—
【悪い例:無作為化なし】
—
【良い例:無作為化あり】
—
【無作為化の威力】
—
【まとめ】
—
【悪い例:無作為化なし】
医師が患者を振り分ける場合: 「重症の患者には新薬を試したい」 「軽症の患者は対照群でいいだろう」 結果: ・実験群(新薬): 平均的に重症者が多い ・対照群: 平均的に軽症者が多い もし新薬群の方が回復率が低かったら? → 新薬が悪いのか? → もともと重症だったからか? → 区別できない!
—
【良い例:無作為化あり】
コインを投げて振り分ける場合: 表が出た患者 → 実験群(新薬) 裏が出た患者 → 対照群 結果: ・実験群: 重症・軽症が混在(偶然による分布) ・対照群: 重症・軽症が混在(偶然による分布) ・両群の重症度がほぼ均等になる もし新薬群の方が回復率が高かったら? → 重症度の差ではない → 新薬の効果と推論できる!
—
【無作為化の威力】
無作為化すると: ・年齢、性別、重症度などの既知の要因が均等に ・研究者が知らない要因(遺伝、生活習慣など)も均等に ・「偶然」以外に両群の差を説明できなくなる → 結果の差は処置の効果と結論できる
—
【まとめ】
無作為化なし: 結果の差が「処置の効果」か
「もともとの違い」か区別できない
無作為化あり: 結果の差は「処置の効果」と
因果関係を主張できる
💡 無作為化の方法
• 単純ランダム化: くじ引き、乱数表、コンピュータ乱数
• ブロックランダム化: 一定数ごとに両群の人数をバランス
• 層別ランダム化: 性別・年齢などの層内でランダム化
• 単純ランダム化: くじ引き、乱数表、コンピュータ乱数
• ブロックランダム化: 一定数ごとに両群の人数をバランス
• 層別ランダム化: 性別・年齢などの層内でランダム化
⚡ なぜ無作為化が必要か?
無作為化しないと:
• 医師の判断で割り付け → 重症者が片方に偏る
• 患者の希望で割り付け → 意識の高い人が片方に偏る
• 到着順で割り付け → 時系列の要因が混入
→ すべて選択バイアスを生み、因果推論が困難に
無作為化しないと:
• 医師の判断で割り付け → 重症者が片方に偏る
• 患者の希望で割り付け → 意識の高い人が片方に偏る
• 到着順で割り付け → 時系列の要因が混入
→ すべて選択バイアスを生み、因果推論が困難に
2️⃣ 対照群(コントロール群)と実験群
対照群(Control Group)
処置を受けない、または標準的な処置を受ける群
実験群(Treatment Group)
新しい処置を受ける群
対照群の役割:
• 比較の基準を提供
• 自然治癒や時間経過の影響を測定
• プラセボ効果を測定
処置を受けない、または標準的な処置を受ける群
実験群(Treatment Group)
新しい処置を受ける群
対照群の役割:
• 比較の基準を提供
• 自然治癒や時間経過の影響を測定
• プラセボ効果を測定
例題2: 新しい勉強法の効果を調べる実験を設計しなさい。
対照群と実験群を設定し、無作為に割り付ける
—
【ステップ1: 実験の目的を明確にする】
—
【ステップ2: 対象者を集める】
—
【ステップ3: 無作為に割り付ける】
—
【ステップ4: 実験を実施】
—
【ステップ5: 結果を測定・比較】
---
【対照群がない場合の問題】
—
【ステップ1: 実験の目的を明確にする】
目的: 新しい勉強法が従来の勉強法より効果的か? 測定する結果(アウトカム): ・テストの点数 ・学習時間 ・記憶の定着度
—
【ステップ2: 対象者を集める】
対象者: 同じ学校の同学年の生徒100人 注意点: ・学力レベルが極端に偏らないように ・参加への同意を得る
—
【ステップ3: 無作為に割り付ける】
方法: コンピュータで乱数を生成 実験群: 50人 → 新しい勉強法 対照群: 50人 → 従来の勉強法 ※層別ランダム化も可能: ・男女別に25人ずつ無作為割り付け ・これで性別の影響を均等にできる
—
【ステップ4: 実験を実施】
期間: 1ヶ月間 実験群: 新しい勉強法で毎日30分学習 対照群: 従来の勉強法で毎日30分学習 ※学習時間を揃えることで 時間の影響を除去
—
【ステップ5: 結果を測定・比較】
結果(例): 実験群の平均点: 75点 対照群の平均点: 70点 差: 5点 統計的検定: ・t検定で有意差を確認 ・p < 0.05 なら「新しい勉強法は効果的」
---
【対照群がない場合の問題】
もし対照群がなかったら: 「新しい勉強法で平均75点取れた!」 でも... ・何もしなくても75点だったかもしれない ・1ヶ月の学校の授業で上がったかもしれない ・テストが簡単だったかもしれない → 比較対象がないと効果がわからない
対照群の種類
1. プラセボ対照(Placebo Control)
偽薬(見た目は本物と同じだが有効成分なし)を投与
→ プラセボ効果を除去できる
2. 無処置対照(No Treatment Control)
何も処置しない群
→ 自然経過との比較ができる
3. 標準治療対照(Active Control)
既存の標準的な治療を行う群
→ 倫理的に無処置が許されない場合に使用
偽薬(見た目は本物と同じだが有効成分なし)を投与
→ プラセボ効果を除去できる
2. 無処置対照(No Treatment Control)
何も処置しない群
→ 自然経過との比較ができる
3. 標準治療対照(Active Control)
既存の標準的な治療を行う群
→ 倫理的に無処置が許されない場合に使用
⚠️ 対照群がない実験の問題
• 自然治癒との区別ができない
• プラセボ効果との区別ができない
• 時間経過による変化との区別ができない
→ 因果関係を主張できない
• 自然治癒との区別ができない
• プラセボ効果との区別ができない
• 時間経過による変化との区別ができない
→ 因果関係を主張できない
3️⃣ 交絡因子(第3の変数)
交絡因子(Confounding Factor)
説明変数と目的変数の両方に影響を与える第3の変数
交絡因子があると、XとYの関係が歪んで見える
→ 見かけの関係(疑似相関)が生じる
説明変数と目的変数の両方に影響を与える第3の変数
交絡因子があると、XとYの関係が歪んで見える
→ 見かけの関係(疑似相関)が生じる
例題3: 「アイスクリームの売上が多い日は溺死者も多い」という関係について、交絡因子を特定しなさい。
交絡因子は「気温」
---
【観察された関係】
---
【交絡因子を特定する】
---
【交絡因子の構造】
---
【交絡因子を取り除くと】
---
【交絡因子の見分け方】
---
【観察された関係】
データを見ると: ・アイスクリームの売上が多い日 → 溺死者も多い ・アイスクリームの売上が少ない日 → 溺死者も少ない 相関係数を計算すると正の相関がある 素朴な解釈: 「アイスクリームを食べると溺れやすくなる?」 → これは誤り!
---
【交絡因子を特定する】
第3の変数「気温」を考える: 気温が高い日: ・暑いからアイスが売れる ← 気温 → アイス売上 ・暑いから海やプールに行く人が増える ・水辺に人が増えるから溺死者が増える ← 気温 → 溺死 気温が低い日: ・アイスは売れない ・海やプールに行く人が減る ・溺死者も減る
---
【交絡因子の構造】
気温(交絡因子)
↙ ↘
アイス売上 溺死者数
・気温 → アイス売上(直接影響)
・気温 → 溺死者数(直接影響)
・アイス売上 → 溺死者数(因果関係なし!)
アイスと溺死は「見かけの相関」(疑似相関)
---
【交絡因子を取り除くと】
気温を一定にして比較すると: 気温30℃の日だけで分析: ・アイス売上が多い日も少ない日も ・溺死者数は変わらない → アイスと溺死に直接の関係はない
---
【交絡因子の見分け方】
交絡因子の条件: 1. 説明変数(X)に影響を与える 2. 目的変数(Y)に影響を与える 3. XとYの因果経路上にない(中間変数ではない) この例では: ・気温はアイス売上に影響 ✓ ・気温は溺死者数に影響 ✓ ・気温はアイス→溺死の経路上にない ✓ → 気温は交絡因子
交絡因子への対策
💡 交絡因子の制御方法
1. 無作為化(Randomization)
既知・未知の交絡因子を均等に分散
→ 実験研究で最も強力な方法
2. マッチング(Matching)
年齢・性別などを対照群と実験群で揃える
→ 観察研究でよく使われる
3. 層別化(Stratification)
交絡因子ごとに層を作って別々に分析
→ 各層内では交絡因子が一定
4. 統計的調整
重回帰分析などで交絡因子の影響を除去
→ 既知の交絡因子のみ対応可能
1. 無作為化(Randomization)
既知・未知の交絡因子を均等に分散
→ 実験研究で最も強力な方法
2. マッチング(Matching)
年齢・性別などを対照群と実験群で揃える
→ 観察研究でよく使われる
3. 層別化(Stratification)
交絡因子ごとに層を作って別々に分析
→ 各層内では交絡因子が一定
4. 統計的調整
重回帰分析などで交絡因子の影響を除去
→ 既知の交絡因子のみ対応可能
4️⃣ バイアス(偏り)
バイアス(Bias)
系統的な誤差や偏り
主なバイアスの種類:
• 選択バイアス
• 測定バイアス
• 情報バイアス
• 交絡バイアス
系統的な誤差や偏り
主なバイアスの種類:
• 選択バイアス
• 測定バイアス
• 情報バイアス
• 交絡バイアス
例題4: 以下の研究で生じうるバイアスを特定しなさい。
(a) 健康食品の効果を調べるアンケート調査
(b) 医師が新薬の効果を評価する臨床試験
(c) 過去の食習慣を患者に尋ねる疫学調査
(a) 健康食品の効果を調べるアンケート調査
(b) 医師が新薬の効果を評価する臨床試験
(c) 過去の食習慣を患者に尋ねる疫学調査
それぞれ異なるバイアスが生じる
---
【(a) 健康食品のアンケート調査】
---
【(b) 医師が新薬を評価】
---
【(c) 過去の食習慣を尋ねる】
---
【バイアスの種類まとめ】
---
【(a) 健康食品のアンケート調査】
生じるバイアス: 選択バイアス 問題点: ・健康に関心が高い人だけが回答しやすい ・効果を感じた人は積極的に回答 ・効果を感じなかった人は回答しない 結果: ・回答者は「効果あり」に偏る ・効果が過大評価される 対策: ・無作為抽出で対象者を選ぶ ・回答率を上げる工夫 ・非回答者の特性を分析
---
【(b) 医師が新薬を評価】
生じるバイアス: 測定バイアス(観察者バイアス) 問題点: ・医師が「この患者は新薬を使っている」と知っている ・「新薬は効くはずだ」という期待がある ・無意識に症状の改善を高く評価してしまう 結果: ・新薬の効果が過大評価される 対策: ・二重盲検法(医師も患者もどちらか知らない) ・客観的な測定指標を使う(血圧値など)
---
【(c) 過去の食習慣を尋ねる】
生じるバイアス: 情報バイアス(想起バイアス) 問題点: ・病気になった患者は「原因を知りたい」 ・過去の食習慣を詳しく思い出そうとする ・健康な人は詳しく思い出す動機がない 結果: ・患者群で曝露(特定の食品摂取など)が 過大に報告される 対策: ・質問方法を標準化 ・客観的な記録(医療記録など)を使用 ・前向き研究(将来を追跡)に変更
---
【バイアスの種類まとめ】
| バイアス | 発生場面 | 主な対策 |
|---|---|---|
| 選択バイアス | 対象者の選択 | 無作為化、無作為抽出 |
| 測定バイアス | 結果の測定 | 盲検法、客観的指標 |
| 情報バイアス | 情報収集 | 標準化、客観的記録 |
| 交絡バイアス | 分析 | 層別化、統計的調整 |
5️⃣ 盲検法(ブラインド法)
盲検法(Blinding)
実験群か対照群かを知らせない方法
単盲検(Single-Blind)
被験者が知らない
二重盲検(Double-Blind)
被験者も実施者(医師など)も知らない
三重盲検(Triple-Blind)
被験者・実施者・分析者も知らない
実験群か対照群かを知らせない方法
単盲検(Single-Blind)
被験者が知らない
二重盲検(Double-Blind)
被験者も実施者(医師など)も知らない
三重盲検(Triple-Blind)
被験者・実施者・分析者も知らない
例題5: 二重盲検法の臨床試験の流れを説明しなさい。
患者も医師も割り付けを知らない状態で試験を行う
---
【ステップ1: 薬の準備】
---
【ステップ2: 無作為割り付け】
---
【ステップ3: 試験の実施】
---
【ステップ4: 効果の評価】
---
【ステップ5: 開鍵(コード破り)】
---
【二重盲検の効果】
---
【ステップ1: 薬の準備】
新薬とプラセボ(偽薬)を用意: ・見た目が完全に同じ(色、形、大きさ) ・匂いや味も同じにする ・番号だけで区別(A001, A002, ...)
---
【ステップ2: 無作為割り付け】
コンピュータで無作為に割り付け: ・患者ID 001 → 薬番号 A001(新薬) ・患者ID 002 → 薬番号 A002(プラセボ) ・患者ID 003 → 薬番号 A003(新薬) ... 対応表は第三者(データ管理者)だけが保管
---
【ステップ3: 試験の実施】
患者の視点: 「番号がついた薬をもらった」 「本物か偽物かはわからない」 医師の視点: 「番号がついた薬を処方した」 「本物か偽物かはわからない」 → どちらも「盲検」されている状態
---
【ステップ4: 効果の評価】
医師が患者の症状を評価: ・症状スコアを記録 ・副作用を記録 ・客観的検査値を記録 「新薬だから効くはず」という期待がないので 客観的に評価できる
---
【ステップ5: 開鍵(コード破り)】
試験終了後: 1. すべてのデータを収集 2. 対応表を開示 3. 新薬群とプラセボ群のデータを比較 4. 統計解析を実施 開鍵のタイミング: ・すべての患者の追跡が完了してから ・中間解析が必要な場合は独立委員会が判断
---
【二重盲検の効果】
除去できるバイアス: 1. プラセボ効果の除去 患者が「本物だ」と思い込む効果を 両群で均等にする 2. 期待バイアスの除去 医師が「効くはずだ」と思って 評価が甘くなることを防ぐ 3. 意識的・無意識的な偏りの除去 知らなければ偏りようがない
⚡ 盲検法の重要性
プラセボ効果:
「薬だと思うだけ」で症状が改善することがある
→ 真の薬効を測定するには盲検が必須
期待バイアス:
医師が「効くはずだ」と思うと、評価が甘くなる
→ 客観的評価のために盲検が必須
プラセボ効果:
「薬だと思うだけ」で症状が改善することがある
→ 真の薬効を測定するには盲検が必須
期待バイアス:
医師が「効くはずだ」と思うと、評価が甘くなる
→ 客観的評価のために盲検が必須
⚠️ 盲検法が使えない場合
• 手術 vs 薬物療法の比較(見た目で区別できる)
• リハビリや運動療法(偽の運動は困難)
• 心理療法(療法自体が見える)
→ このような場合は、評価者だけでも盲検にする(単盲検)
• 手術 vs 薬物療法の比較(見た目で区別できる)
• リハビリや運動療法(偽の運動は困難)
• 心理療法(療法自体が見える)
→ このような場合は、評価者だけでも盲検にする(単盲検)
📊 良い実験計画のチェックリスト
因果関係を主張するための条件
□ 無作為化されているか?
→ 交絡因子を均等に分散
□ 対照群があるか?
→ 比較の基準を提供
□ 盲検法が適用されているか?
→ プラセボ効果・期待バイアスを除去
□ サンプルサイズは十分か?
→ 検出力を確保
□ 結果は客観的に測定されているか?
→ 測定バイアスを防ぐ
□ 無作為化されているか?
→ 交絡因子を均等に分散
□ 対照群があるか?
→ 比較の基準を提供
□ 盲検法が適用されているか?
→ プラセボ効果・期待バイアスを除去
□ サンプルサイズは十分か?
→ 検出力を確保
□ 結果は客観的に測定されているか?
→ 測定バイアスを防ぐ
📝 練習問題(10問)
このステップの理解度を確認しましょう。8問以上正解できれば次のステップへ進めます。
問題 1
無作為化の目的
無作為化の主な目的は何か?
解答: 交絡因子を均等に分散させる
【解き方】
無作為化により:
・既知の交絡因子(年齢、性別など)が均等に
・未知の交絡因子も均等に分散
→ 因果関係の推論が可能になる
【解き方】
無作為化により:
・既知の交絡因子(年齢、性別など)が均等に
・未知の交絡因子も均等に分散
→ 因果関係の推論が可能になる
問題 2
対照群の役割
対照群が必要な理由は?
解答: 比較の基準を提供するため
【解き方】
対照群がないと:
・自然治癒との区別ができない
・時間経過の影響がわからない
・処置の効果を測定できない
【解き方】
対照群がないと:
・自然治癒との区別ができない
・時間経過の影響がわからない
・処置の効果を測定できない
問題 3
交絡因子とは
交絡因子の定義は?
解答: 説明変数と目的変数の両方に影響を与える第3の変数
【解き方】
交絡因子の条件:
1. Xに影響を与える
2. Yに影響を与える
3. X→Yの経路上にない
→ XとYの関係を歪める
【解き方】
交絡因子の条件:
1. Xに影響を与える
2. Yに影響を与える
3. X→Yの経路上にない
→ XとYの関係を歪める
問題 4
二重盲検
二重盲検法で「知らない」のは誰?
解答: 被験者と実施者(医師など)
【解き方】
単盲検: 被験者のみ知らない
二重盲検: 被験者+実施者が知らない
三重盲検: 被験者+実施者+分析者が知らない
【解き方】
単盲検: 被験者のみ知らない
二重盲検: 被験者+実施者が知らない
三重盲検: 被験者+実施者+分析者が知らない
問題 5
プラセボ効果
プラセボ効果とは何か?
解答: 偽薬でも「薬だと思うだけ」で症状が改善する現象
【解き方】
心理的な効果
・期待や暗示による改善
・真の薬効と区別するために盲検が必要
【解き方】
心理的な効果
・期待や暗示による改善
・真の薬効と区別するために盲検が必要
問題 6
選択バイアス
選択バイアスを防ぐ方法は?
解答: 無作為化(ランダム割り付け)
【解き方】
選択バイアス = 対象者選択の偏り
・医師の判断、患者の希望で割り付けると偏る
・無作為化で意図的な選択を排除
【解き方】
選択バイアス = 対象者選択の偏り
・医師の判断、患者の希望で割り付けると偏る
・無作為化で意図的な選択を排除
問題 7
交絡因子の例
コーヒーと心臓病の関係で、喫煙が交絡因子になる理由は?
解答: 喫煙者はコーヒーをよく飲み、かつ心臓病になりやすいから
【解き方】
喫煙(Z)が両方に影響:
・喫煙 → コーヒー摂取(休憩時に一緒に)
・喫煙 → 心臓病リスク上昇
→ コーヒーと心臓病の見かけの相関が生じる
【解き方】
喫煙(Z)が両方に影響:
・喫煙 → コーヒー摂取(休憩時に一緒に)
・喫煙 → 心臓病リスク上昇
→ コーヒーと心臓病の見かけの相関が生じる
問題 8
実験計画
新しいダイエット法の効果を調べる。対照群には何をさせるべきか?
解答: 従来のダイエット法(または何もしない)
【解き方】
比較のための基準が必要
・無処置対照: 通常の生活を継続
・標準治療対照: 従来のダイエット法
→ 新しい方法の「追加効果」がわかる
【解き方】
比較のための基準が必要
・無処置対照: 通常の生活を継続
・標準治療対照: 従来のダイエット法
→ 新しい方法の「追加効果」がわかる
問題 9
層別ランダム化
層別ランダム化を使う理由は?
解答: 重要な交絡因子(年齢・性別など)を両群で確実に均等にする
【解き方】
単純ランダム化では偶然に偏りが生じる可能性
層別ランダム化:
・まず性別などで層を作る
・層内でランダム化
→ 重要な要因が確実に均等になる
【解き方】
単純ランダム化では偶然に偏りが生じる可能性
層別ランダム化:
・まず性別などで層を作る
・層内でランダム化
→ 重要な要因が確実に均等になる
問題 10
因果推論
観察研究で因果関係を主張しにくい理由は?
解答: 交絡因子や選択バイアスを完全には除去できないため
【解き方】
観察研究の限界:
・無作為化できない(既存のデータを使う)
・未知の交絡因子を制御できない
・選択バイアスが生じやすい
→ 無作為化比較試験(RCT)が因果推論の金字塔
【解き方】
観察研究の限界:
・無作為化できない(既存のデータを使う)
・未知の交絡因子を制御できない
・選択バイアスが生じやすい
→ 無作為化比較試験(RCT)が因果推論の金字塔
⚠️ よくあるつまずきポイントと対策
「相関がある」と「因果関係がある」を混同する
対策: 相関は関連の強さ、因果は原因と結果の関係です。
- 相関関係: XとYが一緒に変動する
- 因果関係: XがYを引き起こす
- 因果の証明には無作為化実験が必要
交絡因子と中間変数を混同する
対策: 因果の経路上にあるかどうかで区別します。
- 交絡因子: X←Z→Y(Zが両方に影響、経路外)
- 中間変数: X→Z→Y(XがZを通じてYに影響、経路上)
- 中間変数を制御すると真の効果が消える
「対照群がない」ことの問題を軽視する
対策: 比較なしに効果は測定できません。
- 「新しい方法で良くなった」→ 何もしなくても良くなったかも
- 「90%が満足」→ 従来法でも90%かもしれない
- 必ず「比較して何%良い」と考える
バイアスの種類を区別できない
対策: どの段階で偏りが生じるかで分類します。
- 選択バイアス: 対象者の選択段階
- 測定バイアス: 結果の測定段階
- 情報バイアス: 情報収集段階
- 交絡バイアス: 分析・解釈段階
📚 このステップのまとめ
🎯 学習したこと
- 無作為化: 交絡因子を均等に分散、因果推論の基礎
- 対照群: 比較の基準を提供、効果測定に必須
- 交絡因子: X・Yの両方に影響する第3の変数
- バイアス: 選択・測定・情報・交絡バイアス
- 盲検法: プラセボ効果・期待バイアスを除去
- 因果推論: 無作為化比較試験(RCT)が理想
💡 次のステップへ進む前に
練習問題で8問以上(80%以上)正解できたら、STEP 14に進みましょう!
実験計画法は因果推論の基礎です。
無作為化の重要性をしっかり理解しましょう!
練習問題で8問以上(80%以上)正解できたら、STEP 14に進みましょう!
実験計画法は因果推論の基礎です。
無作為化の重要性をしっかり理解しましょう!
学習メモ
統計検定2級対策 - Step 13
📋 過去のメモ一覧
▼