📊 STEP 17: 仮説検定の実務での使い方

統計的な根拠を持ってビジネス判断をしよう

📋 このステップで学ぶこと

仮説検定とは何か
帰無仮説と対立仮説の考え方
p値の意味と正しい解釈
有意水準（α=0.05）の決め方
実務での判断基準とビジネス応用

学習時間の目安：3時間

🔍 1. 仮説検定とは

基本的な考え方

📌 仮説検定とは

「たまたまなのか、本当に差があるのか」を統計的に判断する方法

ビジネスでの疑問：
・新しい広告は、本当に効果があるのか？
・AプランとBプラン、どちらが売上が高いのか？
・今月の売上増加は、たまたま？それとも施策の効果？
・男性と女性で、購入率に差はあるのか？

仮説検定でできること：
これらの疑問に対して、「偶然ではない」という統計的な根拠を示せます！

具体例で理解する

💡 わかりやすい例：コイン投げ

状況：
コインを10回投げたら、表が8回出ました。
このコインは不正ですか？（表が出やすく細工されている？）

2つの可能性：
1. 偶然：正常なコインでも、たまたま表が多く出た
2. 不正：本当に表が出やすいコイン

仮説検定の役割：
「偶然でこうなる確率」を計算する
→ もし確率が非常に低いなら、「不正」と判断
→ もし確率がそれなりにあるなら、「偶然」と判断

計算結果：
正常なコインで10回中8回以上表が出る確率 = 約5.5%
→ 5%より少し高い → 「偶然」と判断（不正とは言えない）

【仮説検定の全体像】

ビジネスの疑問
    ↓
「本当に差があるのか？」
    ↓
仮説を設定
    ↓
データを収集・分析
    ↓
p値を計算
    ↓
判定（有意水準と比較）
    ↓
結論を出す

📝 2. 帰無仮説と対立仮説

2つの仮説

📌 帰無仮説（H₀）と対立仮説（H₁）

仮説検定では、2つの仮説を設定します

帰無仮説（H₀、Null Hypothesis）：
・「差がない」「効果がない」という仮説
・否定したい仮説
・「つまらない仮説」とも呼ばれる

対立仮説（H₁、Alternative Hypothesis）：
・「差がある」「効果がある」という仮説
・証明したい仮説
・研究者が信じている仮説

仮説検定の目的：
帰無仮説（H₀）を棄却して、対立仮説（H₁）を採択する

ビジネス例での仮説設定

💡 例1：新しい広告の効果

状況：新しい広告を導入したら、売上が増えた

帰無仮説（H₀）：
「新しい広告は、売上に影響しない」
（売上の増加は、偶然）

対立仮説（H₁）：
「新しい広告は、売上を増加させる」
（売上の増加は、広告の効果）

検定の結果：
もしH₀を棄却できたら → 「広告の効果があった！」と結論

💡 例2：男女の購入率の差

状況：男性の購入率30%、女性の購入率40%

帰無仮説（H₀）：
「男性と女性で、購入率に差はない」
（10%の差は、偶然）

対立仮説（H₁）：
「男性と女性で、購入率に差がある」
（10%の差は、本物）

検定の結果：
もしH₀を棄却できたら → 「男女で購入行動が異なる！」と結論

なぜ「差がない」を仮定するのか

💡 帰無仮説を「差がない」とする理由

これは「無罪推定の原則」と同じ考え方です。

法律の場合：
・被告は「無罪」と仮定
・証拠が十分なら、「有罪」と判断
・証拠が不十分なら、「無罪」のまま

仮説検定の場合：
・まず「差がない」と仮定（帰無仮説）
・データの証拠が十分なら、「差がある」と判断
・証拠が不十分なら、「差がない」のまま

重要：
「H₀を棄却できない」≠「H₀が正しい」
→ 単に「証拠が不十分」というだけ！

🔢 3. p値の意味

p値とは

📌 p値（p-value）の定義

「帰無仮説が正しいと仮定した場合に、今回のデータ（またはそれ以上に極端なデータ）が得られる確率」

わかりやすく言うと：
「偶然でこうなる確率」

p値の読み方：
・p値が小さい → 「偶然では起きにくい」→ 帰無仮説を棄却
・p値が大きい → 「偶然で起きうる」→ 帰無仮説を棄却できない

p値の具体例

p値	解釈	判断（α=0.05の場合）
0.001（0.1%）	偶然でこうなる確率は0.1%	✓ 帰無仮説を棄却
0.03（3%）	偶然でこうなる確率は3%	✓ 帰無仮説を棄却
0.15（15%）	偶然でこうなる確率は15%	✗ 棄却できない
0.50（50%）	偶然でこうなる確率は50%	✗ 棄却できない

p値のよくある誤解

⚠️ p値についての誤解

✗ 間違った解釈：

「p値 = 帰無仮説が正しい確率」→ 間違い！
「p値 = 対立仮説が正しい確率」→ 間違い！
「p値が小さいほど、効果が大きい」→ 間違い！

✓ 正しい解釈：

p値は、「偶然でこうなる確率」であって、「仮説が正しい確率」ではありません！

また、p値は効果の大きさを示すものでもありません。サンプルサイズが大きいと、小さな差でもp値は小さくなります。

🎯 4. 有意水準（α）

有意水準とは

📌 有意水準（α、Significance Level）

「p値がこの値より小さければ、帰無仮説を棄却する」という基準

一般的な有意水準：
・α = 0.05（5%） → 最も一般的
・α = 0.01（1%）→ より厳しい基準
・α = 0.10（10%）→ より緩い基準

判定ルール：
・p < α → 統計的に有意 → 帰無仮説を棄却
・p ≥ α → 統計的に有意でない → 帰無仮説を棄却できない

有意水準の意味

💡 α = 0.05 の意味

「5%の確率で間違っても良い」という基準

具体的には：
帰無仮説が本当は正しいのに、誤って棄却してしまう確率を5%以下に抑える

別の言い方：
100回検定したら、5回は間違うことを許容
（本当は差がないのに、「差がある」と判断してしまう）

なぜ5%なのか：
・絶対的な根拠はない
・統計学の慣習として定着
・「厳しすぎず、緩すぎず」のバランス

有意水準の選び方

状況	有意水準	理由
新薬の効果検証	α = 0.01	誤判断のリスクが極めて大きい
一般的なビジネス判断	α = 0.05	標準的なバランス
探索的な分析	α = 0.10	多少の誤判断は許容できる

⚖️ 5. 2つの間違い

第1種の過誤と第2種の過誤

📌 仮説検定で起きうる2つの間違い

仮説検定は完璧ではありません。2種類の間違いが起きる可能性があります。

	H₀が実は正しい	H₁が実は正しい
H₀を棄却	第1種の過誤（α）誤って効果ありと判断	✓ 正しい判断
H₀を棄却しない	✓ 正しい判断	第2種の過誤（β）効果を見逃す

わかりやすい例

💡 火災報知器の例

帰無仮説（H₀）：火事ではない
対立仮説（H₁）：火事だ

第1種の過誤（α）：
火事じゃないのに、警報が鳴る（誤報）
→ 避難の手間、不安

第2種の過誤（β）：
火事なのに、警報が鳴らない
→ 逃げ遅れ、大惨事！

どちらが深刻？
→ 第2種の過誤の方が深刻
→ 火災報知器は「敏感すぎる」くらいが良い

ビジネスでの考え方

💡 第1種と第2種の過誤のバランス

一般的には、第1種の過誤を重視します

理由：
・第1種の過誤（α）は、有意水準でコントロールできる
・第2種の過誤（β）は、コントロールが難しい

第1種を重視すべき場合：
・誤って「効果あり」と判断すると、大きな損失
・例：新薬の承認、大型投資の判断
→ 有意水準を厳しく（α = 0.01）

第2種を重視すべき場合：
・効果を見逃すと、機会損失が大きい
・例：早期発見が重要な病気の検査
→ 有意水準を緩く（α = 0.10）

💻 6. Pythonでの実践

基本的な仮説検定の流れ

# ============================================
# 仮説検定の基本的な流れ
# ============================================
# ビジネスシナリオ：
#   「新しい広告を出した後、売上は本当に増えたのか？」
#   → 単なる偶然の変動かもしれない
#   → 仮説検定で統計的に判断する

import pandas as pd
import numpy as np
from scipy import stats

# ============================================
# サンプルデータ：新しい広告の前後での売上
# ============================================
# 同じ10店舗の広告前後のデータ（対応のあるデータ）
広告前 = [120, 115, 130, 125, 118, 122, 128, 121, 119, 126]  # 単位：万円
広告後 = [135, 142, 138, 145, 140, 136, 144, 139, 141, 143]  # 単位：万円

print(“【データの概要】”)
print(f”広告前の平均売上: {np.mean(広告前):.1f}万円”)
print(f”広告後の平均売上: {np.mean(広告後):.1f}万円”)
print(f”差: {np.mean(広告後) – np.mean(広告前):.1f}万円”)

# ============================================
# 仮説の設定
# ============================================
# 帰無仮説（H₀）: 証明したいことの「逆」
# 対立仮説（H₁）: 証明したいこと
print(“\n【仮説の設定】”)
print(“帰無仮説(H₀)：広告は売上に影響しない（平均に差がない）”)
print(“対立仮説(H₁)：広告は売上を増加させる（平均に差がある）”)

# ============================================
# stats.ttest_rel(): 対応のあるt検定
# ============================================
# なぜttest_relを使うか？
#   → 同じ店舗の「前」と「後」を比較（対応のあるデータ）
#   → _rel = related（関連のある）の略
#
# もし別々のグループを比較するなら → ttest_ind（独立）
#
# 戻り値:
#   t_stat: t統計量（差の大きさを標準化した値）
#   p_value: p値（この差が偶然である確率）
t_stat, p_value = stats.ttest_rel(広告後, 広告前)

print(“\n【検定結果】”)
print(f”t統計量: {t_stat:.4f}（大きいほど差が顕著）”)
print(f”p値: {p_value:.4f}（この差が偶然である確率）”)

# ============================================
# 判定（有意水準α=0.05）
# ============================================
# 有意水準α: 「偶然と判断する確率の閾値」
#   → α=0.05が一般的（5%）
#   → p < α なら「偶然ではない」と判断
alpha = 0.05

print(f"\n【判定】（有意水準α={alpha}）")
if p_value < alpha:
    print(f"p値({p_value:.4f}) < α({alpha})")
    print("→ 帰無仮説を棄却")
    print("→ 広告の効果あり！（統計的に有意）")
else:
    print(f"p値({p_value:.4f}) ≥ α({alpha})")
    print("→ 帰無仮説を棄却できない")
    print("→ 広告の効果があるとは言えない")

# 出力例【データの概要】広告前の平均売上: 122.4万円広告後の平均売上: 140.3万円差: 17.9万円【仮説の設定】帰無仮説(H₀)：広告は売上に影響しない（平均に差がない）対立仮説(H₁)：広告は売上を増加させる（平均に差がある）【検定結果】 t統計量: 12.2541（大きいほど差が顕著） p値: 0.0000（この差が偶然である確率）【判定】（有意水準α=0.05） p値(0.0000) < α(0.05) → 帰無仮説を棄却 → 広告の効果あり！（統計的に有意）

仮説検定の関数化

# ============================================
# 仮説検定を関数化（再利用しやすく）
# ============================================
# なぜ関数化するか？
#   → 同じ検定を何度も実行する場合に便利
#   → コードの重複を避けられる
#   → 結果を統一フォーマットで出力

def hypothesis_test(data1, data2, alpha=0.05, paired=False, name1=”グループ1″, name2=”グループ2″):
    “””
    仮説検定を実行し、結果を出力する関数
    
    Parameters:
    ———–
    data1, data2: 比較するデータ（リストまたは配列）
    alpha: 有意水準（デフォルト0.05）
    paired: 対応のある検定かどうか
        True: 同じ対象の前後比較（ttest_rel）
        False: 異なるグループの比較（ttest_ind）
    name1, name2: グループの名前（表示用）
    
    Returns:
    ——–
    dict: t統計量、p値、有意かどうかを含む辞書
    “””
    print(“=” * 50)
    print(“仮説検定レポート”)
    print(“=” * 50)
    
    # データの概要
    print(f”\n【データの概要】”)
    print(f”{name1}: 平均={np.mean(data1):.2f}, 標準偏差={np.std(data1):.2f}, n={len(data1)}”)
    print(f”{name2}: 平均={np.mean(data2):.2f}, 標準偏差={np.std(data2):.2f}, n={len(data2)}”)
    print(f”平均の差: {np.mean(data2) – np.mean(data1):.2f}”)
    
    # ============================================
    # t検定の選択と実行
    # ============================================
    # paired=True: 対応のあるt検定（同じ対象の前後比較）
    # paired=False: 独立2標本t検定（異なるグループの比較）
    if paired:
        t_stat, p_value = stats.ttest_rel(data2, data1)
        test_type = “対応のあるt検定（paired t-test）”
    else:
        t_stat, p_value = stats.ttest_ind(data2, data1)
        test_type = “独立2標本t検定（independent t-test）”
    
    print(f”\n【検定】{test_type}”)
    print(f”t統計量: {t_stat:.4f}”)
    print(f”p値: {p_value:.4f}”)
    
    # 判定
    print(f”\n【判定】（有意水準α={alpha}）”)
    if p_value < alpha:
        print(f"★ 統計的に有意（p={p_value:.4f} < α={alpha}）")
        print(f"→ {name1}と{name2}に有意な差あり")
    else:
        print(f"☆ 統計的に有意でない（p={p_value:.4f} ≥ α={alpha}）")
        print(f"→ {name1}と{name2}に有意な差があるとは言えない")
    
    return {'t_stat': t_stat, 'p_value': p_value, 'significant': p_value < alpha}

# ============================================
# 使用例
# ============================================
result = hypothesis_test(広告前, 広告後, paired=True, 
                         name1="広告前", name2="広告後")

print(f"\n【結果をプログラムで使う場合】")
print(f"result['significant'] = {result['significant']}")
print(f"→ if文などで判定に使用可能")

📝 STEP 17 のまとめ

✅ このステップで学んだこと

1. 仮説検定の基本

「偶然か、本当の差か」を統計的に判断
帰無仮説（H₀）：差がない（否定したい）
対立仮説（H₁）：差がある（証明したい）

2. p値の意味

「偶然でこうなる確率」
効果の大きさを示すものではない

3. 有意水準（α）

判定の基準（通常0.05）
p < α なら帰無仮説を棄却

4. 2つの間違い

第1種の過誤（α）：誤って効果ありと判断
第2種の過誤（β）：効果を見逃す

💡 最も大切なポイント

仮説検定は、ビジネス判断に統計的な根拠を与えてくれます！

判定の流れ：

帰無仮説（H₀）と対立仮説（H₁）を設定
データから検定統計量とp値を計算
p値と有意水準（α）を比較
p < α なら、H₀を棄却 → 「効果あり」
p ≥ α なら、H₀を棄却できない → 「効果があるとは言えない」

注意点：
・p値は「効果の大きさ」ではない
・「統計的に有意」≠「実務的に重要」
・サンプルサイズが大きいと、小さな差でも有意になる

次のSTEP 18では、t検定の実践（ExcelとPython）を学びます！

🎯 次のステップの予告

STEP 18では、「t検定の実践（ExcelとPython）」を学びます。実際のデータで仮説検定を行う方法を習得しましょう！

📝 練習問題

問題 1 基礎

次のビジネス状況で、帰無仮説（H₀）と対立仮説（H₁）を設定してください。

状況：新しい価格設定を導入したら、売上が増えた。
この売上増加は、価格設定の効果なのか、偶然なのかを検証したい。

【解答】

帰無仮説（H₀）：

「新しい価格設定は、売上に影響しない」
（売上の増加は、偶然）

対立仮説（H₁）：

「新しい価格設定は、売上を増加させる」
（売上の増加は、価格設定の効果）

検定の目的：
帰無仮説（H₀）を棄却して、「価格設定の変更が、売上増加の原因である」ことを統計的に示す

問題 2 基礎

p値について、以下の問いに答えてください。

(1) p値とは何ですか？
(2) p = 0.03 の場合、α = 0.05 でどう判断しますか？

【解答】

(1) p値とは：

「帰無仮説が正しいと仮定した場合に、今回のデータ（またはそれ以上に極端なデータ）が得られる確率」

わかりやすく言うと：「偶然でこうなる確率」

(2) p = 0.03 の判断：

p値（0.03）< 有意水準α（0.05）

→ 帰無仮説を棄却
→ 「統計的に有意」と判断
→ 「偶然ではなく、本当に差がある」と結論

問題 3 応用

以下の検定結果を解釈してください。

検定：新しいWebデザインの効果検証
帰無仮説：デザインは滞在時間に影響しない
対立仮説：デザインは滞在時間を増加させる
p値：0.12
有意水準：α = 0.05

この結果から、何が言えますか？

【解答】

判定：

p値（0.12）≥ α（0.05）
→ 帰無仮説を棄却できない

結論：

「新しいWebデザインが、滞在時間を増加させる」とは統計的に言えない

解釈：

偶然で12%の確率で、このような結果が得られる
5%基準では、「偶然とは言えない」とは判断できない
デザインの効果がない、とは言えない（証拠が不十分なだけ）

ビジネス判断：
・サンプルサイズを増やして、再検証
・デザインの改善余地を探る
・他の指標（CVR、離脱率など）も確認

問題 4 応用

第1種の過誤と第2種の過誤について説明してください。また、ビジネスでどちらを重視すべきか、例を挙げて説明してください。

【解答】

第1種の過誤（α）：

帰無仮説が正しいのに、誤って棄却してしまう
→ 「本当は効果がないのに、効果ありと判断」

第2種の過誤（β）：

対立仮説が正しいのに、帰無仮説を棄却できない
→ 「本当は効果があるのに、効果を見逃す」

ビジネスでの例：

第1種を重視すべき場合：
・新薬の承認（誤って承認すると健康被害）
・大型投資の判断（誤って投資すると大損失）
→ 有意水準を厳しく（α = 0.01）

第2種を重視すべき場合：
・がん検診（見逃すと命に関わる）
・不正検知（見逃すと被害拡大）
→ 有意水準を緩く（α = 0.10）

問題 5 実践

以下の2つのケースで、どちらのp値の方が「効果が大きい」と言えますか？

ケースA：p = 0.001、平均の差 = 1万円
ケースB：p = 0.03、平均の差 = 10万円

また、p値と効果の大きさの関係について説明してください。

【解答】

どちらの効果が大きいか：

ケースBの方が、効果が大きい（差が10万円）

p値との関係：

ケースA：
・p値 = 0.001（非常に小さい）
・差 = 1万円
・「統計的には非常に確実だが、実務的な効果は小さい」

ケースB：
・p値 = 0.03（やや小さい）
・差 = 10万円
・「統計的にはやや確実、実務的な効果は大きい」

重要なポイント：

p値は「効果の大きさ」を示すものではない！

p値が示すのは「統計的な確実性」であり、効果の大きさを示すのは平均の差や効果サイズです。

サンプルサイズが大きいと、小さな差でもp値は非常に小さくなるため、p値だけでなく効果の大きさも必ず確認しましょう。

❓ よくある質問

Q1: p値が0.051の場合、どう判断すべきですか？

有意水準α=0.05の場合、統計的には「有意でない」と判断します。

統計的判断：
p = 0.051 > α = 0.05
→ 帰無仮説を棄却できない

ただし：
・p値が0.05に非常に近い
・「ギリギリ有意でない」という状況

ビジネス判断：
・サンプルサイズを増やして、再検証を検討
・効果の大きさも確認
・他の証拠（定性的な情報など）も総合的に判断

重要：
p=0.049とp=0.051で、本質的な違いはありません。0.05という閾値は、あくまで慣習であることを忘れずに！

Q2: 「帰無仮説を棄却できない」= 「差がない」ということですか？

いいえ、違います！

帰無仮説を棄却できない ≠ 帰無仮説が正しい

正しい解釈：
「差があることを示す証拠が不十分」というだけ

例：
裁判で「無罪」判決 ≠ 「犯罪を犯していない」
→ 単に「有罪を示す証拠が不十分」

ビジネスでの対応：
・サンプルサイズを増やして、再検証
・より精密な測定方法を検討
・効果が本当に小さい可能性も考慮

重要：
「証拠がない」≠「存在しない」

Q3: サンプルサイズが大きいと、どんな影響がありますか？

サンプルサイズが大きいと、小さな差でも統計的に有意になりやすい。

例：
サンプルサイズ = 20
・平均の差 = 10万円
・p値 = 0.08（有意でない）

サンプルサイズ = 1000
・平均の差 = 1万円
・p値 = 0.001（非常に有意！）

問題点：
サンプルサイズが大きいと、実務的には意味のない小さな差でも、統計的に有意になってしまう！

対処法：
・p値だけでなく、効果の大きさも確認
・ビジネス的に意味のある差かを判断
・信頼区間を確認して、差の大きさの範囲を把握

Q4: 有意水準を検定後に変更しても良いですか？

いいえ、検定後に有意水準を変更するのはNGです！

悪い例：
・α = 0.05 で検定 → p = 0.08
・「有意にならなかった…」
・「じゃあα = 0.10にしよう！」
→ これはダメ！

なぜダメか：
・結果を見てから基準を変えるのは、不正
・「p-hacking」と呼ばれる悪質な行為
・都合の良い結果を作り出してしまう

正しい手順：
1. 検定前に有意水準を決める
2. データを収集
3. 検定を実行
4. 事前に決めた基準で判定

重要：
有意水準は、データを見る前に設定する！

Q5: 「両側検定」と「片側検定」の違いは何ですか？

対立仮説の設定の仕方の違いです。

両側検定（Two-tailed test）：
・対立仮説：「差がある」（どちらの方向でも）
・例：H₁ : μ₁ ≠ μ₂
・使用例：「AとBで差があるか」

片側検定（One-tailed test）：
・対立仮説：「Aの方が大きい」または「Aの方が小さい」
・例：H₁ : μ₁ > μ₂
・使用例：「Aの方がBより効果が高いか」

選び方：
・一般的には両側検定を使う
・方向が明確にわかっている場合のみ、片側検定

注意：
・片側検定の方が、p値は小さくなる
・都合よく片側検定を選ぶのはNG

Q6: 仮説検定はExcelでもできますか？

はい、Excelでも基本的な仮説検定ができます。

Excelでできる検定：
・t検定（「分析ツール」アドイン）
・z検定
・F検定
・カイ二乗検定

Excel関数：
・T.TEST関数：t検定のp値を計算
・CHITEST関数：カイ二乗検定のp値を計算

注意点：
・分析ツールアドインの有効化が必要
・複雑な検定には限界がある

推奨：
基本的な検定はExcelでOK。複雑な分析はPythonを使うと便利です。次のSTEP 18で詳しく学びます！

📝

学習メモ

ビジネスデータ分析・意思決定 - Step 17

📋 過去のメモ一覧 ▼

📊 STEP 17: 仮説検定の実務での使い方

📋 このステップで学ぶこと

🔍 1. 仮説検定とは

基本的な考え方

具体例で理解する

📝 2. 帰無仮説と対立仮説

2つの仮説

ビジネス例での仮説設定

なぜ「差がない」を仮定するのか

🔢 3. p値の意味

p値とは

p値の具体例

p値のよくある誤解

🎯 4. 有意水準（α）

有意水準とは

有意水準の意味

有意水準の選び方

⚖️ 5. 2つの間違い

第1種の過誤と第2種の過誤

わかりやすい例

ビジネスでの考え方

💻 6. Pythonでの実践

基本的な仮説検定の流れ

仮説検定の関数化

📝 STEP 17 のまとめ

📝 練習問題

次のビジネス状況で、帰無仮説（H₀）と対立仮説（H₁）を設定してください。 状況：新しい価格設定を導入したら、売上が増えた。 この売上増加は、価格設定の効果なのか、偶然なのかを検証したい。

p値について、以下の問いに答えてください。 (1) p値とは何ですか？ (2) p = 0.03 の場合、α = 0.05 でどう判断しますか？

第1種の過誤と第2種の過誤について説明してください。また、ビジネスでどちらを重視すべきか、例を挙げて説明してください。

以下の2つのケースで、どちらのp値の方が「効果が大きい」と言えますか？ ケースA：p = 0.001、平均の差 = 1万円 ケースB：p = 0.03、平均の差 = 10万円 また、p値と効果の大きさの関係について説明してください。

❓ よくある質問

学習メモ

次のビジネス状況で、帰無仮説（H₀）と対立仮説（H₁）を設定してください。

状況：新しい価格設定を導入したら、売上が増えた。
この売上増加は、価格設定の効果なのか、偶然なのかを検証したい。

p値について、以下の問いに答えてください。

(1) p値とは何ですか？
(2) p = 0.03 の場合、α = 0.05 でどう判断しますか？

以下の2つのケースで、どちらのp値の方が「効果が大きい」と言えますか？

ケースA：p = 0.001、平均の差 = 1万円
ケースB：p = 0.03、平均の差 = 10万円

また、p値と効果の大きさの関係について説明してください。