Step 4: 多変量確率分布
同時分布、周辺分布、条件付き分布、多変量正規分布、変数変換を習得します
📚 このステップで学ぶこと
実際のデータ分析では、複数の変数を同時に扱うことが多いです。このステップでは、2つ以上の確率変数の同時分布とその性質を学び、変数間の関係性(相関、独立性)を数学的に理解します。
- 現実のデータは複数の変数を持つ:身長と体重、収入と支出、気温と売上など
- 変数間の関係を数学的に表現:「相関がある」を厳密に定義できる
- 回帰分析・多変量解析の基礎:機械学習の理論的背景にもなる
- 次のステップ(大標本理論)への準備:標本平均の分布を理解するために必須
🌉 Step 3からの接続:1変数から多変数へ
| 概念 | 1変数(Step 3) | 多変数(このStep) |
|---|---|---|
| 確率分布 | $f(x)$ | $f(x, y)$ 同時分布 |
| 期待値 | $E(X)$ | $E(X)$, $E(Y)$, $E(XY)$ |
| 分散 | $V(X)$ | $V(X)$, $V(Y)$, $\text{Cov}(X,Y)$ |
| 関係性 | - | 独立性、相関係数 $\rho$ |
1変数の確率分布を理解していれば、多変数への拡張は「次元を増やす」だけです。難しく考えず、「2つの変数を同時に考える」と思ってください。
1. 同時確率分布
1.1 同時確率分布とは?(直感的理解)
例:サイコロを2つ投げる
$X$ = 1つ目の出た目、$Y$ = 2つ目の出た目
「$X = 2$ かつ $Y = 3$」となる確率は?
→ これが同時確率 $P(X = 2, Y = 3)$
例:学生の成績
$X$ = 数学の点数、$Y$ = 英語の点数
「数学が80点以上 かつ 英語も80点以上」の学生の割合は?
→ これも同時確率の考え方
1.2 同時確率関数(離散型)
2つの離散型確率変数 $X$、$Y$ に対して: $$p(x, y) = P(X = x, Y = y)$$
読み方:「$X$ が $x$ であり、かつ $Y$ が $y$ である確率」
性質(確率の公理を満たす):1. $p(x, y) \geq 0$(すべての $x, y$ で非負)
2. $\displaystyle\sum_x \sum_y p(x, y) = 1$(全体の確率の和は1)
例題1:同時確率関数(丁寧な解説)
問題:2つのサイコロを投げる。$X$ = 1つ目の出た目、$Y$ = 2つ目の出た目とする。$P(X = 2, Y = 3)$ を求めよ。
【考え方】
2つのサイコロは独立(1つ目の結果が2つ目に影響しない)なので、
「かつ」は「掛け算」になります。
【計算】 $$P(X = 2, Y = 3) = P(X = 2) \times P(Y = 3) = \frac{1}{6} \times \frac{1}{6} = \frac{1}{36}$$ 【確認】
全ての組み合わせ($6 \times 6 = 36$ 通り)のうち、$(2, 3)$ は1通りなので、$\frac{1}{36}$ は妥当。
1.3 同時確率密度関数(連続型)
2つの連続型確率変数 $X$、$Y$ に対して: $$P(a \leq X \leq b, \ c \leq Y \leq d) = \int_c^d \int_a^b f(x,y) \, dx \, dy$$
読み方:「$X$ が $a$ から $b$ の間にあり、かつ $Y$ が $c$ から $d$ の間にある確率は、その領域での二重積分」
性質:1. $f(x, y) \geq 0$(すべての $x, y$ で非負)
2. $\displaystyle\int_{-\infty}^{\infty}\int_{-\infty}^{\infty} f(x,y) \, dx \, dy = 1$
【イメージ】
1変数:$f(x)$ の曲線の下の面積が確率
2変数:$f(x, y)$ の曲面の下の体積が確率
例題2:同時密度関数の確認(詳細解説)
問題:$f(x, y) = cxy$ ($0 \leq x \leq 1$, $0 \leq y \leq 1$)が確率密度関数となる $c$ を求めよ。
【なぜ $c$ を求めるのか?】
確率密度関数は「全体の積分が1」でなければなりません。
$c$ はそのための調整係数(正規化定数)です。
【計算手順】
ステップ1:全体の積分を計算 $$\int_0^1 \int_0^1 cxy \, dx \, dy = 1$$ ステップ2:$c$ を外に出す(定数なので) $$c \times \int_0^1 \int_0^1 xy \, dx \, dy = 1$$ ステップ3:$x$ と $y$ で分離して計算 $$c \times \int_0^1 x \, dx \times \int_0^1 y \, dy = 1$$ ステップ4:各積分を計算 $$\int_0^1 x \, dx = \left[\frac{x^2}{2}\right]_0^1 = \frac{1}{2}$$ $$\int_0^1 y \, dy = \left[\frac{y^2}{2}\right]_0^1 = \frac{1}{2}$$ ステップ5:$c$ を求める $$c \times \frac{1}{2} \times \frac{1}{2} = 1 \quad \Rightarrow \quad c = 4$$
2. 周辺分布と条件付き分布
2.1 周辺分布とは?(直感的理解)
例:クラスの成績表
| 英語A | 英語B | 英語C | 合計 | |
|---|---|---|---|---|
| 数学A | 5人 | 3人 | 2人 | 10人 |
| 数学B | 4人 | 6人 | 5人 | 15人 |
| 数学C | 1人 | 6人 | 8人 | 15人 |
| 合計 | 10人 | 15人 | 15人 | 40人 |
同時分布:表の中の数字(例:数学Aかつ英語Aは5人)
周辺分布:黄色の「合計」の行と列(表の「周辺」にある!)
周辺分布 = 「もう一方の変数を無視して、片方だけに注目した分布」
読み方:「もう一方の変数について和(または積分)をとることで、片方の変数だけの分布が得られる」
例題3:周辺密度関数の導出(詳細解説)
問題:$f(x, y) = 4xy$ ($0 \leq x \leq 1$, $0 \leq y \leq 1$)のとき、$f_X(x)$ を求めよ。
【何をするのか?】
$X$ だけの分布を知りたい → $Y$ を「消す」(積分で消去)
【計算】 $$f_X(x) = \int_0^1 4xy \, dy$$ $x$ は「$y$ についての積分」では定数なので外に出せる: $$= 4x \times \int_0^1 y \, dy = 4x \times \left[\frac{y^2}{2}\right]_0^1 = 4x \times \frac{1}{2} = 2x$$ よって、$f_X(x) = 2x$ ($0 \leq x \leq 1$)
【確認】 $$\int_0^1 2x \, dx = [x^2]_0^1 = 1 \quad \checkmark \text{(確率の和が1になる)}$$
2.2 条件付き分布とは?(直感的理解)
例:先ほどの成績表で
「数学がAの学生だけを取り出したとき、英語の成績分布はどうなる?」
数学Aの学生10人中:英語A=5人、英語B=3人、英語C=2人
→ $P(\text{英語A} \mid \text{数学A}) = 5/10 = 0.5$
→ $P(\text{英語B} \mid \text{数学A}) = 3/10 = 0.3$
→ $P(\text{英語C} \mid \text{数学A}) = 2/10 = 0.2$
これが条件付き分布!
「ある条件のもとで、もう一方の変数がどう分布するか」
$Y = y$ が与えられたときの $X$ の条件付き密度: $$f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}$$ $X = x$ が与えられたときの $Y$ の条件付き密度: $$f_{Y|X}(y|x) = \frac{f(x, y)}{f_X(x)}$$
読み方:「同時確率を、条件となる変数の周辺確率で割る」
ベイズの定理 $P(A|B) = P(A \cap B)/P(B)$ の連続版です!例題4:条件付き密度関数(詳細解説)
問題:$f(x, y) = 4xy$、$f_X(x) = 2x$、$f_Y(y) = 2y$ のとき、$f_{Y|X}(y|x)$ を求めよ。
【公式の適用】 $$f_{Y|X}(y|x) = \frac{f(x, y)}{f_X(x)}$$ 【代入して計算】 $$= \frac{4xy}{2x} = 2y \quad (0 \leq y \leq 1)$$ 【重要な発見!】
条件付き分布 $f_{Y|X}(y|x) = 2y$ は、$x$ に依存していない!
つまり、$X$ がどんな値でも、$Y$ の分布は同じ。
これは周辺分布 $f_Y(y) = 2y$ と一致しています。
→ $X$ と $Y$ は独立であることを示唆しています。
2.3 独立性(最重要概念)
以下の3つは全て同値(どれか1つが成り立てば、全て成り立つ):
条件1(定義):同時分布が周辺分布の積 $$f(x, y) = f_X(x) \cdot f_Y(y)$$ 条件2:条件付き分布が周辺分布と一致 $$f_{Y|X}(y|x) = f_Y(y)$$ 「$X$ を知っても、$Y$ の分布は変わらない」
条件3:期待値の分解 $$E(XY) = E(X) \cdot E(Y)$$
$$\text{独立} \Rightarrow \text{無相関} \quad \text{(常に成り立つ)}$$ $$\text{無相関} \not\Rightarrow \text{独立} \quad \text{(一般には成り立たない!)}$$ 反例:
$X \sim N(0, 1)$、$Y = X^2$ とすると、
・$\text{Cov}(X, Y) = 0$(無相関)だが、
・$Y$ は $X$ から決まるので明らかに独立ではない
例外:多変量正規分布では「無相関 $\Leftrightarrow$ 独立」が成り立つ!
これは多変量正規分布の特別な性質です。
3. 共分散と相関係数
3.1 共分散とは?(直感的理解)
共分散は「2つの変数が一緒に動く傾向」を測る指標です。
|
$\text{Cov}(X, Y) > 0$ 正の共分散 $X$ が大きいとき $Y$ も大きい傾向 例:身長と体重 |
$\text{Cov}(X, Y) < 0$ 負の共分散 $X$ が大きいとき $Y$ は小さい傾向 例:勉強時間と不合格率 |
$\text{Cov}(X, Y) = 0$ 無相関 $X$ と $Y$ に 線形関係がない 例:身長と数学の点数 |
読み方:「$X$ が平均からどれだけずれているか」と「$Y$ が平均からどれだけずれているか」の積の期待値
計算に便利な公式: $$\text{Cov}(X, Y) = E(XY) – E(X)E(Y)$$ これは分散の公式 $V(X) = E(X^2) – \{E(X)\}^2$ の2変数版です!3.2 共分散の性質(計算で使う)
1. $\text{Cov}(X, X) = V(X)$(自分自身との共分散は分散)
2. $\text{Cov}(X, Y) = \text{Cov}(Y, X)$(対称性)
3. $\text{Cov}(aX + b, cY + d) = ac \cdot \text{Cov}(X, Y)$(線形性)
4. $\text{Cov}(X + Y, Z) = \text{Cov}(X, Z) + \text{Cov}(Y, Z)$(加法性)
⭐ 最重要公式(和の分散): $$V(X + Y) = V(X) + V(Y) + 2\text{Cov}(X, Y)$$ $$V(X – Y) = V(X) + V(Y) – 2\text{Cov}(X, Y)$$ 独立なら $\text{Cov}(X, Y) = 0$ なので、$V(X + Y) = V(X) + V(Y)$
例題5:共分散の計算
問題:$E(X) = 2$、$E(Y) = 3$、$E(XY) = 7$ のとき、$\text{Cov}(X, Y)$ を求めよ。
公式 $\text{Cov}(X, Y) = E(XY) – E(X)E(Y)$ を使う: $$\text{Cov}(X, Y) = 7 – 2 \times 3 = 7 – 6 = 1$$ 【解釈】
$\text{Cov}(X, Y) = 1 > 0$ なので、$X$ と $Y$ には正の相関がある
($X$ が大きいとき $Y$ も大きい傾向)
3.3 相関係数(標準化された共分散)
読み方:「共分散を、両方の標準偏差で割って標準化したもの」
性質:・$-1 \leq \rho_{XY} \leq 1$(必ずこの範囲に収まる)
・$|\rho_{XY}| = 1 \Leftrightarrow Y = aX + b$(完全な線形関係)
・$\rho_{XY} = 0 \Leftrightarrow \text{Cov}(X, Y) = 0$(無相関)
【共分散との違い】
共分散:単位に依存する(身長cmと体重kgで値が変わる)
相関係数:単位に依存しない(標準化されている)
例題6:相関係数の計算
問題:$\text{Cov}(X, Y) = 12$、$V(X) = 16$、$V(Y) = 25$ のとき、相関係数 $\rho$ を求めよ。
ステップ1:標準偏差を求める $$\sigma_X = \sqrt{V(X)} = \sqrt{16} = 4$$ $$\sigma_Y = \sqrt{V(Y)} = \sqrt{25} = 5$$ ステップ2:公式に代入 $$\rho = \frac{\text{Cov}(X, Y)}{\sigma_X \times \sigma_Y} = \frac{12}{4 \times 5} = \frac{12}{20} = 0.6$$ 【解釈】
$\rho = 0.6$ は中程度の正の相関を示す
4. 多変量正規分布
4.1 なぜ多変量正規分布が重要か?
- 中心極限定理:多くの統計量は、大標本で多変量正規分布に近づく
- 計算の容易さ:周辺分布、条件付き分布が全て正規分布
- 特別な性質:無相関 $\Leftrightarrow$ 独立 が成り立つ(他の分布では成り立たない)
次のStep 5で学ぶ「中心極限定理」を理解するための基礎になります!
4.2 2変量正規分布
$(X, Y)$ が2変量正規分布に従うとき、密度関数は: $$f(x, y) = \frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}} \exp\left[-\frac{Q}{2(1-\rho^2)}\right]$$ ここで、$Q$ は以下の式: $$Q = \left(\frac{x-\mu_X}{\sigma_X}\right)^2 – 2\rho\left(\frac{x-\mu_X}{\sigma_X}\right)\left(\frac{y-\mu_Y}{\sigma_Y}\right)$$ $$\quad + \left(\frac{y-\mu_Y}{\sigma_Y}\right)^2$$ パラメータ(5つ):
・$\mu_X, \mu_Y$:平均(分布の中心)
・$\sigma_X, \sigma_Y$:標準偏差(広がり)
・$\rho$:相関係数($X$ と $Y$ の関係の強さ)
4.3 多変量正規分布の重要な性質
性質1:周辺分布も正規分布 $$X \sim N(\mu_X, \sigma_X^2), \quad Y \sim N(\mu_Y, \sigma_Y^2)$$ 性質2:条件付き分布も正規分布 $$Y|X=x \sim N(\mu_{Y|X}, \sigma^2_{Y|X})$$ 条件付き期待値(これは $x$ の1次関数!): $$\mu_{Y|X} = \mu_Y + \rho\frac{\sigma_Y}{\sigma_X}(x – \mu_X)$$ 条件付き分散(これは $x$ に依存しない!): $$\sigma^2_{Y|X} = \sigma_Y^2(1 – \rho^2)$$ 性質3:無相関⇔独立 $$\rho = 0 \Leftrightarrow X \text{ と } Y \text{ が独立}$$ (多変量正規分布でのみ成り立つ特別な性質!)
性質4:線形変換も正規分布(再生性)
$aX + bY$ も正規分布に従う
例題7:条件付き分布(詳細解説)
問題:$(X, Y) \sim N\left((0, 0), (1, 1), \rho=0.5\right)$ のとき、$X=1$ のもとでの $Y$ の条件付き分布を求めよ。
【与えられた情報】
$\mu_X = 0$, $\mu_Y = 0$, $\sigma_X = 1$, $\sigma_Y = 1$, $\rho = 0.5$
【条件付き期待値の計算】 $$\mu_{Y|X} = \mu_Y + \rho\frac{\sigma_Y}{\sigma_X}(x – \mu_X) = 0 + 0.5 \times \frac{1}{1} \times (1 – 0) = 0.5$$ 【条件付き分散の計算】 $$\sigma^2_{Y|X} = \sigma_Y^2(1 – \rho^2) = 1^2 \times (1 – 0.5^2) = 1 \times 0.75 = 0.75$$ 【答え】 $$Y|X=1 \sim N(0.5, 0.75)$$ 【解釈】
$X = 1$(平均0より大きい)のとき、
$Y$ の期待値も0.5(平均0より大きくなる)
→ 正の相関($\rho=0.5$)を反映している
4.4 独立な正規分布の和(超重要)
$X \sim N(\mu_X, \sigma_X^2)$、$Y \sim N(\mu_Y, \sigma_Y^2)$ が独立のとき: $$X + Y \sim N(\mu_X + \mu_Y, \sigma_X^2 + \sigma_Y^2)$$ $$X – Y \sim N(\mu_X – \mu_Y, \sigma_X^2 + \sigma_Y^2)$$ 【ポイント】
・平均は足す(または引く)
・分散は常に足す(引き算でも足す!)
これがStep 5「中心極限定理」の基礎になります!
5. 確率変数の変数変換
5.1 なぜ変数変換を学ぶのか?
- 新しい分布の導出:$Z = (X – \mu)/\sigma$ の分布は?(標準化)
- 統計量の分布:$X^2$ の分布は?(カイ二乗分布の導出)
- 推定量の分布:$\bar{X}/S$ の分布は?(t分布の導出)
次のStep 5「デルタ法」でも変数変換の考え方を使います!
5.2 1変数の変換
$Y = g(X)$ のとき、$Y$ の確率密度関数は: $$f_Y(y) = f_X(x) \cdot \left|\frac{dx}{dy}\right|$$ ここで、$x = g^{-1}(y)$(逆関数)
読み方:「元の密度関数に、変換のヤコビアン(絶対値)を掛ける」
【手順】1. $y = g(x)$ から $x$ を $y$ の式で表す(逆関数)
2. $\left|\frac{dx}{dy}\right|$ を計算(ヤコビアン)
3. $f_X(x)$ に $x = g^{-1}(y)$ を代入し、$\left|\frac{dx}{dy}\right|$ を掛ける
例題8:1変数の変換(カイ二乗分布の導出)
問題:$X \sim N(0, 1)$ のとき、$Y = X^2$ の確率密度関数を求めよ。
【注意点】
$Y = X^2$ は1対1ではない!($X = \sqrt{Y}$ または $X = -\sqrt{Y}$)
両方の場合を足す必要がある。
【計算】
$Y = X^2 \Rightarrow X = \pm\sqrt{Y}$
$\frac{dx}{dy} = \pm\frac{1}{2\sqrt{y}}$
$$f_Y(y) = f_X(\sqrt{y}) \cdot \left|\frac{1}{2\sqrt{y}}\right| + f_X(-\sqrt{y}) \cdot \left|\frac{1}{2\sqrt{y}}\right|$$ $X \sim N(0,1)$ なので $f_X(x) = \frac{1}{\sqrt{2\pi}}e^{-x^2/2}$
$f_X(\sqrt{y}) = f_X(-\sqrt{y}) = \frac{1}{\sqrt{2\pi}}e^{-y/2}$
$$f_Y(y) = \frac{1}{\sqrt{2\pi}} e^{-y/2} \cdot \frac{1}{\sqrt{y}} \times 2 = \frac{1}{\sqrt{2\pi y}} e^{-y/2} \quad (y > 0)$$ 【結論】
これは自由度1のカイ二乗分布 $\chi^2(1)$ の密度関数です!
標準正規分布の2乗がカイ二乗分布になることの証明
5.3 2変数の変換(ヤコビアン)
$U = g_1(X, Y)$、$V = g_2(X, Y)$ のとき: $$f_{UV}(u, v) = f_{XY}(x, y) \cdot |J|$$ ヤコビアン(Jacobian): $$J = \frac{\partial(x, y)}{\partial(u, v)} = \begin{vmatrix} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{vmatrix} = \frac{\partial x}{\partial u}\frac{\partial y}{\partial v} – \frac{\partial x}{\partial v}\frac{\partial y}{\partial u}$$
読み方:「ヤコビアンは変換による面積の拡大率を表す」
例題9:2変数の変換(詳細解説)
問題:$X$、$Y$ が独立で共に $U(0, 1)$ に従うとき、$U = X + Y$、$V = X – Y$ の同時密度関数を求めよ。
【ステップ1:逆変換を求める】
$U = X + Y$、$V = X – Y$ を連立して解く: $$U + V = 2X \Rightarrow X = \frac{U + V}{2}$$ $$U – V = 2Y \Rightarrow Y = \frac{U – V}{2}$$ 【ステップ2:ヤコビアンを計算】 $$\frac{\partial x}{\partial u} = \frac{1}{2}, \quad \frac{\partial x}{\partial v} = \frac{1}{2}$$ $$\frac{\partial y}{\partial u} = \frac{1}{2}, \quad \frac{\partial y}{\partial v} = -\frac{1}{2}$$ $$J = \frac{1}{2} \times \left(-\frac{1}{2}\right) – \frac{1}{2} \times \frac{1}{2} = -\frac{1}{4} – \frac{1}{4} = -\frac{1}{2}$$ $$|J| = \frac{1}{2}$$ 【ステップ3:密度関数を求める】
$X, Y \sim U(0,1)$ が独立なので $f_{XY}(x, y) = 1 \times 1 = 1$ $$f_{UV}(u, v) = 1 \times \frac{1}{2} = \frac{1}{2}$$ 【ステップ4:定義域を確認】
$0 \leq X \leq 1$、$0 \leq Y \leq 1$ より、菱形の領域になる
🌉 Step 5への橋渡し:大標本理論とは?
このStep 4で学んだ内容は、次のStep 5「大標本理論」を理解するための必須の基礎です。
| Step 4で学んだこと | Step 5での使い方 |
|---|---|
| 独立な確率変数の和の分散 $V(X+Y) = V(X) + V(Y)$ |
標本平均 $\bar{X} = \frac{1}{n}\sum X_i$ の分散 $V(\bar{X}) = \frac{\sigma^2}{n}$ |
| 正規分布の再生性 $X+Y \sim N(\mu_1+\mu_2, \sigma_1^2+\sigma_2^2)$ |
中心極限定理 $\bar{X}$ が正規分布に近づく理由 |
| 変数変換 $Y = g(X)$ の分布 |
デルタ法 $g(\bar{X})$ の漸近分布 |
- 「標本平均 $\bar{X}$ は、$n$ を増やすと真の平均 $\mu$ に近づく」は本当? → 大数の法則
- 「標本平均 $\bar{X}$ の分布は、$n$ が大きいと正規分布に近づく」は本当? → 中心極限定理
- 「$\log(\bar{X})$ や $\sqrt{\bar{X}}$ の分布はどうなる?」 → デルタ法
📝 練習問題
同時確率の性質
同時確率関数 $p(x, y)$ が以下で与えられるとき、$c$ の値を求めよ。
$p(1, 1) = c$、$p(1, 2) = 2c$、$p(2, 1) = 2c$、$p(2, 2) = 3c$
確率の和 = 1 より $$c + 2c + 2c + 3c = 1$$ $$8c = 1$$ $$c = \frac{1}{8}$$
周辺分布の計算
問題1の $p(x, y)$ について、$p_X(1)$ を求めよ。
周辺分布 = $Y$ について全て足す $$p_X(1) = p(1, 1) + p(1, 2) = c + 2c = 3c = \frac{3}{8}$$
条件付き確率
問題1の $p(x, y)$ について、$P(Y = 1 \mid X = 2)$ を求めよ。
まず $p_X(2)$ を求める: $$p_X(2) = p(2, 1) + p(2, 2) = 2c + 3c = 5c = \frac{5}{8}$$ 条件付き確率 = 同時確率 / 周辺確率 $$P(Y = 1 \mid X = 2) = \frac{p(2, 1)}{p_X(2)} = \frac{2c}{5c} = \frac{2}{5}$$
独立性の判定
$f(x, y) = 6xy^2$ ($0 \leq x \leq 1$, $0 \leq y \leq 1$)のとき、$X$ と $Y$ は独立か。
周辺分布を求める: $$f_X(x) = \int_0^1 6xy^2 \, dy = 6x\left[\frac{y^3}{3}\right]_0^1 = 2x$$ $$f_Y(y) = \int_0^1 6xy^2 \, dx = 6y^2\left[\frac{x^2}{2}\right]_0^1 = 3y^2$$ 確認: $$f_X(x) \times f_Y(y) = 2x \times 3y^2 = 6xy^2 = f(x, y) \quad \checkmark$$ 同時分布 = 周辺分布の積 なので、$X$ と $Y$ は独立
$V(X + Y)$ の計算
$V(X) = 4$、$V(Y) = 9$、$\text{Cov}(X, Y) = 3$ のとき、$V(X + Y)$ を求めよ。
公式:$V(X + Y) = V(X) + V(Y) + 2\text{Cov}(X, Y)$ $$V(X + Y) = 4 + 9 + 2 \times 3 = 4 + 9 + 6 = 19$$
相関係数の計算
$\text{Cov}(X, Y) = 6$、$\sigma_X = 2$、$\sigma_Y = 4$ のとき、相関係数 $\rho$ を求めよ。
独立な正規分布の和
$X \sim N(10, 4)$、$Y \sim N(15, 9)$ が独立のとき、$X + Y$ の分布を求めよ。
独立な正規分布の和は正規分布 $$E(X + Y) = E(X) + E(Y) = 10 + 15 = 25$$ $$V(X + Y) = V(X) + V(Y) = 4 + 9 = 13$$ $$X + Y \sim N(25, 13)$$
独立な正規分布の差
$X \sim N(50, 100)$、$Y \sim N(48, 64)$ が独立のとき、$X – Y$ の分布を求めよ。
条件付き期待値
$(X, Y) \sim N((0, 0), (1, 4), \rho=0.5)$ のとき、$E(Y|X=2)$ を求めよ。
公式:$\mu_{Y|X} = \mu_Y + \rho\frac{\sigma_Y}{\sigma_X}(x – \mu_X)$ $\sigma_Y = \sqrt{4} = 2$、$\sigma_X = \sqrt{1} = 1$ $$E(Y|X=2) = 0 + 0.5 \times \frac{2}{1} \times (2 – 0) = 0.5 \times 2 \times 2 = 2$$
条件付き分散
$(X, Y) \sim N((0, 0), (1, 4), \rho=0.5)$ のとき、$V(Y|X=2)$ を求めよ。
公式:$\sigma^2_{Y|X} = \sigma_Y^2(1 – \rho^2)$ $$V(Y|X=2) = 4 \times (1 – 0.5^2) = 4 \times 0.75 = 3$$ $X$ の値に関わらず、条件付き分散は一定!
- 同時確率分布、周辺分布、条件付き分布の関係を理解した
- 共分散 $\text{Cov}(X,Y)$ と相関係数 $\rho$ の意味と計算方法を習得した
- 確率変数の独立性を数学的に定義できるようになった
- 多変量正規分布の重要な性質を理解した
- 確率変数の変数変換とヤコビアンの使い方を学んだ
次のStep 5では、ここで学んだ内容をベースに「標本サイズが大きくなると何が起こるか」を学びます。
特に「和の分散」「正規分布の再生性」「変数変換」は重要なので、しっかり復習してから進んでください!
学習メモ
統計検定準1級対策 - Step 4