Step 14: 時系列解析入門
時間的に依存するデータの特性を理解し、ARMAモデルの基礎を習得します
📚 このステップで学ぶこと
このステップでは、時系列データの基本概念を学びます。定常性、自己相関、ARモデル、MAモデル、ARMAモデルの構造を理解し、時系列データの特性を把握する方法を習得します。
- 実務の必須スキル:売上予測、需要予測、在庫管理に不可欠
- 金融分野:株価、為替、リスク管理の基盤
- 科学分野:気象予測、地震予知、疫学分析に応用
- データの特殊性:時間依存データは通常の統計手法が使えない
1. 時系列データの基礎
1.1 時系列データとは
時間順に観測されたデータの系列
表記:
$\{X_1, X_2, X_3, \ldots, X_t, \ldots\}$
または $\{X_t\}_{t=1}^{n}$
特徴:
・時間的順序が重要
・隣接する観測値に依存関係
・独立同分布(i.i.d.)の仮定が成り立たない
例:
・株価の日次データ
・気温の月次データ
・売上の年次データ
・心拍数の秒次データ
1.2 時系列の成分分解
加法モデル:
$$X_t = T_t + S_t + I_t$$
乗法モデル:
$$X_t = T_t \times S_t \times I_t$$
成分:
・$T_t$:トレンド(長期的傾向)
・$S_t$:季節変動(周期的パターン)
・$I_t$:不規則変動(ランダムな変動)
選択:
変動の振幅が一定 → 加法
変動の振幅がレベルに比例 → 乗法
例題1:成分の識別
問題:次の時系列の主な特徴を述べよ。
月次売上:1月=100, 7月=150, 1月=110, 7月=165, 1月=120, 7月=180
【観察】
・1月のデータ:100 → 110 → 120(増加)
・7月のデータ:150 → 165 → 180(増加)
・7月は1月の約1.5倍
【成分】
① トレンド:上昇傾向あり
各年で約10増加
② 季節変動:あり
夏(7月)が冬(1月)より高い
約50%増
【適切なモデル】
乗法モデル
(変動の振幅がレベルに比例)
2. 定常性
2.1 定常過程
強定常(Strict Stationarity)
任意の時点での同時分布が時間に依存しない
弱定常(Weak Stationarity)
次の3条件を満たす:
① 平均が一定
$E[X_t] = \mu$(すべての $t$)
② 分散が一定
$\text{Var}(X_t) = \sigma^2$(すべての $t$)
③ 自己共分散が時差のみに依存
$\text{Cov}(X_t, X_{t+h}) = \gamma(h)$($t$ に依存しない)
実務:通常は弱定常性を「定常性」と呼ぶ
2.2 非定常性とその対処
非定常の例:
・トレンドがある
・分散が時間とともに変化
・季節性がある
定常化の方法:
① 差分
$\nabla X_t = X_t – X_{t-1}$(1次差分)
$\nabla^2 X_t = \nabla X_t – \nabla X_{t-1}$(2次差分)
→ トレンド除去
② 対数変換
$Y_t = \log(X_t)$
→ 分散安定化
③ 季節差分
$\nabla_s X_t = X_t – X_{t-s}$
→ 季節変動除去
④ トレンド除去
移動平均、回帰による除去
例題2:差分の計算
問題:時系列 $\{10, 12, 15, 19, 24\}$ の1次差分を求めよ。
【1次差分】
$\nabla X_t = X_t – X_{t-1}$
$\nabla X_2 = 12 – 10 = 2$
$\nabla X_3 = 15 – 12 = 3$
$\nabla X_4 = 19 – 15 = 4$
$\nabla X_5 = 24 – 19 = 5$
【差分系列】
$\{2, 3, 4, 5\}$
【解釈】
元の系列:上昇トレンドあり
差分系列:さらに増加傾向(加速している)
2次差分を取ると:
$\nabla^2 X_3 = 3 – 2 = 1$
$\nabla^2 X_4 = 4 – 3 = 1$
$\nabla^2 X_5 = 5 – 4 = 1$
→ 定常化!
3. 自己相関と偏自己相関
3.1 自己共分散と自己相関
$$\gamma(h) = \text{Cov}(X_t, X_{t+h})$$
$h$:ラグ(lag, 時差)
性質:
・$\gamma(0) = \text{Var}(X_t)$
・$\gamma(h) = \gamma(-h)$(対称性)
・$|\gamma(h)| ≦ \gamma(0)$
自己相関関数(ACF)
$$\rho(h) = \frac{\gamma(h)}{\gamma(0)} = \text{Cor}(X_t, X_{t+h})$$
性質:
・$\rho(0) = 1$
・$-1 ≦ \rho(h) ≦ 1$
・$\rho(h) = \rho(-h)$
標本ACF:
$$r(h) = \frac{\sum_{t=1}^{n-h}(X_t – \bar{X})(X_{t+h} – \bar{X})}{\sum_{t=1}^{n}(X_t – \bar{X})^2}$$
3.2 偏自己相関
中間のラグの影響を除いた相関
定義:
$$\phi_{hh} = \text{Cor}(X_t, X_{t+h} | X_{t+1}, \ldots, X_{t+h-1})$$
$X_{t+1}, \ldots, X_{t+h-1}$ を条件とした
$X_t$ と $X_{t+h}$ の相関
解釈:
・直接的な関係の強さ
・間接的な影響を除外
計算:
Yule-Walker方程式を解く
または回帰により推定
例題3:ACFの計算
問題:時系列 $\{1, 2, 3, 2, 1\}$ のラグ1のACFを求めよ。
【平均】
$\bar{X} = (1+2+3+2+1)/5 = 1.8$
【偏差】
$x_1 – \bar{X} = -0.8$
$x_2 – \bar{X} = 0.2$
$x_3 – \bar{X} = 1.2$
$x_4 – \bar{X} = 0.2$
$x_5 – \bar{X} = -0.8$
【分子(ラグ1のペア)】
$(-0.8)(0.2) + (0.2)(1.2) + (1.2)(0.2) + (0.2)(-0.8)$
$= -0.16 + 0.24 + 0.24 – 0.16 = 0.16$
【分母】
$(-0.8)^2 + (0.2)^2 + (1.2)^2 + (0.2)^2 + (-0.8)^2$
$= 0.64 + 0.04 + 1.44 + 0.04 + 0.64 = 2.8$
【ACF(1)】
$$r(1) = \frac{0.16}{2.8} \approx 0.057$$
ラグ1の相関は非常に弱い
4. ARモデル
4.1 自己回帰モデル
Auto-Regressive model of order $p$
定義:
$$X_t = \phi_1 X_{t-1} + \phi_2 X_{t-2} + \cdots + \phi_p X_{t-p} + \varepsilon_t$$
$\phi_i$:AR係数
$\varepsilon_t \sim WN(0, \sigma^2)$:ホワイトノイズ
定常条件:
特性方程式の根が単位円の外側
$1 – \phi_1 z – \phi_2 z^2 – \cdots – \phi_p z^p = 0$
AR(1)の特別な場合:
$$X_t = \phi X_{t-1} + \varepsilon_t$$ 定常条件:$|\phi| < 1$
4.2 AR(1)の性質
平均:
$E[X_t] = 0$(平均0に中心化)
分散:
$$\text{Var}(X_t) = \frac{\sigma^2}{1 – \phi^2}$$
ACF:
$$\rho(h) = \phi^h$$ ・指数的減衰
・$\phi > 0$:正の相関が減衰
・$\phi < 0$:符号が交互に変わる
PACF:
$\phi_{11} = \phi$
$\phi_{hh} = 0$($h ≧ 2$)
・ラグ1でカットオフ
例題4:AR(1)の分散
問題:AR(1)モデル $X_t = 0.6 X_{t-1} + \varepsilon_t$ で、$\sigma^2 = 4$。$\text{Var}(X_t)$ を求めよ。
【パラメータ】
$\phi = 0.6$
$\sigma^2 = 4$
【定常条件の確認】
$|\phi| = 0.6 < 1$ ✓
定常である
【分散の公式】
$$\text{Var}(X_t) = \frac{\sigma^2}{1 – \phi^2} = \frac{4}{1 – 0.6^2} = \frac{4}{1 – 0.36} = \frac{4}{0.64} = 6.25$$
【ACF】
$\rho(1) = 0.6$
$\rho(2) = 0.6^2 = 0.36$
$\rho(3) = 0.6^3 = 0.216$
⋮
指数的に減衰
5. MAモデル
5.1 移動平均モデル
Moving Average model of order $q$
定義:
$$X_t = \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + \cdots + \theta_q \varepsilon_{t-q}$$
$\theta_i$:MA係数
$\varepsilon_t \sim WN(0, \sigma^2)$:ホワイトノイズ
特徴:
・常に定常
・過去のショックの加重和
・反転可能性の条件あり
MA(1)の特別な場合:
$$X_t = \varepsilon_t + \theta \varepsilon_{t-1}$$ 反転可能条件:$|\theta| < 1$
5.2 MA(1)の性質
平均:
$E[X_t] = 0$
分散:
$$\text{Var}(X_t) = (1 + \theta^2)\sigma^2$$
ACF:
$$\rho(1) = \frac{\theta}{1 + \theta^2}$$ $\rho(h) = 0$($h ≧ 2$)
・ラグ1でカットオフ
PACF:
$$\phi_{hh} = \frac{(-\theta)^h (1 – \theta^2)}{1 – \theta^{2(h+1)}}$$ ・指数的減衰
例題5:MA(1)のACF
問題:MA(1)モデル $X_t = \varepsilon_t + 0.8\varepsilon_{t-1}$ で、$\sigma^2 = 1$。$\rho(1)$ と $\text{Var}(X_t)$ を求めよ。
【パラメータ】
$\theta = 0.8$
$\sigma^2 = 1$
【分散】
$$\text{Var}(X_t) = (1 + \theta^2)\sigma^2 = (1 + 0.8^2) \times 1 = 1 + 0.64 = 1.64$$
【ラグ1のACF】
$$\rho(1) = \frac{\theta}{1 + \theta^2} = \frac{0.8}{1 + 0.64} = \frac{0.8}{1.64} \approx 0.488$$
【他のラグ】
$\rho(2) = 0$
$\rho(3) = 0$
⋮
ラグ1より大きいラグではすべて0
MA(1)の特徴的パターン!
6. ARMAモデル
6.1 ARMAモデルの定義
ARとMAの組み合わせ
定義:
$$X_t = \phi_1 X_{t-1} + \cdots + \phi_p X_{t-p} + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q}$$
後退作用素表記:
$$\phi(B)X_t = \theta(B)\varepsilon_t$$
$\phi(B) = 1 – \phi_1 B – \cdots – \phi_p B^p$
$\theta(B) = 1 + \theta_1 B + \cdots + \theta_q B^q$
$B$:後退作用素($BX_t = X_{t-1}$)
定常条件:$\phi(z) = 0$ の根が単位円外
反転可能条件:$\theta(z) = 0$ の根が単位円外
6.2 モデルの識別
| モデル | ACF | PACF |
| AR($p$) | 指数的減衰 | ラグ $p$ でカットオフ |
| MA($q$) | ラグ $q$ でカットオフ | 指数的減衰 |
| ARMA($p,q$) | 指数的減衰 | 指数的減衰 |
減衰:徐々に0に近づく
モデル選択:
・AIC, BICを比較
・残差の検定
・予測精度
6.3 情報量規準
AIC(赤池情報量規準):
$$AIC = -2\ell + 2k$$
BIC(ベイズ情報量規準):
$$BIC = -2\ell + k \log(n)$$
$\ell$:最大対数尤度
$k$:パラメータ数
$n$:データ数
選択:
AIC/BICが最小のモデル
違い:
BICはAICより大きなペナルティ
→ より単純なモデルを選びやすい
例題6:モデル識別
問題:あるデータのACFがラグ2で0になり、PACFが指数的に減衰している。適切なモデルは?
【観察された特徴】
・ACF:ラグ2でカットオフ
・PACF:指数的減衰
【識別表との照合】
ACFがカットオフ → MAモデル
PACFが減衰 → MAモデルを支持
ラグ2でカットオフ → 次数2
【適切なモデル】
MA(2)
【モデル式】
$$X_t = \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2}$$
【次のステップ】
① MA(2)のパラメータを推定
② 残差診断を実施
③ 必要に応じてモデル修正
📝 練習問題(15問)
時系列の特徴
時系列データの最も重要な特徴は?
時間的順序と、
隣接する観測値の依存関係
定常性の条件
弱定常性の3条件を挙げよ。
① 平均が一定
② 分散が一定
③ 自己共分散が時差のみに依存
差分の目的
1次差分を取る主な目的は?
トレンドを除去して定常化する
ACFの定義
自己相関関数 $\rho(h)$ の定義を式で表せ。
$$\rho(h) = \frac{\gamma(h)}{\gamma(0)} = \text{Cor}(X_t, X_{t+h})$$
AR(1)の定義
AR(1)モデルを式で表せ。
$$X_t = \phi X_{t-1} + \varepsilon_t$$
AR(1)の定常条件
AR(1)が定常となる条件は?
$|\phi| < 1$
MA(1)の定義
MA(1)モデルを式で表せ。
$$X_t = \varepsilon_t + \theta \varepsilon_{t-1}$$
MAモデルの特性
MA($q$)モデルのACFの特徴は?
ラグ $q$ でカットオフ
(ラグ $q+1$ 以降は0)
ARモデルの特性
AR($p$)モデルのPACFの特徴は?
ラグ $p$ でカットオフ
(ラグ $p+1$ 以降は0)
ホワイトノイズ
ホワイトノイズの定義を述べよ。
平均0、分散 $\sigma^2$ で
互いに無相関な確率変数の系列
$WN(0, \sigma^2)$
後退作用素
後退作用素 $B$ の $X_t$ への作用は?
$BX_t = X_{t-1}$
季節差分
季節周期12の季節差分を式で表せ。
$\nabla_{12} X_t = X_t – X_{t-12}$
AICの式
AICの計算式を書け。
$$AIC = -2\ell + 2k$$ ($\ell$:対数尤度、$k$:パラメータ数)
モデルの識別
ACFが指数的減衰、PACFがラグ1でカットオフ。適切なモデルは?
AR(1)モデル
ARMA(1,1)
ARMA(1,1)モデルを式で表せ。
$$X_t = \phi X_{t-1} + \varepsilon_t + \theta \varepsilon_{t-1}$$
- 時系列データの基本概念と成分分解を理解した
- 定常性の定義と定常化の方法を習得した
- 自己相関関数(ACF)と偏自己相関関数(PACF)を理解した
- AR($p$)モデルの構造と性質を学んだ
- MA($q$)モデルの構造と性質を学んだ
- ARMA($p,q$)モデルとACF/PACFによる識別法を習得した
学習メモ
統計検定準1級対策 - Step 14