Step 14:時系列解析入門

Step 14: 時系列解析入門

時間的に依存するデータの特性を理解し、ARMAモデルの基礎を習得します

📚 このステップで学ぶこと

このステップでは、時系列データの基本概念を学びます。定常性、自己相関、ARモデル、MAモデル、ARMAモデルの構造を理解し、時系列データの特性を把握する方法を習得します。

🎯 なぜ時系列解析を学ぶのか?
  • 実務の必須スキル:売上予測、需要予測、在庫管理に不可欠
  • 金融分野:株価、為替、リスク管理の基盤
  • 科学分野:気象予測、地震予知、疫学分析に応用
  • データの特殊性:時間依存データは通常の統計手法が使えない

1. 時系列データの基礎

1.1 時系列データとは

📖 時系列データ(Time Series Data)

時間順に観測されたデータの系列

表記:
$\{X_1, X_2, X_3, \ldots, X_t, \ldots\}$
または $\{X_t\}_{t=1}^{n}$

特徴:
・時間的順序が重要
・隣接する観測値に依存関係
・独立同分布(i.i.d.)の仮定が成り立たない

例:
・株価の日次データ
・気温の月次データ
・売上の年次データ
・心拍数の秒次データ

1.2 時系列の成分分解

⭐ 古典的成分分解

加法モデル:
$$X_t = T_t + S_t + I_t$$
乗法モデル:
$$X_t = T_t \times S_t \times I_t$$
成分:
・$T_t$:トレンド(長期的傾向)
・$S_t$:季節変動(周期的パターン)
・$I_t$:不規則変動(ランダムな変動)

選択:
変動の振幅が一定 → 加法
変動の振幅がレベルに比例 → 乗法

例題1:成分の識別

問題:次の時系列の主な特徴を述べよ。
月次売上:1月=100, 7月=150, 1月=110, 7月=165, 1月=120, 7月=180

解答:

【観察】
・1月のデータ:100 → 110 → 120(増加)
・7月のデータ:150 → 165 → 180(増加)
・7月は1月の約1.5倍

【成分】
トレンド:上昇傾向あり
  各年で約10増加

季節変動:あり
  夏(7月)が冬(1月)より高い
  約50%増

【適切なモデル】
乗法モデル
(変動の振幅がレベルに比例)

2. 定常性

2.1 定常過程

📖 定常性(Stationarity)

強定常(Strict Stationarity)
任意の時点での同時分布が時間に依存しない

弱定常(Weak Stationarity)
次の3条件を満たす:

① 平均が一定
  $E[X_t] = \mu$(すべての $t$)

② 分散が一定
  $\text{Var}(X_t) = \sigma^2$(すべての $t$)

③ 自己共分散が時差のみに依存
  $\text{Cov}(X_t, X_{t+h}) = \gamma(h)$($t$ に依存しない)

実務:通常は弱定常性を「定常性」と呼ぶ

2.2 非定常性とその対処

⚠️ 非定常時系列の問題

非定常の例:
・トレンドがある
・分散が時間とともに変化
・季節性がある

定常化の方法:

① 差分
$\nabla X_t = X_t – X_{t-1}$(1次差分)
$\nabla^2 X_t = \nabla X_t – \nabla X_{t-1}$(2次差分)
→ トレンド除去

② 対数変換
$Y_t = \log(X_t)$
→ 分散安定化

③ 季節差分
$\nabla_s X_t = X_t – X_{t-s}$
→ 季節変動除去

④ トレンド除去
移動平均、回帰による除去

例題2:差分の計算

問題:時系列 $\{10, 12, 15, 19, 24\}$ の1次差分を求めよ。

解答:

【1次差分】
$\nabla X_t = X_t – X_{t-1}$

$\nabla X_2 = 12 – 10 = 2$
$\nabla X_3 = 15 – 12 = 3$
$\nabla X_4 = 19 – 15 = 4$
$\nabla X_5 = 24 – 19 = 5$

【差分系列】
$\{2, 3, 4, 5\}$

【解釈】
元の系列:上昇トレンドあり
差分系列:さらに増加傾向(加速している)

2次差分を取ると:
$\nabla^2 X_3 = 3 – 2 = 1$
$\nabla^2 X_4 = 4 – 3 = 1$
$\nabla^2 X_5 = 5 – 4 = 1$
→ 定常化!

3. 自己相関と偏自己相関

3.1 自己共分散と自己相関

⭐ 自己共分散関数(ACVF)

$$\gamma(h) = \text{Cov}(X_t, X_{t+h})$$
$h$:ラグ(lag, 時差)

性質:
・$\gamma(0) = \text{Var}(X_t)$
・$\gamma(h) = \gamma(-h)$(対称性)
・$|\gamma(h)| ≦ \gamma(0)$

自己相関関数(ACF)
$$\rho(h) = \frac{\gamma(h)}{\gamma(0)} = \text{Cor}(X_t, X_{t+h})$$
性質:
・$\rho(0) = 1$
・$-1 ≦ \rho(h) ≦ 1$
・$\rho(h) = \rho(-h)$

標本ACF:
$$r(h) = \frac{\sum_{t=1}^{n-h}(X_t – \bar{X})(X_{t+h} – \bar{X})}{\sum_{t=1}^{n}(X_t – \bar{X})^2}$$

3.2 偏自己相関

📖 偏自己相関関数(PACF)

中間のラグの影響を除いた相関

定義:
$$\phi_{hh} = \text{Cor}(X_t, X_{t+h} | X_{t+1}, \ldots, X_{t+h-1})$$
$X_{t+1}, \ldots, X_{t+h-1}$ を条件とした
$X_t$ と $X_{t+h}$ の相関

解釈:
・直接的な関係の強さ
・間接的な影響を除外

計算:
Yule-Walker方程式を解く
または回帰により推定

例題3:ACFの計算

問題:時系列 $\{1, 2, 3, 2, 1\}$ のラグ1のACFを求めよ。

解答:

【平均】
$\bar{X} = (1+2+3+2+1)/5 = 1.8$

【偏差】
$x_1 – \bar{X} = -0.8$
$x_2 – \bar{X} = 0.2$
$x_3 – \bar{X} = 1.2$
$x_4 – \bar{X} = 0.2$
$x_5 – \bar{X} = -0.8$

【分子(ラグ1のペア)】
$(-0.8)(0.2) + (0.2)(1.2) + (1.2)(0.2) + (0.2)(-0.8)$
$= -0.16 + 0.24 + 0.24 – 0.16 = 0.16$

【分母】
$(-0.8)^2 + (0.2)^2 + (1.2)^2 + (0.2)^2 + (-0.8)^2$
$= 0.64 + 0.04 + 1.44 + 0.04 + 0.64 = 2.8$

【ACF(1)】
$$r(1) = \frac{0.16}{2.8} \approx 0.057$$
ラグ1の相関は非常に弱い

4. ARモデル

4.1 自己回帰モデル

📖 AR($p$)モデル

Auto-Regressive model of order $p$

定義:
$$X_t = \phi_1 X_{t-1} + \phi_2 X_{t-2} + \cdots + \phi_p X_{t-p} + \varepsilon_t$$
$\phi_i$:AR係数
$\varepsilon_t \sim WN(0, \sigma^2)$:ホワイトノイズ

定常条件:
特性方程式の根が単位円の外側
$1 – \phi_1 z – \phi_2 z^2 – \cdots – \phi_p z^p = 0$

AR(1)の特別な場合:
$$X_t = \phi X_{t-1} + \varepsilon_t$$ 定常条件:$|\phi| < 1$

4.2 AR(1)の性質

⭐ AR(1):$X_t = \phi X_{t-1} + \varepsilon_t$

平均:
$E[X_t] = 0$(平均0に中心化)

分散:
$$\text{Var}(X_t) = \frac{\sigma^2}{1 – \phi^2}$$
ACF:
$$\rho(h) = \phi^h$$ ・指数的減衰
・$\phi > 0$:正の相関が減衰
・$\phi < 0$:符号が交互に変わる

PACF:
$\phi_{11} = \phi$
$\phi_{hh} = 0$($h ≧ 2$)
・ラグ1でカットオフ

例題4:AR(1)の分散

問題:AR(1)モデル $X_t = 0.6 X_{t-1} + \varepsilon_t$ で、$\sigma^2 = 4$。$\text{Var}(X_t)$ を求めよ。

解答:

【パラメータ】
$\phi = 0.6$
$\sigma^2 = 4$

【定常条件の確認】
$|\phi| = 0.6 < 1$ ✓
定常である

【分散の公式】
$$\text{Var}(X_t) = \frac{\sigma^2}{1 – \phi^2} = \frac{4}{1 – 0.6^2} = \frac{4}{1 – 0.36} = \frac{4}{0.64} = 6.25$$
【ACF】
$\rho(1) = 0.6$
$\rho(2) = 0.6^2 = 0.36$
$\rho(3) = 0.6^3 = 0.216$

指数的に減衰

5. MAモデル

5.1 移動平均モデル

📖 MA($q$)モデル

Moving Average model of order $q$

定義:
$$X_t = \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + \cdots + \theta_q \varepsilon_{t-q}$$
$\theta_i$:MA係数
$\varepsilon_t \sim WN(0, \sigma^2)$:ホワイトノイズ

特徴:
・常に定常
・過去のショックの加重和
・反転可能性の条件あり

MA(1)の特別な場合:
$$X_t = \varepsilon_t + \theta \varepsilon_{t-1}$$ 反転可能条件:$|\theta| < 1$

5.2 MA(1)の性質

⭐ MA(1):$X_t = \varepsilon_t + \theta \varepsilon_{t-1}$

平均:
$E[X_t] = 0$

分散:
$$\text{Var}(X_t) = (1 + \theta^2)\sigma^2$$
ACF:
$$\rho(1) = \frac{\theta}{1 + \theta^2}$$ $\rho(h) = 0$($h ≧ 2$)
・ラグ1でカットオフ

PACF:
$$\phi_{hh} = \frac{(-\theta)^h (1 – \theta^2)}{1 – \theta^{2(h+1)}}$$ ・指数的減衰

例題5:MA(1)のACF

問題:MA(1)モデル $X_t = \varepsilon_t + 0.8\varepsilon_{t-1}$ で、$\sigma^2 = 1$。$\rho(1)$ と $\text{Var}(X_t)$ を求めよ。

解答:

【パラメータ】
$\theta = 0.8$
$\sigma^2 = 1$

【分散】
$$\text{Var}(X_t) = (1 + \theta^2)\sigma^2 = (1 + 0.8^2) \times 1 = 1 + 0.64 = 1.64$$
【ラグ1のACF】
$$\rho(1) = \frac{\theta}{1 + \theta^2} = \frac{0.8}{1 + 0.64} = \frac{0.8}{1.64} \approx 0.488$$
【他のラグ】
$\rho(2) = 0$
$\rho(3) = 0$

ラグ1より大きいラグではすべて0

MA(1)の特徴的パターン!

6. ARMAモデル

6.1 ARMAモデルの定義

📖 ARMA($p,q$)モデル

ARとMAの組み合わせ

定義:
$$X_t = \phi_1 X_{t-1} + \cdots + \phi_p X_{t-p} + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q}$$
後退作用素表記:
$$\phi(B)X_t = \theta(B)\varepsilon_t$$
$\phi(B) = 1 – \phi_1 B – \cdots – \phi_p B^p$
$\theta(B) = 1 + \theta_1 B + \cdots + \theta_q B^q$
$B$:後退作用素($BX_t = X_{t-1}$)

定常条件:$\phi(z) = 0$ の根が単位円外
反転可能条件:$\theta(z) = 0$ の根が単位円外

6.2 モデルの識別

⭐ ACFとPACFによるモデル識別

モデル ACF PACF
AR($p$) 指数的減衰 ラグ $p$ でカットオフ
MA($q$) ラグ $q$ でカットオフ 指数的減衰
ARMA($p,q$) 指数的減衰 指数的減衰
カットオフ:ある時点から0になる
減衰:徐々に0に近づく

モデル選択:
・AIC, BICを比較
・残差の検定
・予測精度

6.3 情報量規準

📐 モデル選択規準

AIC(赤池情報量規準):
$$AIC = -2\ell + 2k$$
BIC(ベイズ情報量規準):
$$BIC = -2\ell + k \log(n)$$
$\ell$:最大対数尤度
$k$:パラメータ数
$n$:データ数

選択:
AIC/BICが最小のモデル

違い:
BICはAICより大きなペナルティ
→ より単純なモデルを選びやすい

例題6:モデル識別

問題:あるデータのACFがラグ2で0になり、PACFが指数的に減衰している。適切なモデルは?

解答:

【観察された特徴】
・ACF:ラグ2でカットオフ
・PACF:指数的減衰

【識別表との照合】
ACFがカットオフ → MAモデル
PACFが減衰 → MAモデルを支持
ラグ2でカットオフ → 次数2

【適切なモデル】
MA(2)

【モデル式】
$$X_t = \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2}$$
【次のステップ】
① MA(2)のパラメータを推定
② 残差診断を実施
③ 必要に応じてモデル修正

📝 練習問題(15問)

問題 1

時系列の特徴

時系列データの最も重要な特徴は?

解答:

時間的順序と、
隣接する観測値の依存関係
問題 2

定常性の条件

弱定常性の3条件を挙げよ。

解答:

① 平均が一定
② 分散が一定
③ 自己共分散が時差のみに依存
問題 3

差分の目的

1次差分を取る主な目的は?

解答:

トレンドを除去して定常化する
問題 4

ACFの定義

自己相関関数 $\rho(h)$ の定義を式で表せ。

解答:

$$\rho(h) = \frac{\gamma(h)}{\gamma(0)} = \text{Cor}(X_t, X_{t+h})$$
問題 5

AR(1)の定義

AR(1)モデルを式で表せ。

解答:

$$X_t = \phi X_{t-1} + \varepsilon_t$$
問題 6

AR(1)の定常条件

AR(1)が定常となる条件は?

解答:

$|\phi| < 1$
問題 7

MA(1)の定義

MA(1)モデルを式で表せ。

解答:

$$X_t = \varepsilon_t + \theta \varepsilon_{t-1}$$
問題 8

MAモデルの特性

MA($q$)モデルのACFの特徴は?

解答:

ラグ $q$ でカットオフ
(ラグ $q+1$ 以降は0)
問題 9

ARモデルの特性

AR($p$)モデルのPACFの特徴は?

解答:

ラグ $p$ でカットオフ
(ラグ $p+1$ 以降は0)
問題 10

ホワイトノイズ

ホワイトノイズの定義を述べよ。

解答:

平均0、分散 $\sigma^2$ で
互いに無相関な確率変数の系列
$WN(0, \sigma^2)$
問題 11

後退作用素

後退作用素 $B$ の $X_t$ への作用は?

解答:

$BX_t = X_{t-1}$
問題 12

季節差分

季節周期12の季節差分を式で表せ。

解答:

$\nabla_{12} X_t = X_t – X_{t-12}$
問題 13

AICの式

AICの計算式を書け。

解答:

$$AIC = -2\ell + 2k$$ ($\ell$:対数尤度、$k$:パラメータ数)
問題 14

モデルの識別

ACFが指数的減衰、PACFがラグ1でカットオフ。適切なモデルは?

解答:

AR(1)モデル
問題 15

ARMA(1,1)

ARMA(1,1)モデルを式で表せ。

解答:

$$X_t = \phi X_{t-1} + \varepsilon_t + \theta \varepsilon_{t-1}$$
📌 Step 14のまとめ
  • 時系列データの基本概念と成分分解を理解した
  • 定常性の定義と定常化の方法を習得した
  • 自己相関関数(ACF)と偏自己相関関数(PACF)を理解した
  • AR($p$)モデルの構造と性質を学んだ
  • MA($q$)モデルの構造と性質を学んだ
  • ARMA($p,q$)モデルとACF/PACFによる識別法を習得した
次のStep 15では、総合演習と試験対策を行います!
📝

学習メモ

統計検定準1級対策 - Step 14

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE