时间序列-简答

时间序列-简答

周六 5月 23 2026
7009 字 · 37 分钟
红色窟窿 · 深邃内影 | 01序列血雨

第一章 时间序列分析概述

什么是时间序列?

时间序列是在连续或等间隔的时间点上获得的一组观测数据。

频域分析方法和时域分析方法的区别。

  • 频域分析方法(Spectral Analysis):频域分析方法关注时间序列中不同频率成分的相对重要性。其理论基础是傅里叶分析。

  • 时域分析方法(Time-Domain Analysis):时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。从统计性质随时间是否保持不变的角度,可以划分为平稳时间序列和非平稳时间序列。

时间序列分析的目标。

  • 描述历史行为:刻画序列随时间变化的特征与规律
  • 理解生成机制:分析时间序列变化背后的内在机理影响因素
  • 预测与决策支持:对未来走势进行预测,为政策与管理决策提供依据。
  • 监测与评估:检验政策或管理决策是否产生预期效果

第二章 平稳时间序列简介

严平稳和弱平稳的定义及区别。

  • 严平稳(Strictly Stationary):所有统计性质均不随时间的推移而改变的时间序列。

  • 弱平稳(Weakly Stationary):又称宽平稳。要求序列满足:

    • 常数均值;
    • 常数方差;
    • 任意两项之间的自协方差仅与时间间隔 kk 相关,而与所处的时间 tt 无关 。
  • 区别

    • 通常情况下,严平稳能推出弱平稳,而弱平稳不能反推严平稳。
      • 特例:服从柯西分布的严平稳序列就不是弱平稳序列;当序列服从多元正态分布时,弱平稳可以推出严平稳。
    • 严平稳条件极苛刻,研究难度大;
    • 弱平稳条件相对宽松。在实际应用中,通常所说的平稳性是指弱平稳 。

自协方差函数和自相关函数的定义。

  • 自协方差函数(Autocovariance Function, ACVF):定义为 γk=E[(Xtμ)(Xtkμ)]\gamma_k = E[(X_t - \mu)(X_{t-k} - \mu)],描述了序列在滞后 kk 阶下的相关强度 。

  • 自相关函数(Autocorrelation Function, ACF):定义为滞后 kk 阶的自协方差与方差的比值,即 ρk=γkγ0\rho_k = \frac{\gamma_k}{\gamma_0}

平稳时间序列的统计性质。

  • 常数均值E(Xt)=μE(X_t) = \mu

  • 常数方差Var(Xt)=γ0Var(X_t) = \gamma_0

  • 自协方差与自相关系数只依赖于滞后阶数 kkγ(t,tk)=γk\gamma(t, t-k) = \gamma_kρ(t,tk)=ρk\rho(t, t-k) = \rho_k

平稳时间序列的意义。

统计特性不随时间变化,从而可以利用 同一序列 不同时间 的观测值,对总体的未知参数进行估计。

在平稳性检验中,时序图检验和自相关图检验的基本原理是什么?

  • 时序图检验:平稳时间序列具有常数均值常数方差,因此其时序图通常表现为围绕某一固定水平上下波动,且波动幅度相对稳定。

  • 自相关图检验:平稳时间序列通常只具有短期相关性,即其自相关函数会随着滞后阶数的增加而较快地衰减至零。

白噪声序列的定义。

若时间序列 {εt,tT}\{ \varepsilon_t, t \in T \} 满足

  • E(εt)=0,tT\quad E(\varepsilon_t) = 0, \quad \forall t \in T,

  • γ(t,s)={σ2,t=s,0,ts,t,sT,\quad \gamma(t, s) = \begin{cases} \sigma^2, & t =s, \\ 0, & t \neq s, \end{cases} \quad \forall t, s \in T,

则称 {εt}\{ \varepsilon_t \} 为白噪声序列,记作 εtWN(0,σ2)\varepsilon_t \sim \text{WN}(0, \sigma^2)

白噪声序列的意义。

在时间序列建模中,白噪声通常作为误差项的理想形式出现。

  1. 从模型设定的角度看,如果误差项不是白噪声,则表明模型尚未充分刻画观测数据中的规律,误差项中仍可能包含尚未被充分解释的信息。

  2. 从统计推断角度看,白噪声性质为基于观测数据的估计与检验奠定了重要基础。具体而言,误差项的白噪声特性是参数估计具有一致性渐近正态性的关键条件。

白噪声检验的基本原理。

如果序列是纯随机的,那么其所有的自相关系数 ρk\rho_k(除 ρ0\rho_0 外)都应接近于 00

通过卡方分布的统计量 QQ,检验在给定的显著性水平下,前 mm自相关系数是否显著不为 00

QQ 越大越拒绝原假设。

在白噪声检验中,如何选取滞后阶数 mm

覆盖可能的相关结构: 多数平稳序列的自相关主要集中在低阶滞后,因此 mm 应至少覆盖短期自相关,以保证对潜在自相关结构的检验能力。

避免高阶噪声干扰: 当 mm 过大时,高阶滞后自相关往往由噪声主导,可能掩盖低阶相关性,从而降低对短期相关性的检验效果。

逐步检验与综合判断: 在实际操作中,可从小到大选择多个 mm 值(如 5,1015...5,10,15,...),综合判断序列是否为白噪声。


第三章 平稳时间序列模型

AR 模型的定义

自回归模型(Autoregressive model)记作 AR(p)AR(p),其形式为:

Xt=ϕ0+ϕ1Xt1+ϕ2Xt2++ϕpXtp+εt,ϕp0X_t = \phi_0 + \phi_1 X_{t-1} + \phi_2 X_{t-2} + \cdots + \phi_p X_{t-p} + \varepsilon_t, \quad \phi_p \neq 0

其中 {εt}\{\varepsilon_t\} 为白噪声序列。若 {Xt}\{X_t\} 平稳且均值为 μ\mu,则可中心化为:

Yt=ϕ1Yt1+ϕ2Yt2++ϕpYtp+εtY_t = \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + \cdots + \phi_p Y_{t-p} + \varepsilon_t

其中 Yt=XtμY_t = X_t - \mu

延迟算子的性质

延迟算子 BB 满足:

  • BXt=Xt1B X_t = X_{t-1}
  • B2Xt=Xt2B^2 X_t = X_{t-2}
  • 一般地,BkXt=XtkB^k X_t = X_{t-k}
  • 差分运算:
    • 一阶差分:Xt=(1B)Xt\nabla X_t = (1 - B) X_t
    • pp 阶差分:pXt=(1B)pXt\nabla^p X_t = (1 - B)^p X_t
    • kk 步差分:kXt=(1Bk)Xt\nabla_k X_t = (1 - B^k) X_t
  • a<1|a| < 1{Xt}\{X_t\} 平稳,则 11aBXt=j=0ajXtj\frac{1}{1 - aB} X_t = \sum_{j=0}^{\infty} a^j X_{t-j}

如何判别 AR 模型的平稳性?

  • 原则

    • AR(p)AR(p) 模型特征方程 λpϕ1λp1ϕp=0\lambda^p - \phi_1 \lambda^{p-1} - \cdots - \phi_p = 0 的根均在单位圆内(即 λj<1|\lambda_j| < 1),则模型平稳。
    • 等价地,特征多项式 ϕ(z)=1ϕ1zϕpzp\phi(z) = 1 - \phi_1 z - \cdots - \phi_p z^p 的根均在单位圆外。
  • 低阶判别

    • AR(1)AR(1)ϕ1<1|\phi_1| < 1
    • AR(2)AR(2)ϕ2±ϕ1<1\phi_2 \pm \phi_1 < 1ϕ2<1|\phi_2| < 1

MA 模型的定义

移动平均模型(Moving average model)记作 MA(q)MA(q),其形式为:

Xt=μ+εtθ1εt1θ2εt2θqεtq,θq0X_t = \mu + \varepsilon_t - \theta_1 \varepsilon_{t-1} - \theta_2 \varepsilon_{t-2} - \cdots - \theta_q \varepsilon_{t-q}, \quad \theta_q \neq 0

其中 {εt}\{\varepsilon_t\} 为白噪声。中心化后(μ=0\mu=0)可写成:

Xt=θ(B)εt,θ(B)=1θ1Bθ2B2θqBqX_t = \theta(B) \varepsilon_t, \quad \theta(B) = 1 - \theta_1 B - \theta_2 B^2 - \cdots - \theta_q B^q

MA 模型可逆性的定义

若一个 MAMA 模型能够表示为 AR()AR(\infty) 形式,则称该模型为可逆 MAMA 模型。即:

MA(q):Xt=θ(B)εtAR():1θ(B)Xt=εtMA(q): X_t = \theta(B) \varepsilon_t \quad \Rightarrow \quad AR(\infty): \frac{1}{\theta(B)} X_t = \varepsilon_t

可逆性保证了模型参数可由自相关函数唯一确定。

如何判别 MA 模型的可逆性?

可逆性条件与 ARAR 模型的平稳性条件对称:

  • 特征根判别:移动平均特征方程 λqθ1λq1θq=0\lambda^q - \theta_1 \lambda^{q-1} - \cdots - \theta_q = 0 的根均在单位圆内(或特征多项式 θ(z)=0\theta(z)=0 的根在单位圆外)。

  • 低阶可逆域

    • MA(1)MA(1)θ1<1|\theta_1| < 1
    • MA(2)MA(2)θ2<1|\theta_2| < 1θ2±θ1<1\theta_2 \pm \theta_1 < 1

ARMA 模型的定义

自回归移动平均模型(Autoregressive moving average model)记作 ARMA(p,q)ARMA(p,q),其形式为:

Xt=ϕ0+ϕ1Xt1++ϕpXtp+εtθ1εt1θqεtq,ϕp0,  θq0X_t = \phi_0 + \phi_1 X_{t-1} + \cdots + \phi_p X_{t-p} + \varepsilon_t - \theta_1 \varepsilon_{t-1} - \cdots - \theta_q \varepsilon_{t-q}, \quad \phi_p \neq 0,\; \theta_q \neq 0

中心化后(ϕ0=0\phi_0=0)可写成:

ϕ(B)Xt=θ(B)εt\phi(B) X_t = \theta(B) \varepsilon_t

其中 ϕ(B)=1ϕ1BϕpBp\phi(B)=1-\phi_1 B-\cdots-\phi_p B^pθ(B)=1θ1BθqBq\theta(B)=1-\theta_1 B-\cdots-\theta_q B^q

如何判别 ARMA 模型的平稳性和可逆性?

  • 平稳性:仅由自回归部分决定,即 ϕ(B)=0\phi(B)=0 的根均在单位圆外(或特征方程根在单位圆内)。

  • 可逆性:仅由移动平均部分决定,即 θ(B)=0\theta(B)=0 的根均在单位圆外(或特征方程根在单位圆内)。

AR 模型、MA 模型和 ARMA 模型的 ACF 和 PACF 性质

模型类型自相关函数(ACF)偏自相关函数(PACF)
AR(p)AR(p)拖尾(指数衰减)pp 阶截尾
MA(q)MA(q)qq 阶截尾拖尾
ARMA(p,q)ARMA(p,q)拖尾拖尾
  • 拖尾:以指数阶收敛到 00,具有短期相关性。
  • 截尾:超过某阶后恒为 00

第四章 平稳时间序列分析

Box-Jenkins 法的建模步骤

根据Box-Jenkins方法,建模分为以下四步:

  1. 模型识别

    • 通过平稳性检验(时序图、自相关图、单位根检验)判断序列是否平稳
    • 利用ACF、PACF、AIC、BIC等选择模型阶数。
  2. 参数估计:利用样本数据估计模型参数,常用方法包括矩估计、最小二乘估计、极大似然估计。

  3. 诊断性检验:检验模型的合理性并进行必要修正

    • 包括残差分析过度拟合
    • 如果检验不通过,则回到第1步模型识别。
  4. 预测:利用通过检验的模型进行预测分析。预测标准:均方误差最小

单位根检验的理论基础

在ARMA(p,q)(p,q)模型中,序列平稳的条件是自回归特征方程的根均在单位圆内(等价地,自回归特征多项式的根均在单位圆外)。

若存在单位根(即特征根为1),则序列非平稳

DF 检验和 ADF 检验通过检验自回归系数是否等于 1 来判断是否存在单位根。

ADF 检验的过程

ADF检验基于以下三种回归模型:

  • 模型1(无漂移项):Xt=ρXt1β1Xt1βp1Xtp+1+εt\nabla X_t = \rho X_{t-1} - \beta_1 \nabla X_{t-1} - \cdots - \beta_{p-1} \nabla X_{t-p+1} + \varepsilon_t
  • 模型2(带漂移项):Xt=α+ρXt1β1Xt1βp1Xtp+1+εt\nabla X_t = \alpha + \rho X_{t-1} - \beta_1 \nabla X_{t-1} - \cdots - \beta_{p-1} \nabla X_{t-p+1} + \varepsilon_t
  • 模型3(带时间趋势):Xt=α+βt+ρXt1β1Xt1βp1Xtp+1+εt\nabla X_t = \alpha + \beta t + \rho X_{t-1} - \beta_1 \nabla X_{t-1} - \cdots - \beta_{p-1} \nabla X_{t-p+1} + \varepsilon_t

检验步骤:

  1. 根据序列特征选择模型(有明显趋势选模型3,有非零均值无趋势选模型2,均值近零选模型1)。
  2. 选择滞后阶数(如AIC、BIC)。
  3. 检验原假设 H0:ρ=0H_0: \rho = 0(单位根)。若拒绝,则序列平稳;否则非平稳。
  4. 若无法拒绝,可进行联合假设检验(如 α=0,ρ=0\alpha=0,\rho=0 等)以判断是否为带漂移趋势的单位根过程。

实际操作中常按 模型3模型2模型1模型3→模型2→模型1 的顺序依次检验,避免模型误设。

什么是 AIC?

AIC 的全称是赤池信息准则(Akaike Information Criterion)。 它由日本统计学家赤池弘次提出。

AIC 的原理是基于信息论,用来衡量模型拟合数据时丢失的信息量

它的计算公式由两部分组成:

  • 第一部分是两倍的模型未知参数个数,用来惩罚模型的复杂度;
  • 第二部分是负的两倍极大似然函数值,用来衡量模型的拟合精度。
AIC=2L(θ^)+2kAIC = -2L(\hat{\theta}) + 2k

在选择模型时,AIC 的值越小,说明模型越好。这意味着该模型用较少的参数达到了较好的拟合效果。

什么是 BIC?

BIC 的全称是贝叶斯信息准则(Bayesian Information Criterion)。 它是在贝叶斯理论框架下推导出来的。

与 AIC 类似,BIC 也是通过引入惩罚项来限制参数数量,从而防止过度拟合。

它的计算公式同样包含参数个数的惩罚项和似然函数项,不同的是,BIC 的惩罚项不仅考虑了参数个数,还引入了样本容量的对数值

BIC=2L(θ^)+log(n)kBIC = -2L(\hat{\theta}) + \log(n)k

在选择模型时,BIC 的值同样是越小越好

过差分的定义及缺点

定义:过差分是指在序列平稳化过程中,差分阶数超过了消除单位根所需的最低次数。

缺点

  • 损失信息(样本量减少)。
  • 给序列带来不必要的相关性,使建模过程复杂化
    • 例如,随机游走的一阶差分已是白噪声,若再取二阶差分则变为MA(1)模型,模型复杂度增加。

如何选择 AR 模型、MA 模型以及 ARMA 模型的阶数?

  • 利用ACF和PACF

    • AR(p)AR(p):PACF在pp阶后截尾(ϕ^kk\hat{\phi}_{kk}k>pk>p时落在±1.96/n\pm 1.96/\sqrt{n}内),ACF拖尾。
    • MA(q)MA(q):ACF在qq阶后截尾(ρ^k\hat{\rho}_kk>qk>q时落在±1.96/n\pm 1.96/\sqrt{n}内),PACF拖尾。
    • ARMA(p,q)ARMA(p,q):ACF和PACF均拖尾。
  • 利用信息准则:AIC =2L(θ^)+2k= -2L(\hat{\theta}) + 2k,BIC =2L(θ^)+log(n)k= -2L(\hat{\theta}) + \log(n)k。选择AIC或BIC最小的模型。AIC侧重预测,BIC侧重识别真实模型。

AR 模型、MA 模型和 ARMA 模型所适用的估计方法

模型类型适用的估计方法
AR(p)AR(p)矩估计(Yule-Walker估计)、条件最小二乘、条件极大似然、精确极大似然、无条件最小二乘
MA(q)MA(q)矩估计(效率较低,不建议)、条件最小二乘、条件极大似然、精确极大似然、无条件最小二乘
ARMA(p,q)ARMA(p,q)矩估计(效率较低,不建议)、条件最小二乘、条件极大似然、精确极大似然、无条件最小二乘

在大样本下,最小二乘估计(条件或无条件)与极大似然估计(条件或精确)渐近等价。

5种估计方法的定义

矩估计(Yule-Walker估计)

  • 定义:利用样本自相关函数代替总体自相关函数,代入 ARAR 模型的YuleWalkerYule-Walker 方程,求解得到自回归系数的估计量。

  • 特点:主要适用于 ARAR 模型,也称为 YuleWalkerYule-Walker 估计。对于MA或ARMA模型,矩估计效率较低,不建议使用。

条件最小二乘估计

  • 定义:在给定初始观测值的条件下,最小化条件平方和(即残差平方和),得到参数的估计量。

  • 特点:适用于 ARMAARMAAR、MA、ARMA 模型。计算时需设定初始值(如残差初始值设为0)。

条件极大似然估计

  • 定义:以初始观测值初始扰动项为条件,最大化条件似然函数,得到参数的估计量。

  • 特点:在正态白噪声假设下,条件极大似然估计与条件最小二乘估计等价。

精确极大似然估计

  • 定义:通过最大化观测序列的联合概率密度函数来估计参数。将初始值视为随参数变化的随机变量,而非固定常数。

  • 特点:计算更精确,但较复杂。在正态分布下,与无条件最小二乘估计有密切关系。

无条件最小二乘估计

  • 定义:通过最小化“无条件平方和”(考虑不可观测的历史扰动对当前序列的影响)来估计参数。

  • 特点:需要将 ARMAARMA 模型转化为状态空间形式,通过卡尔曼滤波递归计算。在正态分布下,与精确极大似然估计渐近等价。

在 Box-Jenkins 法的诊断性检验中,残差分析包含哪些内容?

残差分析主要包括:

  1. 残差时序图:标准化残差应围绕零水平线波动,波动幅度稳定。
  2. 白噪声检验
    • 观察ACF图:样本自相关函数应落在±1.96/n\pm 1.96/\sqrt{n} 内(两条虚线内)。
    • Box-Pierce检验:Q=nk=1mρ^k2χm2Q = n\sum_{k=1}^{m}\hat{\rho}_k^2 \sim \chi^2_m
    • Ljung-Box检验(小样本修正):LB=n(n+2)k=1mρ^k2nkχm2LB = n(n+2)\sum_{k=1}^{m}\frac{\hat{\rho}_k^2}{n-k} \sim \chi^2_m
  3. 残差正态性:通过Q-Q图判断,若样本分位数与标准正态分位数大致呈线性关系,则近似正态。

在 Box-Jenkins 法的诊断性检验中,过度拟合应遵循哪些原则?

过度拟合是指在一个已拟合的模型基础上,拟合一个更一般的嵌套模型(如AR(2)→AR(3))

以检验原模型的充分性。应遵循以下原则:

  1. 在拟合更复杂模型之前,先对原始模型进行充分诊断

  2. 通常不建议同时增加 ARARMAMA 部分的阶数。

  3. 模型扩展应依据残差分析结果进行。

    • 例如,若 MA(1)MA(1) 残差的 ACFACF22阶 截尾而 PACFPACF 拖尾,应优先考虑 MA(2)MA(2),而非 ARMA(1,1)ARMA(1,1)
  4. 结合 AICBICAIC、BIC 等信息准则对备选模型进行综合评估与筛选。


第五章 非平稳时间序列分析

非平稳时间序列中趋势的主要类型及其对应的平稳化建模方法

  • 确定性趋势:序列趋势表现为关于时间的确定性函数,如 Xt=α+βt+YtX_t = \alpha + \beta t + Y_tYtY_t为零均值平稳序列)。

    • 建模方法:先通过回归分析时间序列分解指数平滑法去除确定性趋势,再对残差构建 ARMAARMA 模型。
  • 随机趋势(隐含于差分变换中):如随机游走。

    • 建模方法:通过差分变换Xt=XtXt1\nabla X_t = X_t - X_{t-1})实现平稳化。

在无季节效应的非平稳序列分析中,平稳化的常用手段有哪些,它们分别适用于哪些情形?

  • 差分变换:适用于消除趋势(尤其是随机趋势),使序列平稳。
  • 对数变换:适用于序列存在异方差性(波动随序列值增大而增大)且序列值均为正的情形。对数变换可稳定方差,若变换后仍有趋势,则需进一步差分。

ARIMA 模型的定义

  • ARIMA(p,d,q)模型:经过 dd 阶差分后,序列成为平稳的 ARMA(p+d,q)ARMA(p+d,q) 模型。

  • 其性质为:特征方程有 p+dp+d 个特征根,其中 pp 个在单位圆内,dd 个在单位圆上。

  • 特殊情形:

    • d=0d=0 时为ARMA(p,q);
    • p=0p=0 时为IMA(d,q);
    • q=0q=0 时为ARI(p,d)。
  • 常用表达式:ϕ(B)dXt=θ(B)εt\phi(B)\nabla^d X_t = \theta(B)\varepsilon_t,其中 d=(1B)d\nabla^d = (1-B)^d

非平稳时间序列中季节成分的主要类型及其对应的平稳化建模方法

  • 确定性季节成分:季节成分表现为关于时间的确定性周期函数,如 Xt=μt+YtX_t = \mu_t + Y_tμt=μts\mu_t = \mu_{t-s}

    • 建模方法:先通过回归分析时间序列分解指数平滑法去除确定性季节成分,再对残差构建ARMA模型。
  • 随机季节成分:季节成分源于随机冲击在季节尺度上的持续性累积,如 St=Sts+etS_t = S_{t-s} + e_t

    • 建模方法:通过季节差分 sXt=XtXts\nabla_s X_t = X_t - X_{t-s} 实现平稳化。

在有季节效应的非平稳时间序列分析中,平稳化的常用手段有哪些,它们分别适用于哪些情形?

  • 去除确定性季节成分(回归、分解等):适用于确定性季节模式。
  • 季节差分s\nabla_s):适用于随机季节成分(季节随机游走)。
  • 一阶差分与季节差分的结合s\nabla \nabla_s):当同时存在随机趋势和随机季节成分时使用。
  • 对数变换:适用于序列存在异方差或呈现指数型/快速增长趋势的情形。

乘法季节 ARMA 模型的定义

  • 乘法季节ARMA(p,q)×(P,Q)sARMA(p,q)×(P,Q)_s 模型定义为:
ϕ(B)Φ(B)Xt=θ(B)Θ(B)εt\phi(B)\Phi(B)X_t = \theta(B)\Theta(B)\varepsilon_t

其中:

  • ϕ(B)=1ϕ1BϕpBp\phi(B)=1-\phi_1 B-\cdots-\phi_p B^pθ(B)=1θ1BθqBq\theta(B)=1-\theta_1 B-\cdots-\theta_q B^q(非季节部分);
  • Φ(B)=1Φ1BsΦPBPs\Phi(B)=1-\Phi_1 B^s-\cdots-\Phi_P B^{Ps}Θ(B)=1Θ1BsΘQBQs\Theta(B)=1-\Theta_1 B^s-\cdots-\Theta_Q B^{Qs}(季节部分)。
  • 该模型可看作ARMA(p+Ps,q+Qs)(p+Ps,\, q+Qs)的特例。

乘法季节 ARIMA 模型的定义

  • 乘法季节 ARIMA(p,d,q)×(P,D,Q)sARIMA(p,d,q)×(P,D,Q)_s 模型定义为:
ϕ(B)Φ(B)dsDXt=θ(B)Θ(B)εt\phi(B)\Phi(B)\nabla^d \nabla_s^D X_t = \theta(B)\Theta(B)\varepsilon_t

其中:

  • d=(1B)d\nabla^d = (1-B)^ddd 阶差分,sD=(1Bs)D\nabla_s^D = (1-B^s)^DDD 阶季节差分;
  • dsDXt\nabla^d \nabla_s^D X_t 为经过差分和季节差分后的平稳序列,该序列服从SARMA(p,q)×(P,Q)sSARMA(p,q)×(P,Q)_s 模型。

Thanks for reading!

时间序列-简答

周六 5月 23 2026
7009 字 · 37 分钟

Comments

cover

青山绿野

渡边 雅二