
时间序列-简答
时间序列简答题汇总
第一章 时间序列分析概述
什么是时间序列?
时间序列是在连续或等间隔的时间点上获得的一组观测数据。
频域分析方法和时域分析方法的区别。
频域分析方法(Spectral Analysis):频域分析方法关注时间序列中不同频率成分的相对重要性。其理论基础是傅里叶分析。
时域分析方法(Time-Domain Analysis):时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。从统计性质随时间是否保持不变的角度,可以划分为平稳时间序列和非平稳时间序列。
时间序列分析的目标。
- 描述历史行为:刻画序列随时间变化的特征与规律。
- 理解生成机制:分析时间序列变化背后的内在机理及影响因素。
- 预测与决策支持:对未来走势进行预测,为政策与管理决策提供依据。
- 监测与评估:检验政策或管理决策是否产生预期效果。
第二章 平稳时间序列简介
严平稳和弱平稳的定义及区别。
严平稳(Strictly Stationary):所有统计性质均不随时间的推移而改变的时间序列。
弱平稳(Weakly Stationary):又称宽平稳。要求序列满足:
- 常数均值;
- 常数方差;
- 任意两项之间的自协方差仅与时间间隔 相关,而与所处的时间 无关 。
区别:
- 通常情况下,严平稳能推出弱平稳,而弱平稳不能反推严平稳。
- 特例:服从柯西分布的严平稳序列就不是弱平稳序列;当序列服从多元正态分布时,弱平稳可以推出严平稳。
- 严平稳条件极苛刻,研究难度大;
- 弱平稳条件相对宽松。在实际应用中,通常所说的平稳性是指弱平稳 。
- 通常情况下,严平稳能推出弱平稳,而弱平稳不能反推严平稳。
自协方差函数和自相关函数的定义。
自协方差函数(Autocovariance Function, ACVF):定义为 ,描述了序列在滞后 阶下的相关强度 。
自相关函数(Autocorrelation Function, ACF):定义为滞后 阶的自协方差与方差的比值,即 。
平稳时间序列的统计性质。
常数均值:。
常数方差:。
自协方差与自相关系数只依赖于滞后阶数 :, 。
平稳时间序列的意义。
其统计特性不随时间变化,从而可以利用 同一序列 不同时间 的观测值,对总体的未知参数进行估计。
在平稳性检验中,时序图检验和自相关图检验的基本原理是什么?
时序图检验:平稳时间序列具有常数均值和常数方差,因此其时序图通常表现为围绕某一固定水平上下波动,且波动幅度相对稳定。
自相关图检验:平稳时间序列通常只具有短期相关性,即其自相关函数会随着滞后阶数的增加而较快地衰减至零。
白噪声序列的定义。
若时间序列 满足
,
则称 为白噪声序列,记作 。
白噪声序列的意义。
在时间序列建模中,白噪声通常作为误差项的理想形式出现。
从模型设定的角度看,如果误差项不是白噪声,则表明模型尚未充分刻画观测数据中的规律,误差项中仍可能包含尚未被充分解释的信息。
从统计推断角度看,白噪声性质为基于观测数据的估计与检验奠定了重要基础。具体而言,误差项的白噪声特性是参数估计具有一致性和渐近正态性的关键条件。
白噪声检验的基本原理。
如果序列是纯随机的,那么其所有的自相关系数 (除 外)都应接近于 。
通过卡方分布的统计量 ,检验在给定的显著性水平下,前 阶自相关系数是否显著不为 。
越大越拒绝原假设。
在白噪声检验中,如何选取滞后阶数 ?
覆盖可能的相关结构: 多数平稳序列的自相关主要集中在低阶滞后,因此 应至少覆盖短期自相关,以保证对潜在自相关结构的检验能力。
避免高阶噪声干扰: 当 过大时,高阶滞后自相关往往由噪声主导,可能掩盖低阶相关性,从而降低对短期相关性的检验效果。
逐步检验与综合判断: 在实际操作中,可从小到大选择多个 值(如 ),综合判断序列是否为白噪声。
第三章 平稳时间序列模型
AR 模型的定义
自回归模型(Autoregressive model)记作 ,其形式为:
其中 为白噪声序列。若 平稳且均值为 ,则可中心化为:
其中 。
延迟算子的性质
延迟算子 满足:
- 一般地,
- 差分运算:
- 一阶差分:
- 阶差分:
- 步差分:
- 若 且 平稳,则
如何判别 AR 模型的平稳性?
原则:
- 若 模型特征方程 的根均在单位圆内(即 ),则模型平稳。
- 等价地,特征多项式 的根均在单位圆外。
低阶判别:
- :
- : 且
MA 模型的定义
移动平均模型(Moving average model)记作 ,其形式为:
其中 为白噪声。中心化后()可写成:
MA 模型可逆性的定义
若一个 模型能够表示为 形式,则称该模型为可逆 模型。即:
可逆性保证了模型参数可由自相关函数唯一确定。
如何判别 MA 模型的可逆性?
可逆性条件与 模型的平稳性条件对称:
特征根判别:移动平均特征方程 的根均在单位圆内(或特征多项式 的根在单位圆外)。
低阶可逆域:
- :
- : 且
ARMA 模型的定义
自回归移动平均模型(Autoregressive moving average model)记作 ,其形式为:
中心化后()可写成:
其中 ,。
如何判别 ARMA 模型的平稳性和可逆性?
平稳性:仅由自回归部分决定,即 的根均在单位圆外(或特征方程根在单位圆内)。
可逆性:仅由移动平均部分决定,即 的根均在单位圆外(或特征方程根在单位圆内)。
AR 模型、MA 模型和 ARMA 模型的 ACF 和 PACF 性质
| 模型类型 | 自相关函数(ACF) | 偏自相关函数(PACF) |
|---|---|---|
| 拖尾(指数衰减) | 阶截尾 | |
| 阶截尾 | 拖尾 | |
| 拖尾 | 拖尾 |
- 拖尾:以指数阶收敛到 ,具有短期相关性。
- 截尾:超过某阶后恒为 。
第四章 平稳时间序列分析
Box-Jenkins 法的建模步骤
根据Box-Jenkins方法,建模分为以下四步:
模型识别:
- 通过平稳性检验(时序图、自相关图、单位根检验)判断序列是否平稳
- 利用ACF、PACF、AIC、BIC等选择模型阶数。
参数估计:利用样本数据估计模型参数,常用方法包括矩估计、最小二乘估计、极大似然估计。
诊断性检验:检验模型的合理性并进行必要修正
- 包括残差分析、过度拟合
- 如果检验不通过,则回到第1步模型识别。
预测:利用通过检验的模型进行预测分析。预测标准:均方误差最小
单位根检验的理论基础
在ARMA模型中,序列平稳的条件是自回归特征方程的根均在单位圆内(等价地,自回归特征多项式的根均在单位圆外)。
若存在单位根(即特征根为1),则序列非平稳。
DF 检验和 ADF 检验通过检验自回归系数是否等于 1 来判断是否存在单位根。
ADF 检验的过程
ADF检验基于以下三种回归模型:
- 模型1(无漂移项):
- 模型2(带漂移项):
- 模型3(带时间趋势):
检验步骤:
- 根据序列特征选择模型(有明显趋势选模型3,有非零均值无趋势选模型2,均值近零选模型1)。
- 选择滞后阶数(如AIC、BIC)。
- 检验原假设 (单位根)。若拒绝,则序列平稳;否则非平稳。
- 若无法拒绝,可进行联合假设检验(如 等)以判断是否为带漂移或趋势的单位根过程。
实际操作中常按 的顺序依次检验,避免模型误设。
什么是 AIC?
AIC 的全称是赤池信息准则(Akaike Information Criterion)。 它由日本统计学家赤池弘次提出。
AIC 的原理是基于信息论,用来衡量模型拟合数据时丢失的信息量。
它的计算公式由两部分组成:
- 第一部分是两倍的模型未知参数个数,用来惩罚模型的复杂度;
- 第二部分是负的两倍极大似然函数值,用来衡量模型的拟合精度。
在选择模型时,AIC 的值越小,说明模型越好。这意味着该模型用较少的参数达到了较好的拟合效果。
什么是 BIC?
BIC 的全称是贝叶斯信息准则(Bayesian Information Criterion)。 它是在贝叶斯理论框架下推导出来的。
与 AIC 类似,BIC 也是通过引入惩罚项来限制参数数量,从而防止过度拟合。
它的计算公式同样包含参数个数的惩罚项和似然函数项,不同的是,BIC 的惩罚项不仅考虑了参数个数,还引入了样本容量的对数值。
在选择模型时,BIC 的值同样是越小越好。
过差分的定义及缺点
定义:过差分是指在序列平稳化过程中,差分阶数超过了消除单位根所需的最低次数。
缺点:
- 损失信息(样本量减少)。
- 给序列带来不必要的相关性,使建模过程复杂化。
- 例如,随机游走的一阶差分已是白噪声,若再取二阶差分则变为MA(1)模型,模型复杂度增加。
如何选择 AR 模型、MA 模型以及 ARMA 模型的阶数?
利用ACF和PACF:
- :PACF在阶后截尾(在时落在内),ACF拖尾。
- :ACF在阶后截尾(在时落在内),PACF拖尾。
- :ACF和PACF均拖尾。
利用信息准则:AIC ,BIC 。选择AIC或BIC最小的模型。AIC侧重预测,BIC侧重识别真实模型。
AR 模型、MA 模型和 ARMA 模型所适用的估计方法
| 模型类型 | 适用的估计方法 |
|---|---|
| 矩估计(Yule-Walker估计)、条件最小二乘、条件极大似然、精确极大似然、无条件最小二乘 | |
| 矩估计(效率较低,不建议)、条件最小二乘、条件极大似然、精确极大似然、无条件最小二乘 | |
| 矩估计(效率较低,不建议)、条件最小二乘、条件极大似然、精确极大似然、无条件最小二乘 |
在大样本下,最小二乘估计(条件或无条件)与极大似然估计(条件或精确)渐近等价。
5种估计方法的定义
矩估计(Yule-Walker估计)
定义:利用样本自相关函数代替总体自相关函数,代入 模型的 方程,求解得到自回归系数的估计量。
特点:主要适用于 模型,也称为 估计。对于MA或ARMA模型,矩估计效率较低,不建议使用。
条件最小二乘估计
定义:在给定初始观测值的条件下,最小化条件平方和(即残差平方和),得到参数的估计量。
特点:适用于 模型。计算时需设定初始值(如残差初始值设为0)。
条件极大似然估计
定义:以初始观测值和初始扰动项为条件,最大化条件似然函数,得到参数的估计量。
特点:在正态白噪声假设下,条件极大似然估计与条件最小二乘估计等价。
精确极大似然估计
定义:通过最大化观测序列的联合概率密度函数来估计参数。将初始值视为随参数变化的随机变量,而非固定常数。
特点:计算更精确,但较复杂。在正态分布下,与无条件最小二乘估计有密切关系。
无条件最小二乘估计
定义:通过最小化“无条件平方和”(考虑不可观测的历史扰动对当前序列的影响)来估计参数。
特点:需要将 模型转化为状态空间形式,通过卡尔曼滤波递归计算。在正态分布下,与精确极大似然估计渐近等价。
在 Box-Jenkins 法的诊断性检验中,残差分析包含哪些内容?
残差分析主要包括:
- 残差时序图:标准化残差应围绕零水平线波动,波动幅度稳定。
- 白噪声检验:
- 观察ACF图:样本自相关函数应落在 内(两条虚线内)。
- Box-Pierce检验:。
- Ljung-Box检验(小样本修正):。
- 残差正态性:通过Q-Q图判断,若样本分位数与标准正态分位数大致呈线性关系,则近似正态。
在 Box-Jenkins 法的诊断性检验中,过度拟合应遵循哪些原则?
过度拟合是指在一个已拟合的模型基础上,拟合一个更一般的嵌套模型(如AR(2)→AR(3))
以检验原模型的充分性。应遵循以下原则:
在拟合更复杂模型之前,先对原始模型进行充分诊断。
通常不建议同时增加 和 部分的阶数。
模型扩展应依据残差分析结果进行。
- 例如,若 残差的 在 截尾而 拖尾,应优先考虑 ,而非 。
结合 等信息准则对备选模型进行综合评估与筛选。
第五章 非平稳时间序列分析
非平稳时间序列中趋势的主要类型及其对应的平稳化建模方法
确定性趋势:序列趋势表现为关于时间的确定性函数,如 (为零均值平稳序列)。
- 建模方法:先通过回归分析、时间序列分解或指数平滑法去除确定性趋势,再对残差构建 模型。
随机趋势(隐含于差分变换中):如随机游走。
- 建模方法:通过差分变换()实现平稳化。
在无季节效应的非平稳序列分析中,平稳化的常用手段有哪些,它们分别适用于哪些情形?
- 差分变换:适用于消除趋势(尤其是随机趋势),使序列平稳。
- 对数变换:适用于序列存在异方差性(波动随序列值增大而增大)且序列值均为正的情形。对数变换可稳定方差,若变换后仍有趋势,则需进一步差分。
ARIMA 模型的定义
ARIMA(p,d,q)模型:经过 阶差分后,序列成为平稳的 模型。
其性质为:特征方程有 个特征根,其中 个在单位圆内, 个在单位圆上。
特殊情形:
- 时为ARMA(p,q);
- 时为IMA(d,q);
- 时为ARI(p,d)。
常用表达式:,其中 。
非平稳时间序列中季节成分的主要类型及其对应的平稳化建模方法
确定性季节成分:季节成分表现为关于时间的确定性周期函数,如 ,。
- 建模方法:先通过回归分析、时间序列分解或指数平滑法去除确定性季节成分,再对残差构建ARMA模型。
随机季节成分:季节成分源于随机冲击在季节尺度上的持续性累积,如 。
- 建模方法:通过季节差分 实现平稳化。
在有季节效应的非平稳时间序列分析中,平稳化的常用手段有哪些,它们分别适用于哪些情形?
- 去除确定性季节成分(回归、分解等):适用于确定性季节模式。
- 季节差分():适用于随机季节成分(季节随机游走)。
- 一阶差分与季节差分的结合():当同时存在随机趋势和随机季节成分时使用。
- 对数变换:适用于序列存在异方差或呈现指数型/快速增长趋势的情形。
乘法季节 ARMA 模型的定义
- 乘法季节 模型定义为:
其中:
- ,(非季节部分);
- ,(季节部分)。
- 该模型可看作ARMA的特例。
乘法季节 ARIMA 模型的定义
- 乘法季节 模型定义为:
其中:
- 为 阶差分, 为 阶季节差分;
- 为经过差分和季节差分后的平稳序列,该序列服从 模型。