此前篇章:
一、差分运算
差分运算的定义:差分运算是一种将非平稳时间序列转换为平稳时间序列的常用方法。
p阶差分:对于一个时间序列 {Xt},其一阶差分序列为 ;二阶差分序列是在一阶差分的基础上再次进行一阶差分,二阶差分序列为
,以此类推得到p阶差分。
作用:可以消除时间序列中的趋势和季节性成分,使其满足平稳性的要求,从而可以应用平稳时间序列的分析方法进行建模和预测。例如,对于一个具有线性趋势的时间序列,经过一阶差分后,通常可以消除趋势的影响,使其均值、方差等统计特性在时间上保持稳定。
二、延迟算子
延迟算子的定义:延迟算子 L 是一种用于表示时间序列滞后值的算子,定义为 ,即 L 作用于 Xt 上,得到的是 Xt 的前一期值。一般地,
,表示 Xt 的前 k 期值。
作用: 延迟算子可以方便地表示时间序列模型中的滞后项,简化模型的表达式。
三、线性差分方程
这部分内容涉及到线性代数的相关知识。简单提一提,了解一下。
定义:线性差分方程是描述时间序列与其过去值和过去误差项之间线性关系的方程。
一般形式:,其中h(t)为关于 t 的函数,a为常数。
齐次方程:等式右边为零,解由特征根决定。
非齐次方程:包含外部项(如白噪声 ϵt),解为齐次解与特解之和。
3.1 齐次线性差分方程的解
形式:
假设解为指数形式 ,得到其特征方程:
这是一个p次线性方程,应该有p个非零根,称为特征方程的特征根,假设为 r1、r2、...、rp。
特征方程:特征方程是通过将给定的方程转换成多项式方程来帮助我们找到解的一个工具。
特征根 ≠ 方程的解:
特征根是解的基底参数:特征根本身不是方程的解,但通过特征根可以构造出齐次方程的通解。
示例:AR(2)模型的特征方程为
,若得到两个实根 r1,r2,则齐次解为:
这里 r1,r2 是特征根,而通解是它们的线性组合。
根据特征根的类型构造通解:
所有根都为实根且无重根:每个实根 ri 对应一项 ,通解为:
重根(相同取值的根):若 r 是 k 重根,通解中包含多项式项为:
复根:复根(复数形式,包含实部和虚部)以共轭对形式出现 α±βii,转换为极坐标
,通解中包含的对应项为:
平稳性条件:齐次解中每个项的收敛性由特征根 ri 的模长 ∣ri∣ 决定
平稳性要求:特征根在单位圆内,即所有特征根的模长 ∣ri∣<1
当 ∣ri∣<1 时,
随时间指数衰减,序列趋于平稳。
若存在 ∣ri∣≥1,解会发散或震荡不衰减,导致非平稳。
特征根的作用
(1)确定解的数学形式
特征根决定了齐次解的形式(指数、三角函数等):
实根:解为指数函数的线性组合。对应指数增长或衰减的分量。
复根:解表现为阻尼震荡,
对应周期性波动,体现时间序列的周期行为。
重根:解包含多项式项,引入多项式时间项,如
,反映多重动态效应。
(2) 判断模型的平稳性
平稳性条件:当所有特征根的模(绝对值)严格小于1时(即位于复平面的单位圆内),齐次解会随时间指数衰减至零,系统趋于平稳。若存在特征根模≥1,解不收敛,序列非平稳,如随机游走。
应用场景:在拟合AR(p)或ARMA模型后,需检查特征根是否满足平稳性条件。例如,若特征方程有根接近单位圆(如 ∣r∣=0.95),序列可能呈现缓慢衰减的自相关性。
(3) 揭示时间序列的动态行为
衰减速率:特征根的模长决定序列记忆效应的持久性。模越接近0,衰减越快(短期记忆);模接近1,衰减越慢(长期记忆)。
周期性:复根对应的频率 ω 决定了序列的周期长度 T=2π/ωT=2π/ω。例如,季度数据可能对应 ω=π/2,周期 T=4T=4。
爆炸性或震荡性:模>1的根导致序列发散(如 r=1.1时,Xt 指数增长);复根的模>1则导致振幅递增的震荡。
为什么必须结合特征根分析?
数学必然性:无特征根则无法求解差分方程,更无法理解模型动态。
工程必要性:特征根是验证模型合理性(平稳性、可逆性)的核心工具。
解释性需求:通过特征根的位置和类型,可直观解释序列的周期性、趋势性及衰减模式。
预测与控制:特征根的衰减速率直接影响预测精度和置信区间,帮助优化模型选择。
3.2 非齐次线性差分方程的解
非齐次线性差分方程的形式为:
其中右边 h(t) 包含外部扰动项(如白噪声 ϵt)
通解的结构:
Xt = 齐次解(瞬态) + 特解(稳态)
齐次解:对应方程右边为零时的解(由特征根决定)。
特解:针对非齐次项 h(t) 构造的特殊解。
理解长期行为与短期动态:
- 长期行为:特解(由噪声驱动)主导稳态响应。
- 短期动态:齐次解(由初始条件驱动)反映瞬态响应,其衰减速率由特征根决定。
3.3 时间序列模型与线性差分方程的联系
核心工具:线性差分方程是AR、MA、ARMA等经典时间序列模型的数学基础。
动态特性:通过特征根分析,可判定序列的平稳性、周期性及衰减速率。
四、AR模型(自回归模型)
AR模型是时间序列分析中的核心模型之一,通过历史观测值的线性组合预测当前值。
模型的一般形式:AR(p) 模型表示当前值 Xt 与其前 p 个历史值的线性关系,加上随机扰动项(白噪声ϵt)
参数含义:
ϕ1,ϕ2,…,ϕp:自回归系数,反映过去值对当前值的影响。
p:模型阶数,表示依赖的历史步长。
ϵt:独立同分布的白噪声,均值为0,方差为 σ2。
一般形式下的特征方程:
自回归系数多项式
AR(p)模型的另一种模型形式(基于延迟算子),称为自回归系数多项式:
由
,AR(p) 模型可以写成:
忽略误差项,令 z = L,特征方程变为:
对比两种模型形式的特征方程,可以得到一条重要的性质:特征根(一般形式)和自回归系数多项式的根成倒数。
基于以上性质,由于特征根和自回归系数多项式的根成倒数关系,AR(p)模型平稳的等价条件是自回归系数多项式方程的所有根 z 的模长都大于1,即 ∣z∣>1(恰好相反)。
注:没提到 “自回归系数多项式” 时,模型默认用一般形式来定义。
4.1 AR模型的性质
(1)平稳性条件:AR(p) 模型的特征方程所有根的模长需严格小于1(位于单位圆内)。若根在单位圆内,历史影响随时间指数衰减,序列趋于平稳;若存在根在单位圆外,序列发散(非平稳)。
(2) 自相关函数(ACF)与偏自相关函数(PACF)【之前文章有讲】
ACF(拖尾性):
AR(p) 模型的自相关系数逐渐衰减至零,表现为拖尾(指数或震荡衰减)。
物理意义:所有历史值对当前值的间接影响随滞后阶数增加而减弱。
PACF(截尾性):
偏自相关系数在滞后 p 阶后突然截尾(接近零),这是识别 AR(p) 模型阶数的关键特征。
原因:PACF 消除了中间变量的影响,仅保留当前值和某一历史值的直接相关性。
4.2 AR(1) 和 AR(2) 的平稳域判别
平稳域方法是通过系数的约束条件来判别 AR 模型的平稳性,只适用于低阶模型。(推导过程略)
- 对于AR(1)模型,
平稳域条件为:
- 对于AR(2)模型,
平稳域条件为:
4.3 平稳AR(p)模型的统计特性
(1)均值:平稳 AR(p) 模型的均值是常数。
实际上,AR(p)模型可以再加上一个常数项:
平稳 AR(p) 模型的均值为常数,记为 μ ,计算公式为 :
推导过程如下, 对模型等式两边取期望:
由于期望是线性的,可以将其拆分:
由于过程是平稳的,所有时间点的期望值都相同,即 E[Xt−k]=μ,且对于白噪声,有 E[ϵt]=0,则:
最终得到结果:
(2)方差:平稳 AR(p) 模型的方差是有限且不依赖于时间的 。
# 文章如有错误,欢迎大家指正。我们下期再见叭