自回归模型(Autoregressive Model,简称AR模型)是最常见的稳态时序模型之一。 其次介绍了AR模型的定义、统计性质、建模过程、预测和应用。
一.引入AR模型
考虑如图的单摆系统。 将xt作为第t次摆动中的振幅。 根据物理原理,第t次振幅xt由上次的振幅xt-1决定,即有xt=a1xt-1。 考虑到空气振动的影响,我们经常假设
(1) ) ) )。
这里,随机干扰t~n(0,2 )。
设初始时刻x0=1,取现在不同的a1和的值进行实验。 实验结果如下图所示。
可见,参数a1对序列的稳定性起决定性作用,噪声强度2决定序列的波动程度。
现在,模型(1)称为第一层自回归模型。 更一般地,序列值xt被定义为前p个时间点序列值和当前噪音表,即
(2) ) ) )。
其中,aj是参数,{t}是白噪声。 这里使用Xt而不是Xt来表示序列值是随机变量。
二. AR模型的定义定义 1
如果t )为白噪声,并且根据n(0,2 ),a0,a1,AP(AP0 )为实数,则被称为p阶差分方程
(3) ) )。
是简称为ar(p )模型的p阶自回归模型,是http://www.Sina.com/=(a0,a1,ap ) t为ar ) p )模型的自回归系数。 将满足ar(p )模型)3)的时间序列(XT )称为ar(p )序列。 在a0=0情况下,称为平均值为零的ar(p )序列,即
(4) ) )。
另外,关于a00的情况,可以用零平均化的手段使一般的AR(P )排列成为零平均AR(P )排列。
三、AR序列的建模对于给定的时间序列{Xt},我们最关注如何对其进行建模。 一般来说,平滑序列的建模过程可由下图中的流程图表示。
对a序列进行白噪声检查,如果通过检查判定序列为白噪声,则建模结束; 否则进入步骤2。
对步骤 1序列进行平滑性检查,在检查结果判定为非平滑的情况下,进行序列的平滑化处理,转移到步骤1; 否则进入步骤3。
http://识别www.Sina.com /模型,估计其参数,转移到步骤4。
步骤 2检验模型适用性,检验合格,即可得到拟合模型并预测序列; 否则进入步骤3。
这里,不介绍白噪声检查、平滑性检查、平滑化处理。 有时间写两篇这方面的博文。
(一) AR模型的判定
对于观测到的时间序列,在白噪声检查中判定为非白噪声,稳态检查判定为稳态后,我们往往根据相关系数和偏相关系数识别模型。
这部分的主要任务是判断该问题是否应用于AR模型建模,以及粗略确定阶数p。
可以通过以下代码计算自相关系数(Autocorrelation Function,SAF )和偏自相关系数(Partial Autocorrelation Function,PACF ) :
fromstatsmodels.TSA.stattoolsimportacf,pacf# pacf计算偏自相关系数# acf计算自相关系数时间序列满足以下两个条件时
ACF具有拖尾性,ACF(k )在k大于某个常数后,始终不会变为0。 PACF具有PACF(k )在kp时为0的切片性。 第二个条件也可以用于确定阶数p。 考虑到随机误差的存在,PACF在p阶延迟之后并不严格地为0,而是在0附近的较小范围内变化。 具体来说
设k次的偏自相关系数为ak,如果次数大于p的大部分偏自相关系数满足下式,则AR模型的次数取p。
(5) ) )。
其中,n表示样本序列长度。
例如,如果模型Xt=0.9Xt-1-0.3Xt-2 t,则ACF和PACF将为:
因为可以认为自相关系数显示出一定的周期性,所以判定为拖尾; 自相关系数2步后切片。 因此,我们尝试使用ar(2)模型进行建模。
(二) AR模型的参数估计
AR模型的参数估计主要有矩估计、最yxdbm乘法估计和最大似然估计三种方法。
这里只介绍最yxdbm乘方报价。 (实际最大似然估计与最大yxdbm平方估计的结果相同)
对于采样序列{xt},在jp 1情况下,白噪声j的估计值为
(6) ) )。
通常称为步骤 3。 我们的优化目标是将残差平方和
(7)
达到最小。我们称使上式达到最小的 为 AR(p) 模型中自回归系数 的估计。
记
得到如下线性方程组
(8)
于是式 (7) 的目标函数可表示为
(9)
上式对参数 求导并令其为 0,可得
(10)
因此,参数 的最yxdbm乘估计为
(11)
此时,误差方差的最yxdbm乘估计
(12)
(三) AR 模型的定阶
在对 AR 模型识别时,根据其样本偏自相关系数的截尾步数,可初步得到 AR 模型的阶数 p。然而,此时建立的 AR(p) 未必是最优的。一个好的模型通常要求残差序列方差较小,同时模型页相对简单,即要求阶数较低。因此我们需要一些准则来比较不同阶数的模型之间的优劣,从而确定最合适的阶数。下面给出两种常用的定阶准则。
1. FPE 准则
最终预报误差(Final Prediction Error)准则,简称为 FPE 准则,其判据就是最终预报误差最小。设 AR(p) 为拟合模型, 是序列的各阶样本自协方差函数,其最终预报误差可表示为
(13)
在具体应用时,通常是分别建立从低阶到高阶的 AR 模型,并计算出相应的 FPE
的值,由此确定使 FPE 达到最小的 p 值。
2. 贝叶斯信息准则
定义
(14)
使得 BIC 达到最小值的 p 即为该准则下的最优 AR 模型的阶数。
(四) AR 模型的检验
在模型拟合之后需要进行模型的检验,主要分为两部分
有效性检验:检验拟合模型对序列中信息的提取是否充分显著性检验:检验模型中的个参数是否显著为 0,从而判断拟合魔心是否可以进一步简化。1. 模型的有效性检验
一个好的拟合模型应该能够提取观测值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列。因此,模型的有效性检验即为残差序列的白噪声检验。如果残差序列是白噪声,那么理论赏其延迟任意阶的自相关系数为 0,考虑数据的偏差,那么绝大多数应该在 0 附近的范围内,通常在 95% 的置信水平(2倍标准差)以内。
2. 参数的显著性检验
这一部分的目标是,删除那些不显著参数使模型结构最为精简。对于模型参数 aj(j=1,...,p) 的检验,其原假设和备择假设分别为
(15)
检验统计量为 t 统计量:
(16)
在给定的显著水平 α 下,当检验统计量 T 大部分位于分点 t1-α/2,或该统计量的 P 值小于 α 时,则可以以 1-α 的置信水平拒绝原假设,
认为模型参数显著。反之,则不能显著拒绝参数为 0 的假设。
[1] 安详的玉米,现代的夏天,兴奋的可乐. 时间序列分析及应用. 高等教育出版社. 2015.