憔悴到了作中文综述的时候.
从统计学的角度看,时间序列分析是统计学的一个重要分支,是基于随机过程理论和数理统计学的重要方法和应用研究领域。 时间序列根据其统计特性可分为平稳序列和非平稳序列。 目前应用最多的是Box一JenkinS 模型建模法这是G.E.P.Box和英国统计学家G.M.JenkinS于1970年首次系统地提出的.Box一JenkinS方法比较完善优点是采用识别、估计和诊断ARMA模型的系统方法,只要建立准确的模型,确定模型的系数,就可以根据有限的数据集预测其发展。 其中,稳态时间序列中多使用ARMA模型,在非稳态时间序列模型中多通过取差分和对数等适当的变换变换变换为ARMA模型后进行模型化,这种模型Box的JenkinS被称为ARMA模型
参考链接:时间序列分析基础
一. 平稳时间序列模型
数据预处理:
数据预处理包括缺失值的补充、数据平滑及单位根检验。
平静
稳态是时间序列分析中重要的概念。 一般来说,我们认为一个时间序列是平稳的。 如果那个同时满足以下两个条件的话:
1 )平均函数是常数函数。
2 )自协方差函数只与时滞有关,与时间无关。
以上面的两个时间序列为例。 两个序列都满足条件1 ) ),标准正态分布白噪声和其形成的随机行走的平均函数都是值始终为0的常数函数。 让我们来看看条件2 )。 白噪声的自协方差函数可以表示为:
可知,s={10(t=s ) ) ts )只有在时滞为0的情况下值为1,其他全部为0,因此白噪声是稳定序列。
随机游动正如我们在上面分析的那样,其自协方差如下。
由于,s=t2明显是自协方差依赖于时间点,因此是非平稳序列。
以后可以看出,一般的时间序列分析多以平稳序列为对象,对于非平稳序列通过某种变换变为平稳。 例如,对于随机行走,其一阶差分序列是稳定的(显然,其一阶差分是白噪声)。
时间序列分析的主要统计量
请注意,时间序列中的每个元素都是普通的随机变量。 如果忽略序列的时间性,我们面对的实际上是随机变量的集合,所以从这个角度来说时间序列的统计分析和普通的统计分析没有很大的不同。 相关理论也是共通的。
对于一组随机变量,要完全描述其统计特性,需要处理其多元耦合分布,非常复杂。 因此,实际上,可能经常作出必要的简化假设,以便不处理复杂的多元联合分布。
假设有一个随机的时间序列
{Yt|t=0,1,2,}列出了常见的统计量。 然后,通过几个典型序列举例说明了如何计算每个统计量。
平均函数被定义为关于自变量t的函数:
t=e(Yt ) t的平均函数值表示时刻t处的随机变量yt的期望。
方差与平均值相似,方差是时刻t的系列要素的方差:
2t=e () ytt )2)自协方差自协方差是二元函数,其自变量是在两个时间点,值是在两个时间点的序列值的协方差。
,s=cov(yt,Ys )=e ) ) ytt ) Yss ) ) t=s时,自协方差是时刻t的方差。
自相关系数自相关系数是两个时间点值的相关系数。
忽略t,s=t,st,ts,s元素来自时间序列这一事实,各统计量的含义实际上与普通统计学相同。 因此,这些统计量的一些性质也可以无缝地扩展到时间序列分析中。 例如,期望的线性度等。 如果有必要的话,请自己复习一下关于这些统计量的计算性质。 后面的推导主要集中在这些统计量的计算上。
常见随机时间序列
常见的随机时间序列包括白噪声、布朗运动(随机行走)、
白噪声认为是各要素为独立同分布变量、平均值为0的时间序列。 这个时间序列叫做白噪声。 因为通过对这种序列的频域分析,发现其中每个频率都是平等的,与物理白光相似。
无模式是白噪声的模式,白噪声是随机性的完全体现,且根据白噪声无法发现任何模式。 这些代码包括:
y=ts(rnorm(100,mean=0,sd=1); plot(y,family='simhei ',main='白噪声',type='b ',col='red ' ); abline(h=0) )。
其中共计1
00个元素,每个元素都独立服从标准正态分布N(0,1)。可以从图中看出白噪声基本是在均值附近较为平均的随机震荡。由于每个元素服从N(0,1),所以均值μt=0,方差σ2t=1。又因为每个元素独立,所以对于任何t≠s,γt,s=0,ρt,s=0。这些统计特征与对图像的直观观察基本一致。
白噪声的重要之处在于很多其它的重要时间序列都可以通过它构造出来,这一点下文会看到。我们一般用e表示白噪声,将白噪声序列写作:
{e1,e2,…,et,…} 布朗运动下面考虑这样一个时间序列,其在t时刻的值是前面白噪声序列的前t个值之和,设{e1,e2,…,et,…}为标准正态分布产生的白噪声,则:
Y1Y2Yt==⋮=⋮e1e1+e2e1+e2+⋯+et布朗运动的模式在于其位置是连续曲线,但曲线的处处不可微。
Y = ts(rnorm(100, mean=0, sd=1)); for (i in 2:length(Y)) { Y[i] = Y[i] + Y[i-1]; } plot(Y, family="simhei", main="随机游走", type="b", col="red"); abline(h=0)
可以看到随机游走比白噪声平滑很多,并且呈现出一些“趋势性”的感觉。下面分析其相关统计特征。
均值:μt=E(e1+⋯+et)=E(e1)+⋯+E(et)=0
方差:σ2t=Var(e1+⋯+et)=Var(e1)+⋯+Var(et)=tσ2
对协方差的计算需要用到一个协方差性质:
Cov(∑i=1mciYi,∑j=1ndjYj)=∑i=1m∑j=1ncidjCov(Yi,Yj)设t小于s,由于只有i=j时Cov(Yi,Yj)=σ2,所以:
自协方差:γt,s=tσ2
自相关系数:ρt,s=tσ2tsσ4√=ts√
从统计性质可以看到,随机游走的“趋势性”实际是个假象,因为其均值函数一直是白噪声的均值,不存在偏离的期望。但是方差与时间呈线性增长并且趋向于无穷大,这意味着只要时间够长,随机游走的序列值可以偏离均值任意远,但期望永远在均值处。
物理与经济学中的很多现象都被看做是随机游走,例如分子的布朗运动,股票的价格走势等等。
从协方差和相关系数看,如果起点t固定,则越接近的点相关性越大,例如ρ1,2=0.707,ρ1,3=0.577,ρ1,4=0.500。同时,起点不同,时滞相同自相关系数也不同,越往后同时滞自相关系数越大,例如ρ2,3=0.816,ρ3,4=0.866。
实际上从纯数学角度可以将自相关系数看成一个二元函数,自变量是时间点t和时滞s-t。认识到这点很重要,因为它与时间序列分析中一个重要的概念——平稳性有着密切的关系。
二、AR、MA、ARMA模型
4、AR、MA、ARMA认是平稳时间序列最主要的参数模型. AR模型的正则方程是一组线形方程 ,而MA和ARMA模型是非线性方程.Word分解定理告诉我们任何有限方差的ARMA或MA平移过程可以用可能是无限阶的AR模型表达;同样,任何ARMA或AR模型可以用可能是无限阶的撇模型表达.因此,如果在这三个模型中选一个与信号不匹配的模型,但只要模型的阶足够高,它能够比较好地逼近被建模的随机过程.三种模型中AR模型具有一系列好的性能,因此,是研究最多并获得广泛应用的一种模型。
三、模型用于预测
1.AR(n)模型预测
利用n之前的p个值对x(。)作预测,称之为“前向预测”,记为:
上标f表示前向预测(forwardprediction)·凡(,)表示在t时刻m步前向预测。利用自相关法、Burg算法、协方差、改进的协方差法等方法得到模型的参数后,就可以进行前向预测,利用预测值递推可依次得到多步预测值
2.MA(q)、ARMA(p,q)模型预测
MA(q)、ARMA(p,q)的外推预测一般都是将磁(q)、ARMA(p,q)模型转换为相应的高阶AR模型,再AR模型的预测公式进行外推预测.
3.预测误差
预测误差公式为:
线性最小方差预测的方差和预测步长l有关,而与预测的时间原点t无关.预测 步长l越大,预测误差的方差也越大,因而预测的准确度就会降低.所以一般不能用AR、MA和ARMA模型作为长期预测模型.
四、非平稳时间序列模型
转载于:https://www.cnblogs.com/wishchin/p/9200080.html