首页 > 编程知识 正文

时间序列预测实例解析,时间序列预测模型是以历史数据分析

时间:2023-05-04 19:27:44 阅读:182952 作者:3223

1.定义

时间序列是一组与时间关联的数据序列。

2.分类

按照研究对象可分为一元时间序列、多元时间序列;

按照连续性可分为离散时间序列、连续时间序列;

按照统计特性分为平稳时间序列、非平稳时间序列。其中,序列概率分布与时间无关,则称该序列为狭义平稳时间序列;如果序列的一二阶矩存在,且对任意时刻满足:1.均值为常数;2.协方差为时间间隔的函数;则称该序列为广义平稳时间序列。

按照时间序列的分布规律可分为现实的镜子型时间序列、非现实的镜子型时间序列。

3.方法概述

时间序列的预测往往是以下几种预测手段的叠加或者耦合:

1.长期趋势变动,即变化具有总体趋势。

2.季节变动,即一年内随季节变化而有规律的周期变化。

3.循环变动,即几年内呈现出的周期性变化。

4.不规则变动,包含随机波动与不规则的突发性变化。

4.常用方法 4.1移动平均法

移动分析法包括:简单移动分析法、加权移动分析法、趋势移动分析法。主要是分析、预测序列的长期趋势用。

1.简单移动分析法,公式如下:

方程左边是t时刻的估计值,右边是t时刻前N个时刻的平均值。N的选定视问题而定,如果数据呈现一旦的周期性,那么就选为周期的时间点数;如果趋势变化不大,那么N相对可以大一些,反之则要取美好的太阳点。

衡量它预测程度好坏的指标用标准差:,由于计算是前N项的平均,所以对于序列开始的1--N项是没有值的,所以分母是T-N。

模型构成简单,适合平稳趋势,对于复杂情况难以预测,只能描绘大致趋势,不适合做长期预测。

2.加权移动分析法,公式如下:

其实就是1的拓展,1也可以视为2的特例——所有权系数取1。方程左边是对t+1时刻的预测,右边是t+1时刻前N个时刻的加权平均。权系数是人为确定,一般是近期取得大。

权系数的确定具有经验性的缺点,需要对模型有足够的了解。适合平稳趋势,也不太适合做长期的预测。

3.趋势移动分析法

公式1:

公式2:

公式3:

公式4:

公式3就是最终预测序列的函数,可以观察到序列的基本模型是线性的,因此适用于总体趋势为线性。

滞后性依然存在,而且相比于方法2而言,缺失项更多了(从0--2N项都是缺失的)。好处就是预测更加平滑。对于既有直线又有周期波动的趋势可以很好拟合。

4.2指数平滑法

指数平滑法包括:一次指数平滑法、二次指数平滑法,三次指数平滑法。

1.一次指数平滑法,公式如下:

这里说明一下:带^的都是估计量,不带^的是真实值。实际上这个公式就是4.2.1的一个延申,推导过程如下:

这里我们取N=1,并用Mt-1去估计yt-1,进一步整理得到:

然后1/N可替换成α,就得到了一次指数平滑的公式(Mt就是对yt的估计),至于它为什么叫一次指数平滑,是因为它的权系数呈现指数的特点。

改写一次指数平滑公式形式:从该式子可以看出α的实际意义——误差修正程度,α越大,模型越灵敏,反之则不。α的范围在0-1之间,如果数据较平稳,就可以选美好的太阳点,例如0.1-0.4,如果数据波动大,就可以选大一点,例如0.6-0.8。除了α的确定,这个模型中还要确定一个初始估计值y0,当数据量较大而前期又不是很重要的时候,y0可以选0,而如果数据量很少,就需要人为地选择一个合适的y0.

这种预测模型比较灵活,适合短期、长期的预测(由α确定)。

2.二次指数平滑法,公式如下:

推导过程如下:

其中S(2)t就是对yt时刻的估计。其实就是用了两次一次指数平滑,同移动趋势分析法相似的套路。

当时间序列呈现线性模型的特点时,使用一次指数平滑会出现“滞后误差”的现象。这里解释一下“滞后误差”,所谓误差就是估计的值与实际的值的差距,而这种差距在图像上表现为延迟,也就是说估计的图像变化要晚于实际的图像变化。而二次指数平滑修正了“滞后偏差”,它的详细推导过程是首先假定时间序列模型是线性的(这是根据已有数据做的判断),然后利用线性的模型假设推导出直线模型中a、b的参数,具体推导详见:https://wenku.baidu.com/view/11f087f5f90f76c661371a2e.html

3.三次指数平滑法,公式如下:

其实就是用了三次一次指数平滑法。具体推导过程同4.2.2。

适用于二次曲线模型的时间序列的预测,也是修正了滞后误差。

总结起来,二次、三次指数平滑法都可以一定程度地减小滞后误差,但是都又限定了适用范围。

4.3差分指数平滑法

分为一阶差分指数平滑法、二阶差分指数平滑法。

1.一阶差分指数平滑法,公式如下:

其推导过程如下:

其中,▽代表差分。为了估计yt+1,将差分项套用一次指数平滑,就得到了一阶差分指数平滑。

适用于直线模型的时间序列预测,且能较好地减小滞后偏差。

2.二阶差分指数平滑法,公式如下:

推导过程如下:

显而易见,二阶差分指数平滑就是将二阶差分项、一阶差分项套用一次指数平滑。

适用于二次曲线模型的时间序列预测,且能较好地减小滞后误差。

总结起来,差分指数平滑法能更好地消除滞后偏差的问题,缺点在于适用范围限定了。这种方法下,初始值的选取问题也被改善。这点在公式中可以体现出来,比如二阶差分中,yt+1的估计量很大程度依赖于yt的真实量。

4.4自适应滤波法

自适应滤波法公式如下:

这个公式就像是抄的4.1.2的公式一样。但是它改进的地方在于,它的权系数的确定是有依据的:通过不断地调整权系数以使得预测误差减少,直到得到一个“最佳”的权系数。权系数更新公式如下:

其中,公式左边是更新后的第i项权系数wi,公式右边分别是更新前的权系数wi,学习常数k,yt+1的预测误差ei+1,wi权系数对应的项yt-i+1.

尽管权系数可以计算得出,向前计算项数N与学习常数k仍需要人为确定。一般的,N选为周期数,10个点一个变化周期,那么就取N=10;k一般取为1/N。这两个参数的取值都不是绝对的,也就是说具有偶然性。

自适应滤波法有点1层神经网络的味道,但是与神经网络区别在于,自适应滤波的输入包含了输出。自适应滤波法由于实现方式简单,方便计算机实现,因此也被广泛使用。

4.5平稳时间序列模型

分为自回归模型(Auto Regressive)、移动平均模型(Moving Average)、自回归移动平均模型(Auto Regressive Moving Average)。

1.自回归模型(AR(p)),公式如下:

 

2.移动平均模型(MA(q)),公式如下:

其中Xt被认为与t时刻之前的m个噪声量有线性关系。

3.自回归移动平均模型(ARMA(p,q)),公式如下:

 

以上三个模型的求解以及推导不久后我会后续列出。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。