一、简介1 .本篇博文是线性回归的基本操作; 时间序列的稳定性检验、协调性检验和误差修正模型(在下一篇博文中继续传送门)等博文。
2 .博主是个普通的大学生,没有很好的技术,写的内容很简单,靠的是不太像样的drdxf,写的也是自己在消化了学校教过的知识后的见解,不是学术研究的博文。
3 .配置: window 7旗舰64位操作系统stataic14(64-bit ) ) ) ) ) ) ) ) ) window 7旗舰64位操作系统
二、数据描述性统计分析1 .导入数据(1)打开StataIC软件,在软件顶部栏中找到下图圈出的图标。 该图标是导入数据的入口
)2)点击后,StataIC软件会弹出另一个窗口放入数据。 如下图所示。
)3)一般下载的数据是Excel文件形式的xsl文件,不能直接在StataIC上打开。 可以打开Excel文件,选择并复制所需的数据,然后打开StataIC的数据界面进行粘贴。
粘贴后,StataIC弹出提示窗口。 只需按红色圆圈内的Variable names按钮,即可将数据导入到StataIC中。 因为数据的第一行可能是变量名称(例如,x、y、z ),所以必须选择Variable names。 但是,你的x、y、z等变量会变成数据。 选择Data按钮。
)5)导入最后成功的数据后,将显示下图的页面。
2 .设定时间序列(1) tsset的定义数据是时间序列数据。 如果要在数据文件中将年定义为时间变量,请输入命令。
如果tsset year数据文件中的时间变量名称不是year,则必须用您的变量名称替换我给定命令的year,如下所示:
输入(2)命令tsset *** #***表示您的时间变量名称。 输入命令的位置位于StataIC软件的底部。 输入后按Enter键。
StatarIC对输入内容有要求。 和Java一样,不能用中文输入法输入英语字符串。 否则,StataIC软件会报告错误。
)3)时间序列设置成功后,如下图所示。
如果不成功,输入栏上面会显示红色的英语句子。 但是,一般出现短横线(例如(-) )时,表示命令成功。
3 .数据描述性统计分析命令: sum
结果如下图所示。
命令: sum变量1变量2,detail (更详细的描述性统计分析) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )。
结果如下图所示。
三.绘图——趋势图和散点图1 .趋势图命令: line varname,title (图表名称) xtitle变量x的名称) ytitle ) XXX )如果不需要显示名称,请将括号留空
线性增长年(增长率xtitle )年(ytitle ) )。
出图结果显示为新窗口,结果如下图所示。
2、散点图第1个()1)命令:
twoway(Scattervarname1varname2) lfit varname1 varname2) #varname1 varname2是变量1和变量2的名称。 其中,“lfit”意味着“linear fit '”线性拟合”,形状为“如果要在散点图上同时绘制二次回归曲线,请将“lfit”直接变更为“qfit ',二次拟合”,使其成为曲线的形状)例1 ) lfit ) :
命令:输入twoway(ScatterinflauneMP ) (lfit infla unemp )
结果如下图所示。
)例2 ) qfit ) :
命令:输入twoway(ScatterinflauneMP ) (qfit infla unemp )
结果如下图所示。
为了与例1区别,一个为lfit,另一个为qfit。
二是: (1)命令:
aaplotvarname1varname2# varname1varname 2是表示变量1和变量2名称的第一步。 首先安装外部命令aaplot,然后输入命令。 ssc install aaplot第二步:键入命令aaplotvarname1varname2(2)
输入命令: aaplot infla unemp
结果如下图所示。
3 .变量差分后的趋势图命令: line dvarname1 dvarname2小时变量名示例:输入命令line dinfla dunemp year :
结果如下图所示。
四.数据相关性分析第一步:命令: correlate varname1varname2# varname1varname 2是变量1和变量2的名称含义1 .例如:
输入命令: correlate gdpr consr
结果如下图所示。
步骤2 :命令: pwcorr varname1 varname2,sig
1例:输入命令pwcorr gdpr consr,sig:
结果如下图所示:
五、数据平稳性分析 1.单位根检验 命令: dfuller varname
例:
(1)输入命令(检验第一个变量gdpr)dfuller gdpr:
结果如下图所示:
结论:gdpr不平稳
(2)输入命令(检验第一个变量consr) dfuller consr:
结果如下图所示:
结论:consr不平稳
(1)输入命令ac gdpr(做gdpr的自相关图):
结果如下图所示:
(2)输入命令ac consr(做consr的自相关图):
结果如下图所示:
例二
(1)输入命令pac infla:
结果如下图所示:
(2)输入命令pac unemp:
结果如下图所示:
3.若序列不平稳,生成差分变量,再做单位根检验 生成差分变量
命令:
gen dvarname1=d.varname1 #别忘了变量名前的dgen dvarname2=d.varname2 #varname1 varname2是变量1和变量2的名称的意思例:
(1) 输入命令:
gen dgdpr=d.gdpr
gen dconsr=d.consr
结果如下图所示:
2. 对差分后的新变量,做单位根检验:
命令:
dfuller dvarname1 #别忘了变量名前的d例:
输入命令:dfuller dgdpr结果如下图所示:
结论:dgdpr平稳
输入命令:dfuller dconsr
结果如下图所示:
结论:dconsr不平稳
六、总结 由于俩时间序列是非平稳的,gdpr和consr都是一阶单整的。 七、后续 下一篇博文会在这篇博文的基础上写关于协整检验和误差修正模型的操作。
码字总结不易,点个赞吧(*・ω< )