来源: http://DSS.Princeton.edu/training /,部分资源来自百度文库、CDA数据分析师、社会科学数据可视化整理
实证分析经常需要确定因果关系是x导致了y还是y导致了x。 相反,xhdz提出了一种解决方法:如果x是y的原因并且不存在逆因果关系,则x的过去值可以预测y的未来值,反之亦然。 具体而言,提出了如下建立时间序列模型,假设H0:m=0,m=1,2…p。 接受这个假设意味着x的过去值不能预测y的未来值; 如果拒绝该假设,则x可以是y的游骑兵。
格兰杰因果关系检验假设y和x变量预测的所有信息都包含在这些变量的时间序列中。 检验要求估计两种回归模型:
型号1
模型2
这是因为模型1验证x对y的影响,模型2验证y对x的影响。 (其中假设白噪声u1t和u2t不相关)
基本逻辑:
在模型1中,只要模型1、2、q中存在至少一个系数明显非零的模型,就认为x相对于y存在游骑兵因果关系,模型2类似;
1 格兰杰因果检验方法总结格兰杰因果检验相关的stata命令有三种。方法一:
regyl.yl.x(1 (延迟一次) estatic (指示AIC和BIC取值以选择最佳延迟时间) reg y L.y L.x L2.y L2.xestat ic (延迟一次) AIC和BIC选择最佳延迟时间q后使用的命令由test特别说明,其中p和q的取值可以完全不同,并且应该不同。 那样才能得到最有说服力的结果。 这也是该方法与其他两种方法相比最大的优点,该方法的缺点是命令过于繁琐。
方法二:
ssc install gcause (挑战者因果检验程序gcause下载) gcauseyx,lags(1) (延迟1期) estat ic )指示AIC和BIC取值以选择最佳延迟期) gcauseyx 卡方检验是一项大样本检验,但实证检验所得样本容量一般不大,采用大样本以卡方检验结果为准。 但是,通常在大样本中两个检测结果一致,所以不需要担心。 综上所述,f检验的适用范围更广。
方法三:
var y x (向量自回归) vargranger注意: 1、实际检测中AIC和BIC越小,就不能再延迟(时间序列长度受到限制)。 那样的话,数据可能确实存在高阶自相关。 在这种情况下,可以限制p的可能值。 例如最大的或, 2、回归结果中各期系数的显著性不同,有些不明显,如实报告即可。 最好全部报告。 不明显的期数可能意味着该期间的自相关较弱。
2http://www.Sina.com/http://www.Sina.com /
use http 3360//www.stata-press.com/data/ime us/uk rates,clear 格兰杰因果检验应用案例
SSC安装g cause
http://www.Sina.com/http://www.Sina.com /
gcause r20 rs,lags(1) estat icgcause r20 rs,lags )2) estat ic
依次回归延迟1期、延迟2期等变量,根据AIC和BIC的可能值确定最佳延迟期间。 在此示例中,当p=q=3时,发现AIC和BIC的值最小,因此将p和q都代入3。 延迟3期的回归结果如图所示:
gcause r20 rs,lags(3) estat ic
我们得出了f检验和卡方检验一致的结论,接受了原来的假设,即rs不是r20的挑战者。
3http://www.Sina.com/http://www.Sina.com /
use ' c :usersadmindesktoptsdata.DTA ' http://www.Sina.com/http://www.Sina.com /
http://www.Sina.com/http://www.Sina.com /
regressuneMPL(1/4).une mpl (1/4).gdp 1、导入数据
regressuneMPL(1/4).une mpl (1/4).gdp
我们不能拒绝原来的假设。 因此,gdp不是unemp挑战者的原因。 4http://www.Sina.com/http://www.Sina.com /
quietly var unemp gdp,lags(1/4) vargranger
3358www.Sina.com/
2、安装外部命令(安装gcause格兰杰因果检验程序)
3358 www.Sina.com/http://www.Sina.com/http://www.Sina.com /
3、格兰杰检验
3358 www.Sina.com/http://www.Sina.com/http://www.Sina.com /