在
R
语言中进行面板数据分析
面板数据
(
Panel Data
)
是截面数据与时间序列数据综合起来的一种数据类型。
它有时间序
列和截面两个维度,
当这类数据按两个维度排列时,
是排在一个平面上,
与只有一个维度的
数据排在一条线上有着明显的不同,整个表格像是一个面板
,
所以把
panel data
译作
“
面板数
据
”
。
面板数据模型的选择通常有三种形式:
第一种是混合估计模型(
Pooled Regression Model
)
。如果从时间上看,不同个体之间不存在
显著性差异;
从截面上看,
不同截面之间也不存在显著性差异,
那么就可以直接把面板数据
混合在一起用普通最小二乘法(
OLS
)估计参数。
第二种是固定效应模型
(
Fixed Effects Regression Model
)
。
如果对于不同的截面或不同的时间
序列,
模型的截距不同,
则可以采用在模型中添加虚拟变量的方法估计回归参数。
该模型刻
画了不同个体的特殊影响,而且这个影响不随样本变化。
第三种是随机效应模型(
Random Effects Regression Model
)
。如果固定效应模型中的截距项
包括了截面随机误差项和时间随机误差项的平均效应,
并且这两个随机误差项都服从正态分
布,
则固定效应模型就变成了随机效应模型。
该模型刻画了不同个体的特殊影响,
但这个影
响会随样本变化。
首先载入程序包和数据
library(plm)
将数据转成可处理的面板格式,特别要注意标明个体名和时间名
pgr
先用混合估计模型进行估计
gr_pool
, data = pgr,
model = "pooling")
再用固定效应模型进行估计
gr_fe
, data = pgr,
model = "within")
如果要判断固定效应模型是否比混合估计模型更好,可采用
F
检验
pFtest(gr_fe, gr_pool)
最后我们用随机效应模型进行估计
gr_re
, data = pgr,
model = "random", random.method = "swar")
summary(gr_re)
要判断随机效应模型是否与固定效应模型有区别,可采用
Hausman
检验
phtest(gr_re, gr_fe)