首页 > 编程知识 正文

倾向得分匹配平衡性检验,psm结果怎么看

时间:2023-05-04 16:28:07 阅读:11056 作者:2269

这个方法的难点是:

首先,我们需要了解什么是反事实的框架。 一般来说,参加和不参加项目相比,为什么选择是错误的?

其次,阐明上述原理后,PSM真正困难的是找到合适的协调变量和完成两个严格的检查(联合支撑检查和平衡性检查)

这篇文章我想实现什么样的学习目标:

)1)请尽量收集我看到的有用资料

)2)给出了PSM分析的理论框架

)3)针对难点阐述模型调整问题(协变量选择、两个检测调整)

主要框架:1.理论2 .操作3 .案例4 .辨析5 .参考资料

1 .问题的发生

1.1大背景:因果估计与识别策略

计量经济学从“可靠性革命”——统计推断到因果推断的研究范式转换。

许多计量实证都集中在统计估计,即如何利用样本信息获得总体信息估计,以及如何进行假设验证以确定估计结果的统计显著性。

但是,越来越多的实证研究开始识别经济变量之间的因果关系。

“诚信革命”的重要特征是利用潜在结果框架清晰界定因果,利用随机化实验的思想作为因果效应认识的基础。

PSM是识别策略之一。

1.2小背景:匹配原理

书面说明:在估计因果效应时,我们面临因果估计的基本问题(Holland,1986 ),只能观察一种干预状态下的结果,不能观察其他干预状态下的结果。 匹配方法的基本思想是针对干预组个体,在控制组中寻找特征相似的控制组个体并与之匹配,通过控制组个体的结果推测干预组个体的反事实结果。 ATT是因果效应) ) ) 65

通俗易懂的说明:这个例子来自dddwx老师。 目前正在研究“阅读北大(x变量)有助于提高收入(y变量)吗?” 这个问题。

相对于既定的样本,北大录取的孩子本身就很优秀,读北大并不是收入高,存在着自我选择偏差的问题。

但是我该怎么办? 在社会经济学中,不能像自然科学那样设置自然实验(对照组和实验组),根据这个人考上北大的既定事实),无法观察不上北大)会怎么样。

因此,PSM的想法是,将可以进入北大(处理组)的学生的个体特征进行分解,从不能进入北大(控制组)的学生中找出与处理组的个体特征相同的样本进行比较。 例如,如果两人高考成绩都一样,都住在城市里,父母的教育程度也差不多,那么他们的收入差异只是取决于是否考入北大。 这成功地与北大建立了类似于自然实验的实验,以验证收入提高的因果效应。

2 .方法原理

2.1协变量匹配测度

略(虽然不擅长写公式,但是数学推导请试着找参考书。 高兴的火龙果和谨慎的蜜蜂都可以。

2.2趋势指数拟合测度

略论

3 .基本步骤

3.1相似性的定义

3.1.1协变量的选择

主要原则:干扰变量和结果变量的混合因素都应纳入协调变量的考虑范围。

也就是说:

在趋势指数匹配中,引入与干预变量无关的变量影响不大,对趋势指数模型没有影响。 当这些变量是影响结果变量的重要因素时,可以通过引入来提高估计精度。 如果引入与结果变量无关的变量,估计标准误差会略有增加。 如果忽略了重要的拥挤因素,就会引起明显的偏差。 因此,对结果变量有重要影响的协调变量,无论与介入变量有无关系,都可以作为匹配的依据导入

3.1.2相似性的测度标准

有多像呢? 根据标准不同,找到的匹配对象也不同。

距离。 一般欧式距离、标准化欧式距离、甜黑猫距离。 后者的距离测度方法消除了维(或单位)的影响。 给出了将欧式距离标准化的公式。

游标卡尺。 根据趋势指数设定游标卡尺,如果不在游标卡尺范围内,可能会相似。 有游标卡尺的甜黑猫的距离匹配将距离定义如下

其中,c是游标卡尺。 上述距离的定义表明,只有在游标卡尺范围内时才有类似的可能性,游标卡尺范围外没有类似的可能性。 RosenbaumandRubin(1985 )建议使用线性化趋势指数标准差的0.25倍作为游标卡尺。

3.2匹配实施方法

3.2.1邻居匹配

一对一匹配。

【概念】指干预组的每个个体,在控制组中寻找最接近的控制组个体并与之匹配。

【优缺点】最终匹配样本较少,估计方差较大,但各干预组个体找到的距离最近,偏差较小。

一对多匹配。

【概念】每个干预组个体在控制组寻找多个个体并与其匹配。

【优缺点】寻找的匹配多,匹配样本容量大,估计精度提高,但一对多近邻匹配中,与干预组个体匹配的第二、第三等,后面的控制组个体与干预组个体的相似性降低权衡后的选择:控制组

样本数量很多时,可以考虑一对多近邻匹配。

③其他问题(选读)。

一对一匹配时,找到了距离相同的个体,可随机选择一个匹配或者排序后第一个出现的进行匹配。

重复匹配。重复选择控制组进行匹配能降低匹配偏差,但是会降低最终匹配样本的样本量,估计精度可能下降。

贪婪匹配vs最优匹配。贪婪匹配(个体最优,整体不一定最优)是指对每一个干预组个体都在控制组中寻找一个距离最近的.但是保证每一对距离最近,对全部干预组个体而言,匹配上的控制组样本并不一定是总体上最近的另一种匹配方法。总体上对所有的干预组个体同时进行匹配,寻找对所有干预组个体而言匹配上的总距离最小。权衡后的选择:如果关心平均因果效应,选择贪婪匹配即可;如果关心每个个体的匹配效果,最优匹配会得到更为平衡的结果。

3.2.2 分层匹配

根据协变量的取值进行分层。

3.2.3 小结

上面讲了很多让人很凌乱的匹配方法。如果你随便用PSM的方法就满足了一些假设,可能方法的调整对你来说意义不大,但是如果你的平衡性或者共同支撑检验的效果不好,显著性不高,那么就可以考虑换下方法,

3.3 匹配效果诊断

3.3.1 共同支撑检验

主要对匹配前后的核密度图进行对比,最好的结果是匹配之后两条线很相近。有的时候也会用第二章条形图。核密度图

3.3.2 平衡性检验

追求的目标:匹配前后各个变量的均值之间没有明显差异(均值偏差小,t值之小不显著)。主要是下面的表格和图。

3.4 估计因果效应

看y变量的ATT和显著性,如下图

3.5 小结及拓展资料阅读

3.1,3.2很可能需要重复多次;3.1,3.2,3.3不涉及结果变量,高度模拟“随机化实验”,提高实证的“科学性”和“可信性”倾向值匹配法的概述和应用+倾向值分析:统计方法与应用_网络_小力子的博客-CSDN博客​blog.csdn.net

4.实际案例

【案例1】dddwx_2011 股权激励与公司绩效的关系

4.1 背景和问题、假设

4.2 我的手写笔记

拓展参考文献(来自dddwx老师的推荐):

(1)因果推断综述和进展*-Nichols, A., 2007, (非常详细地综述了因果推断相关的文献: PSM, IV-GMM, RDD)

Causal inference with observational data

*-Ichino, A., 2007 (较为细致地介绍了因果推断问题, PPT)

The problem of causality in microeconometrics.

*-Imbens, G., J. Wooldridge, 2009, (值得细读!!)

Recent developments in the econometrics of program evaluation

*-Pearl, J., 2009, (涉及结构方程等新内容)

Causal inference in statistics: An overview

(2)PSM相关文献*-Grilli, L., and C. Rampichini, 2011 (详细介绍了PSM和-psmatch2-的应用)

* Propensity scores for the estimation of average

* treatment effects in observational studies

shellout "$pathPPTGrilli_2011_ppt_PSM.pdf" //极力推荐,解释的很到位!

*-Becker, S., A. Ichino, 2002, (第一篇系统性的介绍Stata应用的文章)

* Estimation of average treatment effects based on propensity scores,

* Stata Journal, 2(4): 358-377.

* 相关命令: findit Becker

shellout "$pathRefsBecker_2002_PSM.pdf" //Google引用: 1030 次

*-Dehejia, R. H., S. Wahba, 2002, (较早应用 PSM 分析的文章)

* Propensity score-matching methods for nonexperimental causal studies,

* Review of Economics and Statistics, 84(1): 151-161.

shellout "$pathRefsDehejia_2002_PSM.pdf" //Google引用: 1700 次

*-Abadie, A., D. Drukker, J. Herr, G. Imbens, 2004,

* Implementing matching estimators for average treatment effects in Stata,

* Stata Journal, 4(3): 290-311.

help nnmatch //文中使用的命令

doedit "nnmatch.do" //文中范例的 do 文档

shellout "$pathRefsAbadie_2004_PSM.pdf" //Google引用: 508 次

*-Caliendo, M., S. Kopeinig, 2008, (很好的综述和应用细节介绍)【重点推荐】

* Some practical guidance for the implementation of propensity score matching,

* Journal of Economic Surveys, 22(1): 31-72.

shellout "$pathRefsCaliendo_2008_PSM.pdf" //Google引用: 843 次

*-Stuart, E. A., 2010, (对 PSM 的发展历程和应用细节进行了细致的综述)

* Matching Methods for Causal Inference: A Review and a Look Forward,

* Statistical Science, 25(1): 1-21.

shellout "$pathRefsStuart_2010_PSM.pdf" //Google引用: 67 次

5.问题反思(概念、方法,最优标准,如何调整)

(1)PSM和处理效应到底有什么关系?

(2)PSM为什么能解决样本选择偏误?

(3)不同的匹配方法(近邻匹配、核匹配、半径匹配等)怎么取舍?

(4)协变量的寻找。可以用psestimate这个命令?Stata新命令:psestimate - 倾向得分匹配中协变量的筛选​blog.csdn.net

(5)核密度图怎么调整到最优?

(6)平衡性检验怎么调整到最优?

其他操作中的问题:倾向得分匹配(PSM)操作过程与问题反思​www.sohu.com

6.stata命令『Stata』政策处理效应PSM模型基本命令汇总_变量​www.sohu.com倾向得分匹配法(PSM)举例及stata实现 - 计量经济学与统计软件 - 经管之家(原人大经济论坛)​bbs.pinggu.org

7.主要参考资料谨慎的蜜蜂《基本有用的计量经济学》

dddwx_2011《Evaluating the Effects of Equity Incentives: Using PSM Evidence from China》

计量经济学圈 系列文章

等等

8.特别说明

文中的笔记是根据dddwx老师、谨慎的蜜蜂老师总结得到,本人也在不断学习中。

资料展示过程中比较注重操作,对于原理和数理推导没有展开,大家可以自己去看书。

如果有什么表述不准确的地方,欢迎提出批评意见。

完结,撒花!~!~

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。