倾向得分匹配平衡性检验,psm结果怎么看

这个方法的难点是：

首先，我们需要了解什么是反事实的框架。一般来说，参加和不参加项目相比，为什么选择是错误的？

其次，阐明上述原理后，PSM真正困难的是找到合适的协调变量和完成两个严格的检查(联合支撑检查和平衡性检查)

这篇文章我想实现什么样的学习目标：

)1)请尽量收集我看到的有用资料

)2)给出了PSM分析的理论框架

)3)针对难点阐述模型调整问题(协变量选择、两个检测调整)

主要框架：1.理论2 .操作3 .案例4 .辨析5 .参考资料

1 .问题的发生

1.1大背景：因果估计与识别策略

计量经济学从“可靠性革命”——统计推断到因果推断的研究范式转换。

许多计量实证都集中在统计估计，即如何利用样本信息获得总体信息估计，以及如何进行假设验证以确定估计结果的统计显著性。

但是，越来越多的实证研究开始识别经济变量之间的因果关系。

“诚信革命”的重要特征是利用潜在结果框架清晰界定因果，利用随机化实验的思想作为因果效应认识的基础。

PSM是识别策略之一。

1.2小背景：匹配原理

书面说明：在估计因果效应时，我们面临因果估计的基本问题(Holland，1986 )，只能观察一种干预状态下的结果，不能观察其他干预状态下的结果。匹配方法的基本思想是针对干预组个体，在控制组中寻找特征相似的控制组个体并与之匹配，通过控制组个体的结果推测干预组个体的反事实结果。 ATT是因果效应) ) ) 65

通俗易懂的说明：这个例子来自dddwx老师。目前正在研究“阅读北大(x变量)有助于提高收入(y变量)吗？” 这个问题。

相对于既定的样本，北大录取的孩子本身就很优秀，读北大并不是收入高，存在着自我选择偏差的问题。

但是我该怎么办？在社会经济学中，不能像自然科学那样设置自然实验(对照组和实验组)，根据这个人考上北大的既定事实)，无法观察不上北大)会怎么样。

因此，PSM的想法是，将可以进入北大(处理组)的学生的个体特征进行分解，从不能进入北大(控制组)的学生中找出与处理组的个体特征相同的样本进行比较。例如，如果两人高考成绩都一样，都住在城市里，父母的教育程度也差不多，那么他们的收入差异只是取决于是否考入北大。这成功地与北大建立了类似于自然实验的实验，以验证收入提高的因果效应。

2 .方法原理

2.1协变量匹配测度

略(虽然不擅长写公式，但是数学推导请试着找参考书。高兴的火龙果和谨慎的蜜蜂都可以。

2.2趋势指数拟合测度

略论

3 .基本步骤

3.1相似性的定义

3.1.1协变量的选择

主要原则：干扰变量和结果变量的混合因素都应纳入协调变量的考虑范围。

也就是说：

在趋势指数匹配中，引入与干预变量无关的变量影响不大，对趋势指数模型没有影响。当这些变量是影响结果变量的重要因素时，可以通过引入来提高估计精度。如果引入与结果变量无关的变量，估计标准误差会略有增加。如果忽略了重要的拥挤因素，就会引起明显的偏差。因此，对结果变量有重要影响的协调变量，无论与介入变量有无关系，都可以作为匹配的依据导入

3.1.2相似性的测度标准

有多像呢？根据标准不同，找到的匹配对象也不同。

距离。一般欧式距离、标准化欧式距离、甜黑猫距离。后者的距离测度方法消除了维(或单位)的影响。给出了将欧式距离标准化的公式。

游标卡尺。根据趋势指数设定游标卡尺，如果不在游标卡尺范围内，可能会相似。有游标卡尺的甜黑猫的距离匹配将距离定义如下

其中，c是游标卡尺。上述距离的定义表明，只有在游标卡尺范围内时才有类似的可能性，游标卡尺范围外没有类似的可能性。 RosenbaumandRubin(1985 )建议使用线性化趋势指数标准差的0.25倍作为游标卡尺。

3.2匹配实施方法

3.2.1邻居匹配

一对一匹配。

【概念】指干预组的每个个体，在控制组中寻找最接近的控制组个体并与之匹配。

【优缺点】最终匹配样本较少，估计方差较大，但各干预组个体找到的距离最近，偏差较小。

一对多匹配。

【概念】每个干预组个体在控制组寻找多个个体并与其匹配。

【优缺点】寻找的匹配多，匹配样本容量大，估计精度提高，但一对多近邻匹配中，与干预组个体匹配的第二、第三等，后面的控制组个体与干预组个体的相似性降低权衡后的选择：控制组

样本数量很多时,可以考虑一对多近邻匹配。

③其他问题(选读)。

一对一匹配时，找到了距离相同的个体，可随机选择一个匹配或者排序后第一个出现的进行匹配。

重复匹配。重复选择控制组进行匹配能降低匹配偏差，但是会降低最终匹配样本的样本量，估计精度可能下降。

贪婪匹配vs最优匹配。贪婪匹配(个体最优，整体不一定最优)是指对每一个干预组个体都在控制组中寻找一个距离最近的.但是保证每一对距离最近,对全部干预组个体而言,匹配上的控制组样本并不一定是总体上最近的另一种匹配方法。总体上对所有的干预组个体同时进行匹配,寻找对所有干预组个体而言匹配上的总距离最小。权衡后的选择：如果关心平均因果效应，选择贪婪匹配即可；如果关心每个个体的匹配效果，最优匹配会得到更为平衡的结果。

3.2.2 分层匹配

根据协变量的取值进行分层。

3.2.3 小结

上面讲了很多让人很凌乱的匹配方法。如果你随便用PSM的方法就满足了一些假设，可能方法的调整对你来说意义不大，但是如果你的平衡性或者共同支撑检验的效果不好，显著性不高，那么就可以考虑换下方法，

3.3 匹配效果诊断

3.3.1 共同支撑检验

主要对匹配前后的核密度图进行对比，最好的结果是匹配之后两条线很相近。有的时候也会用第二章条形图。核密度图

3.3.2 平衡性检验

追求的目标：匹配前后各个变量的均值之间没有明显差异(均值偏差小，t值之小不显著)。主要是下面的表格和图。

3.4 估计因果效应

看y变量的ATT和显著性，如下图

3.5 小结及拓展资料阅读

3.1，3.2很可能需要重复多次；3.1，3.2，3.3不涉及结果变量，高度模拟“随机化实验”，提高实证的“科学性”和“可信性”倾向值匹配法的概述和应用+倾向值分析：统计方法与应用_网络_小力子的博客-CSDN博客blog.csdn.net

4.实际案例

【案例1】dddwx_2011 股权激励与公司绩效的关系

4.1 背景和问题、假设

4.2 我的手写笔记

拓展参考文献(来自dddwx老师的推荐)：

(1)因果推断综述和进展*-Nichols, A., 2007, (非常详细地综述了因果推断相关的文献: PSM, IV-GMM, RDD)

Causal inference with observational data

*-Ichino, A., 2007 (较为细致地介绍了因果推断问题, PPT)

The problem of causality in microeconometrics.

*-Imbens, G., J. Wooldridge, 2009, (值得细读！！)

Recent developments in the econometrics of program evaluation

*-Pearl, J., 2009, (涉及结构方程等新内容)

Causal inference in statistics: An overview

(2)PSM相关文献*-Grilli, L., and C. Rampichini, 2011 (详细介绍了PSM和-psmatch2-的应用)

* Propensity scores for the estimation of average

* treatment effects in observational studies

shellout "$pathPPTGrilli_2011_ppt_PSM.pdf" //极力推荐,解释的很到位！

*-Becker, S., A. Ichino, 2002, (第一篇系统性的介绍Stata应用的文章)

* Estimation of average treatment effects based on propensity scores,

* Stata Journal, 2(4): 358-377.

* 相关命令: findit Becker

shellout "$pathRefsBecker_2002_PSM.pdf" //Google引用: 1030 次

*-Dehejia, R. H., S. Wahba, 2002, (较早应用 PSM 分析的文章)

* Propensity score-matching methods for nonexperimental causal studies,

* Review of Economics and Statistics, 84(1): 151-161.

shellout "$pathRefsDehejia_2002_PSM.pdf" //Google引用: 1700 次

*-Abadie, A., D. Drukker, J. Herr, G. Imbens, 2004,

* Implementing matching estimators for average treatment effects in Stata,

* Stata Journal, 4(3): 290-311.

help nnmatch //文中使用的命令

doedit "nnmatch.do" //文中范例的 do 文档

shellout "$pathRefsAbadie_2004_PSM.pdf" //Google引用: 508 次

*-Caliendo, M., S. Kopeinig, 2008, (很好的综述和应用细节介绍)【重点推荐】

* Some practical guidance for the implementation of propensity score matching,

* Journal of Economic Surveys, 22(1): 31-72.

shellout "$pathRefsCaliendo_2008_PSM.pdf" //Google引用: 843 次

*-Stuart, E. A., 2010, (对 PSM 的发展历程和应用细节进行了细致的综述)

* Matching Methods for Causal Inference: A Review and a Look Forward,

* Statistical Science, 25(1): 1-21.

shellout "$pathRefsStuart_2010_PSM.pdf" //Google引用: 67 次

5.问题反思(概念、方法，最优标准，如何调整)

(1)PSM和处理效应到底有什么关系？

(2)PSM为什么能解决样本选择偏误？

(3)不同的匹配方法(近邻匹配、核匹配、半径匹配等)怎么取舍？

(4)协变量的寻找。可以用psestimate这个命令？Stata新命令：psestimate - 倾向得分匹配中协变量的筛选blog.csdn.net

(5)核密度图怎么调整到最优？

(6)平衡性检验怎么调整到最优？

其他操作中的问题：倾向得分匹配(PSM)操作过程与问题反思www.sohu.com

6.stata命令『Stata』政策处理效应PSM模型基本命令汇总_变量www.sohu.com倾向得分匹配法(PSM)举例及stata实现 - 计量经济学与统计软件 - 经管之家(原人大经济论坛)bbs.pinggu.org

7.主要参考资料谨慎的蜜蜂《基本有用的计量经济学》

dddwx_2011《Evaluating the Effects of Equity Incentives： Using PSM Evidence from China》

计量经济学圈系列文章

等等

8.特别说明

文中的笔记是根据dddwx老师、谨慎的蜜蜂老师总结得到，本人也在不断学习中。

资料展示过程中比较注重操作，对于原理和数理推导没有展开，大家可以自己去看书。

如果有什么表述不准确的地方，欢迎提出批评意见。

完结，撒花！~！~