一、均值比较检验和方差分析
在经济社会问题的研究过程中,往往需要比较现象的某些指标之间是否存在显著差异,特别是当被调查的样本量N比较大时,从随机变量的中心极限定理可知样本均值近似正态分布,因此均值的比较检验主要研究关于正态总体均值的假设是否成立,而被研究的数据是正态分布还是近似正态分布是均值比较检验的前提。在分析菜单中,平均值比较测试可以从比较平均值和一般线性模型菜单中获得。
单个总体平均值的检验(单样本检验)
单个总体的T检验也叫单个样本的T检验,即单个变量的均值与假设均值是否存在差异。将单个变量的样本均值与假设常数进行比较,通过检验得出预假设是否正确的结论。
两个群体的双样本检验
2.1两个独立样本的T检验(独立样本T检验)
独立样本T检验是检验两个不相关的一般样本的均值之间是否存在显著差异,也称独立样本。比如两个不相关的企业之间某个指标平均值的比较,不同地区儿童身高体重的比较,可以通过抽样样本检验两个人群的平均值是否存在显著差异。
2.2两个相连样本平均值的比较(配对样本T检验)
配对样本T检验是检验两个相关的正态总体的均值之间是否存在显著差异,也称为配对样本的T检验。如果要测试使用某种药物的效果是否苦,需要对比使用前后的效果。如果对某一种粮食进行改良,还需要比较改良前后的粮食产量是否有显著差异。
单向方差分析
一个因变量的单向方差分析主要解决两个以上总体样本或变量的均值比较问题。这是一种检验多个(两个以上)总体样本平均值之间是否存在显著差异的测试方法。
单因素方差分析的应用条件:在不同水平上(因子变量的值不同),所有的总体都应服从等方差的正态分布。
例2.5:某年级有三个班。现在,他们是根据数学考试的分数随机选择的(见下表)。试测0.005显著性水平各班平均成绩有无显著性差异(数据文件:数学考试成绩。sav)。
(1)建立数学成绩的数据文件。
(2)选择分析比较均值单因素方差打开单因素方差分析窗口,将数学成绩移入因变量列表框,将类别移入因子列表框。
(3)点击“成对比较”按钮,打开“单因素方差分析成对比较”窗口。
(4)在假设方差齐性的选项列中选择常用的LSD检验方法,在非假设方差齐性的选项列中选择Tamhane检验方法。在显著性水平框中输入0.05,然后单击继续返回差异分析窗口。
(5)单击选项按钮打开单因素方差分析选项窗口,并在统计选项框中选中描述性和方差齐性检验。勾选均值图的复选框,点击“继续”返回“单因素方差分析选项”窗口,点击“确定”在输出窗口输出分析结果。
四因素方差分析
单因变量双因素方差分析是分析受两个因素或变量影响的观察现象(冈变量),检验不同水平的组合对因变量旦数的影响是否足够显著。双因素方差分析应用广泛,如粮食产量受气候、温度因素影响;生物多样性:舱内养牛生产过程不仅受催化剂用量的影响,还受温度的影响,甚至两个因素的相互作用对因变量也有一定的影响。为了区分哪个因素的影响更大,需要应用双因素方差分析的方法。
例2.6:研究不同温湿度对粘虫发育持续时间的影响,得到测试数据如表5-7所示。分析不同温度和湿度对粘虫发育持续时间的影响是否存在显著差异(数据文件:armyworm.sav)。
(1)建立数据文件“粘虫sav”。
(2)选择分析一般线性模型单变量,打开单变量设置窗口。
(3)分析模型选择:这里我们选择默认;
(4)比较方式选择:点击窗口中的“比较”按钮,打开“单变量:比较”窗口进行设置,点击“继续”返回。
(5)均值剖面的选择:点击“绘制”按钮,在比较模型中设置边际均值剖面,点击“继续”返回;
(6)“成对比较”选项,用于设置成对比较测试,在本例中,它被设置为“温度”和“和”
“湿度”。
相关分析和回归模型的建立与分析
相关分析和回归分析是统计分析方法中最重要的内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关性,寻求变量之间合适的函数关系,尤其是线性表达式。
p>相关或回归分析的数据条件:参与分析的变量数据是数值型变量或有序变量。1 相关方析 (Correlate)
两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系,一是散点图,可直观地显示变量之间的关系,二是相关系数,可准确地反映两变量的相关程度。
1.1 简单相关分析
简单相关分析操作:简单相关分析是指两个变量之间的相关分析,主要指对两变量之间的线性相关程度做出定量分析。
例3.6(简单双变量):调查了29人身高、体重和肺活量的数据见下表,试分析这三者之间的相互关系。
(1)建立数据文件“学生生理数据.sav”。
(2)选择“分析” →“相关” →“双变量”,打开双变量相关分析对话框。
(3)选择分析变量:将“身高”、“体重”和“肺活量”分别移入分析变量框中。
(4)选择相关分析方法:在相关系数栏有三种相关系数,分别对应三种方法,供使用者选择。
(5)显著性检验:双侧检验、单侧检验。
(6)“标记显著性检验”复选项:选中该复选项,输出结果中在相关系数右上角用“*”表示显著性水平为5%,用“**”表示显著水平为1%。
(7)“选项”对话框:本例在统计时项选择“均值和标准差”,在缺失值选项选择默认,即“按对排除个案”。
1.2 偏相关分析
简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其他相关因素的影响,不能真实地反映二者之间的关系,所以需要考察在其他因素的影响剔除后二者之间的相关程度,即偏相关分折。
2 线性回归分析(Regression)
线性回归是统计分析方法小最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线件回归的方法建立现象(因变量)与影响因素(自变量)之间的线性函数关系式。
2.1线性回归模型假设条件与模型的各种检验
1.回归系数的检验(T检验);
2.回归方程的检验(F检验);
3.拟合程度判定(可决系数R2);
4.D.W检验(残差项是否自相关);
5.共线性检验(多元线性回归)。
6.残差图示分析(判断残差序列异方差性和自相关)。
2.2线性回归分析的具体步骤
例3.10:考察中国居民收入与消费支出的关系。数据文件名称“居民消费水平.sav”。 变量说明:GDPP:人均国内生产总值 CONSP:人均居民消费
(1)建立数据文件“居民消费水平.sav”。
(2)选择“分析” →“回归” →“线性”,打开线性回归分析对话框。
(3)选择因变量和自变量:将人均居民消费“CONSP” 移入因变量框中; (4)在线性回归窗口中点击“统计量”,打开线性回归统计量窗口,对统计量进行设置。
(5)在线性回归窗口中点击“绘制”,打开、“线性回归:图” 窗口,选择绘制标准化残差图,其中的正态概率图是rankit图。同时还需要画出残差图,Y轴选择:ZRESID,X轴选择: ZPRED。
(6)在线性回归窗口中点击“选项”,打开、“线性回归:选项” 窗口。
◆ 步进方法标准单选钮组:设置纳入和排除标准,可按P值或F值来设置;
◆ 在等式中包含常量复选框:用于决定是否在模型中包括常数项,默认选中。
3 曲线估计(Curve Estimation)
上节介绍了线性回归模型的分析和检验方法。如果某对变量数据的散点图不是直线,而是某种曲线的形式时,可以利用曲线估计的方法为数据寻求一条合适的曲线,也可用变量代换的方法将曲线方程变为直线方程。用线性回归模型进行分析和预测。
三 时间序列分析
由于反映社会经济现象的大多数数据是按照时间顺序记录的,所以时间序列分析是研究社会经济现象的指标随时间变化的统计规律性的统计方法。为了研究事物在不同时间的发展状况,就要分析其随时间的推移的发展趋势,预测事物在未来时间的数量变化。
主要内容:
1.时间序列的线图、自相关图和偏自关系图;
2.SPSS软件的时间序列的分析方法——季节变动分析。
四 非参数检验
前面进行的假设检验和方差分析,大都是在数据服从正态分布或近似地服从正态分布的条件下进行的。但是如果总体的分布未知,进行总体参数的检验,或者检验总体服从一个指定的分布,都可以归结为非参数检验方法。非参数检验包括下列内容:
1.总体分布的假设捡验;
2.两种以下的现象之间的关联性检验(见列联分析);
3.总体分布未知时,关于单个总体均值的检验;两个总体均值或分布的差异是否显著的检验,以及多个未知总体的单因素方差分析;
4.某种现象出现的随机性检验。
文章来源 腾讯云
企鹅号 - 量化研究方法
编辑 cxdqq