首页 > 编程知识 正文

spss多变量相关性分析,spss多元回归分析

时间:2023-05-06 15:38:43 阅读:152072 作者:1872

毕业后大部分时间至今,我还清晰地记得当时毕业论文不用SPSS的痛苦。 每天,遍访度娘、知乎、知网、优酷、某宝等各大网站,依然找不到使用SPSS完全分析问卷的流程,几乎是零零碎碎的知识,而且几十个视频的解说也很难听懂自己想听的部分。 (当然,只有单因素分析,没有涉及多变量分析。 这篇文章主要是想帮助以前没有接触过SPSS,但因为论文而不得不使用的伙伴。

实证分析主要包括描述性分析、信效度分析、相关分析、假设检验(回归分析)。 在分析之前首先要了解SPSS的分析原理。 数学学得太多的人几乎都知道假说验证的原理。 SPSS软件的基本原理是假设验证。 即,首先H0:A对b没有影响的条件成立,得到分析结果p(SIG.) 0.001/0.01/0.05时,假设不成立。 也就是说,a对b有明显的影响。

用SPSS分析的问卷必须是李克特五级量表或七级量表,学生建议设计五级单因素量表。 问卷数据收集结束后,首先要去除无效问卷(对所有问题回答都选择了一个选项或存在矛盾的回答等问卷),保证数据的准确性。 分析步骤如下。

输入问题和数据以打开SPSS软件,然后在“变量”视图界面中输入问题和设置。 一般设定值为1,意义非常不同,2不同意,3不一定,4同意,5非常同意。 如果输了同样的问卷就好了。 下图:

二.描述性分析

描述性分析主要描述被调查者的基本信息,如性别、学历、年龄、工作年限、居住地等,这类问题一般放在调查问卷的开头(有时放在最后,个人设计调查问卷时喜欢放在开头)。 描述性分析主要是对问卷的均值、标准差进行分析,在均值相同的情况下,比较标准差,标准差越小表示越稳定。

如下图所示: 1、分析-----说明统计----- -选择变量----- -单击选项-----要说明的项目(平均值、方差……) )。

2、分析-----统计----- -频率--- -只要描述选项,就可以得到频率度数。

最后,将自己需要的数据汇总成表格和图表(饼图/条形图等)进行显示。 图表的项目有度数、频率、平均值、标准值等,为了使结果一目了然,用文字进行说明。 (注:以下图表和数据仅作为案例说明,数据不具有准确性和真实性) ) ) ) ) )。

二.信效度分析

信度分析主要验证通过SPSS分析设计的问卷是否可信、问卷主题之间是否存在良好的相关性、被试回答是否存在矛盾、是否可信等。

问卷分析的步骤,点击分析--- -量表--- -可靠性分析--- -选项---确定即可

结果如下

结果分析:一般来说,问卷是否可靠主要看alpha (a系数),a0.7表示设计的问卷可信度不可靠,0.7a0.8表示问卷具有一定的可信度,0.8a0.9表示问卷上面的项目数是选择和分析的调查问卷的数量。

在进行下一步分析时,首先谈谈问卷的设计。 在实证分析的论文中,比较简单的模型可能会影响:个研究对象的影响因素(自变量)可能会影响研究对象的效果(因变量),A H B; 也就是说,论文假设将h作为自变量a会对因子b产生一定的影响。 一般来说,可以找到4、5个影响因素作为自变量,每个影响因素可以设计3~7个问题进行调查。 因此,在进行可靠性分析时,可以对影响因素(每个自变量的问题数)项数)进行一次分析,看看每个自变量的设计问题是否可靠性优异。 (如果某个要素的项数信用度不够高,可以先调整主题内的表达语句、修改或添加关键词来提高信用度,如果修改某个主题信用度过低,可以删除该主题来提高整篇文章的信用度。

三.有效性分析和因子分析

一般来说,效度分析是检验问卷的主题和研究目的是否一致,即不能研究顾客对某产品的满意度,问卷设计的问题是调查某产品的市场覆盖率。 一般分为内容效度和结构效度,内容效度是指问题项目与所测变量的契合度和逻辑一致性。 (我们在设计问卷时,一般会参考或引用前人的问卷,所以内容的有效性没有问题。 当然,设计全新的调查问卷时,需要重点分析内容的有效性)。 结构效度是指衡量问题项所测量变量的能力,实证分析一般重点分析结构效度,并进行探索性因子分析(Exploratory factor analysis,EFA )验证,以证明量表的结构效度。

分析步骤如下。 分析--- -降维-----因子-----选择左边的所有变量到右边的变量框中--- -说明--- -选择初始解和kmo-- -单击继续---提取

结果如下。

结果分析:效度分析结果主要看KMO值和sig.(显著性),如果KMO0.7,问卷设计的自变量之间存在一定关联,说明问卷有效; 根据sig.0.001,该问卷符合进行因子分析,下一步可以进行因子分析(EFA )。

因子分析接合

果如下(仅抽取部分比较重要的图解释):

看碎石图的关键就是找拐点,也就是找图中陡坡和缓坡的临界点(特征值明显较大的因子),趋于平缓前的点有几个则说明这份问卷可以分为几个因子(当然还要结合特征值、总方差解释等图考察)。如上图看出从第7个点开始趋于平缓,即前面有6个点属于陡坡上的点,初步可以说明这份问卷设计的因素可以分为6个因子。

旋转后的成分矩阵的作用是知道那几道题可以归为一个因子,上面截取一部分作为说明(左侧的数字为问卷中的题项,题目内容已删除)。上图可以看到一共6个成分因子,其中问卷题目5、6、7、8、9、10、26可以第一个因子(成分1对下的数字0.769、0.571、0.714…….均大于0.5,即各个测量题项的最大因素负荷均大于0.5,且交叉载荷均小于0.4则可作为一个因子);同理题目27、28则可以作为一个因子,成为4对下的数字为0.797、0.793…….。

总方差解释图主要看累计百分比的项。如上图6个因子在整份问卷中的总解释能力(累计百分比)达到了72.938%(总解释能力>50%可以说明筛选出来的因子有良好的代表性,当然实际操作中一般>80%的问卷因子解释能力比较好)。所以整份问卷基本可以提取出6个因子作为主要变量,其余的为次要变量。

通过上面三个图的分析,可以确定这一份问卷一共可以提取出6个因子(6个自变量)。

五、相关分析

在进行相关分析前首先要取各个因子的平均值(如上面7道题目作为因子1,因子1的平均值就是取7道题目的维度平均。得出6个因子的维度平均值后进行相关分析。

步骤如下:分析----相关----双变量-----将左边的变量选到右边-----在皮尔逊和双变量前打勾----确定。如下图

得出的结果如下:

上图中,假设前面两个为因子1、因子2(自变量),第三个为因变量。相关性是检验自变量与因变量的关系。可以看出因子1与因变量的相关系数为0.779,且sig.<0.001,说明自变量(因子1)与因变量呈正相关。(相关系数的取值范围介于-1~1之间,绝对值越大,表明变量之间的相关越为紧密)。

六、回归分析

回归分析需要看的图有模型摘要图、ANOVA、系数图等等

步骤如下:分析----回归----线性-----选择自变量和因变量----点击统计----选择德、共线性等(看自己需要知道什么就选什么,不一定要选共线性诊断等)---继续----图----选择XY变量-----继续---保存----继续---确定。如下图:

得出结果为:

模型摘要图主要看R方和德宾值(D-W),调整后的R方为0.684说明自变量对因变量的可解释程度为68.4%(R方代表的是自变量对因变量的解释能力,R方与调整后的R方越接近说明数据越稳定)。D-W值是检验自变量之间是否存在自相关,上图中D-W>2表示问卷中的几个自变量无自相关性,(D-W值的范围记得不是很清楚了,见谅…..)。

即方差分析表,ANOVA表的一个作用就是验证假设(A对B不产生影响)是否成立,一般只看sig.值即可,上图sig.<0.01,说明拒绝原假设,至少有一个对因变量产生显著性影响。

下一步看系数表,系数表则说明有几个自变量对因变量产生显著性影响。如下图:

上图中回归系数b是通过样本及回归模型通过SPSS计算得出的,是反映当自变量x的变动引起因变量y变动的量。主要看显著性,因子1、2、3的sig.<0.05,说明3个因子均对因变量产生显著性影响。

从上面可以看出,相关性分析是检验自变量与因变量之间是否具有相关性(正向或反向相关),回归分析则说明了自变量对因变量是否具有显著性影响。

当然上面提到的步骤和图大部分是我感觉论文需要用的,还有很多像散点图等一些小细节很多也没有写,一个是因为篇幅有限,一个也是因为时间也过去大半年了,有很多也记得不是很清楚了,上面写的内容基本是我去年写论文后学到的,很多都是个人的理解,仅供参考。希望大家毕业季顺利!

——————————————-—— 更新一下——————————————————

最近电脑借给别人了,本来想等拿回电脑再跟新一下,想想还是趁着这两天闲一点回答一下各位的问题。

在写这一篇文章的时候我想我已经说得很清楚了,本人非SPSS专业,大学期间也没有开设过这门课程,仅仅是写论文的时候涉及了单因素分析的一点皮毛,多因素及多元回归分析并未涉及,可以说我会的基本已经在文章中写出来了。我的毕业论文也仅仅是构建简单的模型和简单相关回归分析得出简单的结论。所以说毕业涉及关联分析,卡方检验,中介变量和多元回归分析,数据有问题等比较深入的知识的小伙伴也不要为难我了,不是不想回答,实在是问了我也不懂啊。

以下整理了一些简单的问题回答一下:

一、录入问卷数据的具体步骤:

第一种方法:打开SPSS软件,可以看到SPSS左下角有两个视图界面----数据视图和变量视图,点击变量视图,可以看到“名称、类型、宽度、值”等一些列,在“名称”那一列输入问卷题目,“类型”那一列设置为数值、在“值”的那一列赋值,具体怎么赋值看个人问卷的设计,一般情况下可以设置为1非常不同意,2不同意,3不一定,4同意,5非常同意。(具体能不能反方向设置,我觉得要看分析结果,怎么设置能得出有效的信度效度分析结果数据就怎么来,论文答辩也不可能要你用电脑一步一步来操作,并且像赋值这么简单的问题也不可能会问,只要能把一篇论文从头到尾圆润起来,其他的细节没必要那么较真)。

第二种方法:现在问卷数据收集一般是在问卷星或其他网站上发布,数据收集完成后可以在问卷星或别的网站上将自己的问卷下载成excel格式的文件,打开SPSS直接导入excel文件(点击文件---打开---数据---选择excel数据类型--导入)。

二、如何求每个维度的平均?

在做相关性分析前首先求维度平均,打开Spss,在窗口栏点击“转换--计算变量”,pggz输入每个因子对应的题目和公式就可以得出维度对应的均值平均。如下图:比如说维度1对应的题目有3道题,在目标变量的框中填上维度1,在数字表达式的框中写上公式:=(题目1+题目2+题目3)/3。

求出各个维度的均值,然后就可以进行相关分析了,直接将均值得分的各个维度选到相关分析的变量框中就可以,接下来的步骤看以上文章。

三、对自变量进行效度分析,这个时候是不是在抽取里应该选特征值大于4的,然后才能出来4个公因子?

不是,特征值选大于1就行了。因子分析的目的是降维,筛选出能解释题目数量比较多的因子。这就是说明为什么一个因子维度能对应几道题目。如果一个因子只能解释一题目甚至连1道题目的方差都不能解释,那么这个因子在这份问卷中也没有什么意义了,可以直接忽视。所以说提取特征值大于几和公因子的数量没有很大的关系,一般来说,提取特征值大于1是比较公认的标准。特征值大于1的意思是提取出的因子能解释1道题以上的方差,如果选大于4的话则说明接下来提取出的因子则可以解释4道题以上的方差。

四、在信度分析时,那个值该怎么写,问卷信度总是0.5多 ,不懂那个值怎么写?

信度分析主要看Alpha(a系数),a<0.7则表示设计的问卷信度不可靠,0.7<a<0.8则说明问卷具有一定的可靠性,0.8<a<0.9则说明问卷信度很好。0.5小于0.7说明问卷信度不可靠,接下来的分析也用不到了,建议调改问卷或数据。

五、如果两个变量的sig值为0.531,说明了什么?

SPSS的原理是假设A对B不产生影响,分析得出的结果P(sig.)<0.001/0.01/0.05,则假设不成立,即A对B具有显著性影响。如果sig.=0.531大于>0.05,说明假设成立,A对B(或B对A)不产生影响,任何一方变动都不会影响另一方。

六、如果要做多个因素对一个结果的影响程度,应该使用什么分析?

多个自变量对一个因变量的影响分析,参考我的文章,一般信度效度分析,相关分析,线性回归分析即可。

七、为什么我的相关性分析出来没有星号?

有没有星号这个什么原因我也不清楚,你可以看一下你使用的版本,我用SPSS24.,相关分析有星号,回归分析没有星号。星号对数据有什么影响我也不清楚,去年我写论文的时候也没有关注个这个问题。

八、这些数据得出来了,怎么运用到论文中呢?

这个问题我真不知道怎么回答......数据得出来了,就说明你的实证分析那一章也写好了。结论建议那一章就可以根据分析结果提出来。前面的绪论、文献综述这些纯理论性的也不用说了,数据分析前模型假设/问卷设计这一章写完了才可以进行实证分析也不用考虑了......

九、一个维度至少3-7个题目是在哪本书上看?

没有在哪本书看到的,大概是在知网的期刊和论文上看到的,参考的论文一般也是3到7个问题,维度对应的4、5个问题的居多。

十、中文版在哪下载:

去年我是在淘宝花的十几块钱买下载的,现在很多人反映已经安装不了了,大家可以在微信搜索安装包,很多公众号可以免费领取噢

更新更新更新更新!!!!!!!!

还是有很多小伙伴问维度平均怎么求,今天特意用SPSS操作了一遍,回答一下之前的问题。

第一:有人问维度是什么,怎么来的,简单的说,维度就是因子,一个因子就代表一个维度,在做因子分析的时候,我们就能把问卷的所有问题归类,哪几道题归为一个因子,就说明这几道题属于一个维度,一份问卷有几个因子就说明有几个维度。所以维度就是做因子分析得出来的结果。

第二:维度平均的操作步骤

上面也多多少少说过怎么算,不过还是有很多小伙伴算不出,今天我就具体说一下。

1.在SPSS的窗口栏上点击转换----计算变量,如下图:

2.在计算变量界面上命名目标变量和输入公式,公式之间点击界面键盘上的数字及符号输入,如下图:

3.点击确定后SPSS输出界面如下:

4.返回SPSS数据视图和变量视图在问卷数据旁边会增加一列均值数据,如下图:

且在计算变量界面下的类型和标签框中也会增加维度平均的标签,如下图:

这样一个维度平均值就算出来了,每个维度平均算出来之后,就可以进行相关分析和回归分析了。

希望大家都能顺利!

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。