首页 > 编程知识 正文

spss线性回归分析结果解读,spss线性回归r方多大才有效

时间:2023-05-05 09:16:12 阅读:189376 作者:4053

SPSS-线性回归注释总结。 本文只是对SPSS结果的分析,推导有空再做

参考文献:

3359 blog.csdn.net/QY sh123/article/details/73801391

33559 www.mediecogroup.com/method _ article _ detail/45 /

33559 www.mediecogroup.com/method _ article _ detail/51 /

线性回归假设前提线性回归分析首先需要满足以下8个假设。

假设1 :变量是连续变量。

假设2 :自变量为2个以上(可以是连续变量也可以是分类变量,多重线性回才需要满足)。

假设3 :各观测值之间相互独立,即残差之间不存在自相关。

假设4 :变量和自变量之间存在线性关系。

假设5 :残差方差一致。

假设6 :不存在多重共线性。

假设7 :无显著异常值。

假设8 :残差接近正态分布。

结果的图表分析简单说明这三个图的结果。

表r表示拟合优度(goodness of fit ),用于测量估算模型相对于观测值的拟合优度。 值越接近1表示模型越好。

第二个指标r2(rsquare )表示回归模型中自变量对因子变量变异的解释程度,是分析回归结果的开始。 例如,R2=0.489表示自变量可以说明48.9%的因变量的变异。 但是,R2夸大了自变量对因变量变异的解释程度,如果模型中增加1个自变量,则即使该自变量在统计上不明显,R2也会增大。

R-square与Adjusted R-squared的配合与区别R-square (取值范围0-1 ) :编写的输入变量对输出变量的解释程度。单变量线性回归中R-square越大表示拟合越好。

但是,如果添加更多的变量,R-squared将保持不变或增加,无论添加的变量是否与输出变量有关。

因此,需要添加r-squared。 adjusted R-squared将惩罚向添加到添加的不改善模型效果的变量中。

调整的r平方。 与R2不同,排除参数个数的影响。 这样,adjusted R2将始终小于R2,并且adjusted R2的值不会随着参数数量的增加而接近1。 adjusted R2也是影响度的评价指标,比调整前的r平方更准确。 图中的最终调整r方为0.550,表示自变量全部可以说明变量的55%引起的变化(variance )。

结论3358www.Sina.com/线性回归时,使用单变量评估,R-square时,使用多变量

另外,由于使用swlr分析了——回归3354线性3354“方法”并选择了“步骤”,使得模型1、2、3的r侧逐渐变大,标准误差逐渐变小

网友认为,拟合优势达到0.1时小效应(r方0.01 ),0.3为中等(r方0.09 ),0.5为大效应),这是自然科学的一般局限性。 实际上,我个人觉得r方没有0.5就非常小)

第二个表Anova显示了方差分析结果。 主要看f值和sig值这两个。 f值是方差分析的结果,是表示回归方程式整体有无使用价值的回归方程式整体的循环检查。adjusted R-square

另外,从f值的观点来看,其F值对应的Sig值小于0.05就可以认为回归方程是有用的的值为回归式的F,表示模型中的被解释变量与所有解释变量之间的线性关系整体上是否被明显地推定对于显著性检验,拒绝原始假设。 也就是说,模型中注册的每个解释变量被合并在一起,对被解释变量有显著影响,反之则没有显著影响。

现在简要说明fa(k,n-k-1 ),其中k是自变量的数量,n是样本容量,n-k-1是自由度。 在实验中,k=3,样品容量为146,所以查表时应该有fa (3,142 )的差。 一般的数理统计教科书都有f分布表,有a表示的显著水平),但手边不一定有教科书,需要在excel中查询f表,打开excel输入官方区域。 )。

需要注意的是,方差分析是对多个参数的总体检查,而不是单个参数。 (单一自变量位于系数表中,为单一样本t检验。 这是第三个表回归系数表的内容。

系数表显示自变量的显著性检查结果(使用单一样品的t检查),最后一列为t检查的sig,表中均小于0.05,表明自变量显著性显示在因变量中

响,B表示各个自变量在回归方程中的系数,负值表示IPGF这个自变量对因变量有显著的负向影响,但是由于每个自变量的量纲和取值范围不同,基于B并不能反映各个自变量对因变量影响程度的大小,这时候我们就要借助标准系数。目前表格中的“试用版”实际上是Beta的意思,此时数值越大表示对自变量的影响更大。

从这个分析过程来看,这个实验结果还挺理想的。

选择所述Durbin-Watson选项,SPSS输出Durbin-Watson检验的结果。Durbin-Watson检验常用来检测残差是否存在自相关。

一般来说,Durbin-Watson检验值分布在0-4之间,越接近2,观测值相互独立的可能性越大。本研究Durbin-Watson检验值为2.257,说明观测值具有相互独立性,满足假设3。

但不得不说,Durbin-Watson检验不是万能的。它仅适用于对邻近观测值相关性的检验(1st-order autocorrelation)。举例来说,我们一般按照调查顺序录入数据,将第一位研究对象录入到第一行,再将第二位研究对象录入到第二行。在这种情况下,Durbin-Watson检验可以检测出第一位研究对象和第二位研究对象之间的相关性。但是如果我们乱序录入数据,将第一位研究对象和可能与他存在自相关的第二位研究对象离得很远,Durbin-Watson检验的结果就不准确了。因此,我们需要慎重对待Durbin-Watson检验的结果。

其实,观测值是否相互独立与研究设计有关。如果研究者确信观测值不会相互影响,我们甚至可以不进行Durbin-Watson检验,直接认定研究满足假设3。

标准化残差的直方图

从图中可以看出,标准化残差近似正态分布。但是由于横纵坐标比例的影响,柱状图的结果可能不准确,我们需要绘制P-P图进一步验证。

P-P图

P-P图各点分布离对角线越近,提示数据越接近于正态分布;如果各点刚好落在对角线上,那么数据就是正态分布。

简单线性回归仅要求回归残差接近于正态分布,因此根据上图,我们认为该数据满足假设:残差近似正态分布。

相较于直方图, P-P图可以更加明显、准确地判断数据的正态性。因此判断正态性时,需要谨慎对待直方图的结果,应结合P-P图全面分析。

撰写结论 eg:

采用简单线性回归模型分析久坐时间对胆固醇浓度的影响。通过绘制散点图,直观判断两者之间存在线性关系,并通过绘制标准化残差散点图和带正态曲线的直方图和P-P图,判断残差方差齐且近似正态分布。同时为了保证数据的代表性,我们剔除了一项异常值(胆固醇浓度为6.94mmol/L)。

回归方程为:胆固醇浓度= 3.64856+(0.00632×久坐时间)。久坐时间对胆固醇浓度的影响有统计学意义,F=161.926,P <0.001;久坐时间可以解释胆固醇浓度变异的62.5%,影响程度中等(调整R2= 62.2%)。久坐时间每增加1分钟/天,胆固醇浓度增加0.00632 (95% CI:0.00533-0.00731)mmol/L。

001;久坐时间可以解释胆固醇浓度变异的62.5%,影响程度中等(调整R2= 62.2%)。久坐时间每增加1分钟/天,胆固醇浓度增加0.00632 (95% CI:0.00533-0.00731)mmol/L。

此外,久坐时间为160分钟/天、170分钟/天和180分钟/天的胆固醇浓度预测值分别为4.660 (95% CI:4.517-4.802)mmol/L、4.723 (95% CI:4.589-4.857)mmol/L和4.786 (95% CI:4.661-4.91)mmol/L。"

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。