首页 > 编程知识 正文

spss modeler入门到精通,spss 正态分布

时间:2023-05-05 19:58:05 阅读:282430 作者:2944


包括所有可以出现的表、意义和模型好坏的判断标准。

回归模型的参数设置

1,在回归模型前设置类型,角色分配:1个目标,多个输入,无关的数据角色选择“无”;
2,在【字段】中选择使用预定角色;
3,在【模型】中按需求选择建模方法;可参考SPSS回归节点四种建模方法的原理
注:当模型不再将新字段纳入模型,也不再将已有字段移出模型时,完成回归模型的建立。建模时,纳入F概率<移除F概率,纳入F值>移除F值。

4,在【专家】中,一般不调整异常值容差,为解释完整,在【输出…】中勾选全部选项,实际项目中可以按需勾选

其他模块中的内容易懂,本文主要解释【高级】中的输出含义。
输出目录概览如下:

Descriptive Statistics 描述性统计

对所有输入和目标等字段的描述性统计,包括Mean(均值),Std.Deviation(标准差),N(建模使用到的记录数)。

Correlations 相关性

1【 Pearson Correlation 】皮尔逊相关
表示变量之间的两两相关性。在输出——Statistics统计量节点中也可以输出Pearson相关矩阵。
2【 Sig.(1-tailed) 】单脱尾显著性
显著性往往与0.05作比较
因为 α = 1-置信水平,而置信水平往往取>0.9或0.95
3【 N 】
数据数量。

Variables Entered/Removed 变量的移入/移出

实质上为建模的过程。根据模型设置中建模方法(进入法、步进法、后退法、前进法)的选择不同,变量的移入移出(是否参与构建回归模型)过程也不同。其他输出结果也会有差异,但模型总体差距不大。

Model Summary 模型总览

【R²】 R Square值越接近1,模型拟合效果越好。
【A~R】Adjusted R Square修正的R²值,考虑了对模型复杂度的 ”惩罚“ 。每有一个新的变量加入构建模型,R²会上升,但模型复杂度也同时变高,拟合度评分上升,但复杂度评分下降,因此A~R²可以看成同时考虑了拟合度和复杂度的模型质量评分。
【Std. Error of the Estimate】预估的标准误。
【Change Statistics】
【Selection Criteria】选择标准。信息论中的信息准则。其中AIC中有K、L两个变量,k越小,AIC越小,模型简洁度越好;L越大,AIC越小,模型精确度越好。因此AIC值越小越好。类似的其他值也有相应的公式计算方法,可自行搜索了解。
【Durbin-Waston】DW值通常在[0,4]范围内,若在2左右,表示输入变量之间的相关性较弱,模型效果较好。

ANOVA 方差分析

方差和Sum of Squares,自由度df,均方差Mean Squares,F值和显著性Sig.
自由度df:可以任意取值的变量个数。n各估计参数,自由度为n-1。
《自由度-F值表》中有df与其对应F值的标准,若F值<标准F值,则差异不明显,若F>标准F值,则差异度很大。具体可查找F检验和T检验的资料。

Coefficients 回归系数

【Unstandardized Coefficients】 非标化回归系数
【Standardized Coefficients】 标化回归系数,做了标准化后的回归系数。
【Collinearity Statistics】共线性统计。
Tolerance容忍度 = (1-R²) = 1/VIF。
VIF值即方差膨胀系数,VIF<10是可接受的,说明变量间的独立性较高,没有共线性问题存在。
【95.0% Confidence Interval for B】置信度95%的置信区间。

Coefficient Correlations 系数相关性

【Correlations】相关性。除对角线外的值应小于0.7,否则模型是需要调整的。
【Covariances】协方差

Collinearity Diagnostics 共线性描述

【Condition Index】条件数<10,不存在多重共线性

Residuals Statistics 残差统计

最小值、最大值、均值、标准差、数据量。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。