spss modeler入门到精通,spss 正态分布

包括所有可以出现的表、意义和模型好坏的判断标准。

回归模型的参数设置

1，在回归模型前设置类型，角色分配：1个目标，多个输入，无关的数据角色选择“无”；
2，在【字段】中选择使用预定角色；
3，在【模型】中按需求选择建模方法；可参考SPSS回归节点四种建模方法的原理
注：当模型不再将新字段纳入模型，也不再将已有字段移出模型时，完成回归模型的建立。建模时，纳入F概率<移除F概率，纳入F值>移除F值。

4，在【专家】中，一般不调整异常值容差，为解释完整，在【输出…】中勾选全部选项，实际项目中可以按需勾选

其他模块中的内容易懂，本文主要解释【高级】中的输出含义。
输出目录概览如下：

Descriptive Statistics 描述性统计

对所有输入和目标等字段的描述性统计，包括Mean（均值），Std.Deviation（标准差），N（建模使用到的记录数）。

Correlations 相关性

1【 Pearson Correlation 】皮尔逊相关
表示变量之间的两两相关性。在输出——Statistics统计量节点中也可以输出Pearson相关矩阵。
2【 Sig.(1-tailed) 】单脱尾显著性
显著性往往与0.05作比较
因为 α = 1-置信水平，而置信水平往往取>0.9或0.95
3【 N 】
数据数量。

Variables Entered/Removed 变量的移入/移出

实质上为建模的过程。根据模型设置中建模方法（进入法、步进法、后退法、前进法）的选择不同，变量的移入移出（是否参与构建回归模型）过程也不同。其他输出结果也会有差异，但模型总体差距不大。

Model Summary 模型总览

【R²】 R Square值越接近1，模型拟合效果越好。
【A~R】Adjusted R Square修正的R²值，考虑了对模型复杂度的 ”惩罚“ 。每有一个新的变量加入构建模型，R²会上升，但模型复杂度也同时变高，拟合度评分上升，但复杂度评分下降，因此A~R²可以看成同时考虑了拟合度和复杂度的模型质量评分。
【Std. Error of the Estimate】预估的标准误。
【Change Statistics】
【Selection Criteria】选择标准。信息论中的信息准则。其中AIC中有K、L两个变量，k越小，AIC越小，模型简洁度越好；L越大，AIC越小，模型精确度越好。因此AIC值越小越好。类似的其他值也有相应的公式计算方法，可自行搜索了解。
【Durbin-Waston】DW值通常在[0,4]范围内，若在2左右，表示输入变量之间的相关性较弱，模型效果较好。

ANOVA 方差分析

方差和Sum of Squares，自由度df，均方差Mean Squares,F值和显著性Sig.
自由度df：可以任意取值的变量个数。n各估计参数，自由度为n-1。
《自由度-F值表》中有df与其对应F值的标准，若F值<标准F值，则差异不明显，若F>标准F值，则差异度很大。具体可查找F检验和T检验的资料。

Coefficients 回归系数

【Unstandardized Coefficients】非标化回归系数
【Standardized Coefficients】标化回归系数，做了标准化后的回归系数。
【Collinearity Statistics】共线性统计。
Tolerance容忍度 = （1-R²） = 1/VIF。
VIF值即方差膨胀系数，VIF<10是可接受的，说明变量间的独立性较高，没有共线性问题存在。
【95.0% Confidence Interval for B】置信度95%的置信区间。

Coefficient Correlations 系数相关性

【Correlations】相关性。除对角线外的值应小于0.7，否则模型是需要调整的。
【Covariances】协方差

Collinearity Diagnostics 共线性描述

【Condition Index】条件数<10，不存在多重共线性

Residuals Statistics 残差统计

最小值、最大值、均值、标准差、数据量。