首页 > 编程知识 正文

spss里主成分分析操作,spss主成分分析作用

时间:2023-05-04 18:59:33 阅读:185545 作者:4748

主成分分析在SPSS中的操作APP

主成分分析在SPSS下的操作主成分分析原理主成分分析概述利用主成分分析数学模型对沿海10个省市的经济综合指标进行主成分分析,绘制图表的方法一方法二结果方法二结果参考链接

主成分分析的原理主成分分析是将原来许多具有一定相关性的(如PP个指标)重组为互不相关的新综合指标组,以代替原来的指标。 通常的数学处理是将原始PP个指标进行线性组合,作为新的综合指标。 最典型的方法是用F1F1 (选定的第一个线性组合,即第一个综合指标)的方差来表示。 也就是说,var(f1 )var(f1 )-f1 )越大,表示F1F1中包含的信息越多。 因此,在所有线性组合中选择的F1F1的方差应该最大,所以将F1F1称为第一主成分。 在第一主成分不足以表示原始PP的一个指标的信息的情况下,考虑到选择F2F2,即选择第二线性组合,为了有效地反映原始信息,F1F1的现有信息没有必要出现在F2F2中,从数学上来说是Cov(F1,F2 )

主成分分析法概要的有名工作之一是1947年美国统计学家斯通()做了关于国民经济的研究。 他利用美国1929年至1938年各年的数据,得到了反映国民收入和支出的17个变量要素,包括雇主补贴、消费资料和生产资料、净公共支出、净增加库存、股息、利息对外贸易平衡等。

进行主成分分析后,以97.4 的精度,将原来的17个变量替换为3个新变量。 根据经济学知识,斯通将这三个新变量分别命名为总收入F1F1、总收入变化率F2F2、经济发展或衰退的趋势F3F3。

主成分与原始变量之间的关系:

主成分保存着原始变量的大部分信息。 主成分的数量大大少于原始变量的数量。 各主要成分之间互不相关。 各主成分是原变量的线性组合。 主成分分析数学模型

f1=a 11 zx 1a 21 zx2a P1 zxpf2=a 12z x 1a 22 zx2AP2zxpf3=a1 mzx 1a2mzx2APM zxp { f1=a 11 zx 1a 21 zx2a P1 zxpf2=a 12z x 1a 22 zx2AP2zxpf3=a 122 AP2zxp2

其中,a1i,a2i,API(I=1,m ) a1i,a2i,API ) I=1,m是与XX的协方差阵列的特征值较多地对应的特征向量,ZX1,ZX2,ZXp

a=(AIJ ) pm=(a1,a2,am,) a=(AIJ ) pm=) a1,a2,am,),Rai=iaiRai=iai,RR是相关系数矩阵,ii,AIA

进行主成分分析主要步骤如下:

根据研究问题选择指标和数据进行指标数据标准化(自动执行SPSS软件Factor流程); 进行指标间相关判定,决定主成分的个数mm; 确定主成分FiFi公式; 进行主成分FiFi命名; 计算主成分的值,进行评价和研究。 论沿海10个省市经济综合指标主成分分析地区GDP人均GDP农业增加值工业增加值第三产业增加值固定资产投资基本建设投资社会消费品零售总额海关出口总额地方财政收入辽宁5458.2130014883.31376.22258.41315.95292258.4123 1115 413903502.538512288.71070.73181.9211.1610.2河北6076.69047950.21406.72092.61161.6597.11968.345.9305 8384.7643.7上海5408.84062786.22196.22755.81970.2779.32035 94.2566.9福建省4682135106631047.11859964.53939930

分析软件 Factor 过程 [2] 对沿海 10 个省市经济综合指标进行主成分分析。具体操作步骤如下:

点击:分析→降维→因子… , 弹出因子分析对话框;
把 X1~X10X1~X10 选入变量框;点击:描述→系数(勾选); 提取→碎石图; 得分→显示因子得分系数矩阵;最后点击确定;生成图表

​ SPSS 在调用 Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但 SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用 Descriptives 过程进行计算。

如,GDP和GDP的相关性为1,自己和自己相关性最强;人均GDP和GDP的相关性为-0.094,说明两者相关性不强;等等;
从上表可知 GDP 与工业增加值, 第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系, 与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强, 证明他们存在信息上的重叠。

 

左图:可以看出第一个特征GDP占72.205%,前两个特征累计占84.551%;所以提取2个主成分,即m=2。
右图: 可知 GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷, 说明第一主成分基本反映了这些指标的信息; 人均 GDP 和农业增加值指标在第二主成分上有较高载荷, 说明第二主成分基本反映了人均GDP 和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息, 所以决定用两个新变量来代替原来的十个变量。

方法一

用成分矩阵中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数 ;
例如:F1F1系数 a11=0.9497.220√=0.353a11=0.9497.220=0.353,F2F2中a11=0.1951.235√=0.175a11=0.1951.235=0.175

F1=0.353ZX1+0.042ZX2−0.041ZX3+0.364ZX4+0.367ZX5+0.366ZX6+0.352ZX7+0.364ZX8+0.298ZX9+0.355ZX10F1=0.353ZX1+0.042ZX2−0.041ZX3+0.364ZX4+0.367ZX5+0.366ZX6+0.352ZX7+0.364ZX8+0.298ZX9+0.355ZX10

F2=0.175ZX1−0.741ZX2+0.609ZX3−0.004ZX4+0.063ZX5−0.061ZX6−0.022ZX7+0.158ZX8−0.046ZX9−0.115ZX10F2=0.175ZX1−0.741ZX2+0.609ZX3−0.004ZX4+0.063ZX5−0.061ZX6−0.022ZX7+0.158ZX8−0.046ZX9−0.115ZX10

上式中ZXiZXi是归一化之后的数据,使用SPSS进行数据标准化,方法如下:
1. 点击:分析→描述统计→描述;
2. 将所有选项导入变量中;
3. 勾选标准化值;

生成归一化之后的Z值:

例如:求辽宁的F1=0.353∗−0.35567+0.042∗−0.31866+……+0.355∗−0.34163F1=0.353∗−0.35567+0.042∗−0.31866+……+0.355∗−0.34163;
求F2F2方法类似;
F=(72.2/84.5)F1+(12.3/84.5)F2F=(72.2/84.5)F1+(12.3/84.5)F2

方法二

使用成份得分矩阵求F1和F2F1和F2。

直接使用成分得分系数做为系数,如下公式:
F1=0.131ZX1+0.015ZX2−0.015ZX3+0.135ZX4+0.137ZX5+0.136ZX6+0.131ZX7+0.135ZX8+0.111ZX9+0.132ZX10F1=0.131ZX1+0.015ZX2−0.015ZX3+0.135ZX4+0.137ZX5+0.136ZX6+0.131ZX7+0.135ZX8+0.111ZX9+0.132ZX10

F2=0.158ZX1−0.667ZX2+0.548ZX3−0.004ZX4+0.056ZX5−0.055ZX6−0.020ZX7+0.142ZX8−0.041ZX9−0.104ZX10F2=0.158ZX1−0.667ZX2+0.548ZX3−0.004ZX4+0.056ZX5−0.055ZX6−0.020ZX7+0.142ZX8−0.041ZX9−0.104ZX10

F=(72.2/84.5)F1+(12.3/84.5)F2F=(72.2/84.5)F1+(12.3/84.5)F2

方法一结果

方法二结果

参考链接

论文:主成分分析在SPSS中的操作应用
视频:主成分分析法

转载于:https://blog.csdn.net/MissXy_/article/details/81107204

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。