因子分析和主成分分析
实验目的
学习利用SPSS进行因子分析和主成分分析。
二、实验性质
选修,基础层次
三、主要仪器及试材
计算机及SPSS软件
四、实验内容
因子分析
五、实验学时
2学时
六、实验方法与步骤
1。 开机;
2. 找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS; 3. 按要求建立数据文件; 4. 进行统计分析; 5。 撰写实验报告; 6. 关闭SPSS,关机。
七、实验注意事项
1。 实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。 2. 遇到各种难以处理的问题,请询问指导教师.
3. 为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存
储器。
4. 每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验
室管理人员同意.
5. 上机时间,禁止使用计算机从事与课程无关的工作。
八、上机作业
例1:下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,
请对该资料进行因子分析。 X1 3.76 8。59 6。22 7。57 9。03 X2 3。66 4.99 6。14 7。28 7.08 X3 0.54 1。34 4.52 7.07 2。59 X4 5。28 10。02 9.84 12.66 11.76 X5 9。77 7。5 2.17 1.79 4.54 X6 13。74 10。16 2.73 2.10 6.22 X7 4。78 2.13 1.09 0。82 1。28 5.51 3.27 8.74 9。 9。73 8.59 7。12 4.69 5。51 1。66 5.90 9.84 8.39 4.94 7。23 9。46 9。55 4。94 8。21 9。41
3。98 0。62 7.01 9.49 1.33 2。98 5.49 3.01 1.34 1。61 5。76 9.27 4.92 4.38 2。30 7.31 5.35 4.52 3。08 6.44 1.30 0。44 3。31 1.03 1。00 1。17 3。68 2.17 1。27 1。57 1。55 1.51 2.54 1.03 1.77 1。04 4.25 4.50 2.42 5。11 6。92 3。36 11.68 13。57 9.87 9.17 9。72 5.98 5。81 2。80 8.84 13.6 10。05 6.68 7。79 12。00 11。74 8。07 9。10 12.5 5。33 7。63 3.53 13.13 9.87 7.85 2. 2.76 4。57 1.78 5。40 9。02 3。96 6.49 4。39 11。58 2。77 1。79 3.75 2。45 7.30 8。84 4。76 18。52 11.06 9。91 3.43 3。55 5.38 2。09 7。50 12.67 5.24 9。06 5.37 16。18 3。51 2。10 4.66 3。10 2.40 8.39 1。12 2.35 3。70 2.62 1.19 2。01 3。43 3.72 1.97 1.75 1.43 2.81 2。27 2.42 1。05 1.29 1.72 0。91 实验步骤:
1.建立数据文件。定义变量名:分别为X1、X2、X3、X4、X5、X6、X7,按顺序输入相应数
值,建立数据文件,保存为“生化检验\"。
2.选择菜单“分析→降维→因子分析” ,弹出“因子分析”对话框.在对话框左侧的变量
列表中选变量X1至X7,进入“变量”框,如图1。
3.单击“描述”按钮,弹出“因子分析:描述统计\"对话框,在“统计量\"中选“单变量描述
性”项,输出各变量的均数与标准差,“在相关矩阵\"栏内选“系数\",计算相关系数矩阵,并选“KMO 和Bartlett的球型度检验”项,对相关系数矩阵进行统计学检验,如图2.
图1
图2
4.单击“抽取”按钮,弹出“因子分析:抽取”对话框,选用“主成分”方法提取因子,
如图3。
图3
5.单击“旋转\"按钮,弹出“因子分析:旋转”对话框,在“方法”栏中选择“
差”进行因子正交旋转,如图4。
6.单击“得分\"按钮,弹出“因子分析:得分”对话框,选择“回归\"项估计因子得分系数,如
图5.
7.单击“确定”,得到输出结果。
最大方
图4
图5
实验结果
(1)考察原有变量是否适合进行因子分析
表1
表1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表2
由表1—2可知,巴特利特球度检验统计量观测值为326。191,相应的概率p值接近0,如果显著性水平α为0。05,由于概率p值小于显著性水平α,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0.321,根据Kaiser给出的KMO度量标准可知KMO值偏小,意味着因子分析的结果可能不能接受。
(2)提取因子
表3
表4
表3和表4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这7个指标。方差分解表也表明前两个因子能够解释7个指标的88.593%.综合以上,提取前两个因子最好了。
(3)因子的命名解释
表5
表6
由表5、表6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释.因子1主要解释的是X1、X2、X4、X7,命名为FAC1_1;而因子2主要解释的是其余三个指标,X3、X5、X6。命名为FAC2_1。
九、课外作业:
1。 数据文件“development。sav”是某年我国各省发展状况的一些指标,包括人均GDP、
人力资源指数CAPITAL、人均收入INCOME、人均净收入NETINC、教育指数、健康指数,试用主成分法或者因子分析法寻找这些指标主要代表了发展状况的哪些特征,以及各省市的发展程度排序.
2。 对某市15个大中型工业企业经济效益进行分析。经研究,从有关经济效益指标中选择7
个指标作分析,即:固定资产产值率、固定资产利税率、资金利润率、资金利税率、流动资金周转天数、销售收入利税率和全员劳动生产率,数据文件为“某市工业企业效益指标。sav”,试研究该市大中型工业企业经济效益的状况及差异。
1、实验步骤:
1.打开数据文件“development。sav”.
2.选择菜单“分析→降维→因子分析” ,弹出“因子分析”对话框.在对话框左侧的变量
列表中选变量gdp,capital,income,netinc,education,healcare,进入“变量”框,如图1—1。
3.单击“描述”按钮,弹出“因子分析:描述统计”对话框,在“统计量\"中选“单变量描
述性”项,输出各变量的均数与标准差,“在相关矩阵”栏内选“系数\",计算相关系数矩阵,并选“KMO 和Bartlett的球型度检验\"项,对相关系数矩阵进行统计学检验,如图1—2。
图1—1
图1—2
4.单击“抽取”按钮,弹出“因子分析:抽取”对话框,选用“主成分”方法提取因子,如
图1-3。
图1—3
5.单击“旋转\"按钮,弹出“因子分析:旋转”对话框,在“方法”栏中选择“ 最大方
差”进行因子正交旋转,如图1-4.
6.单击“得分”按钮,弹出“因子分析:得分\"对话框,选择“回归”项估计因子得分系数,
如图1-5.
7.单击“确定”钮,得到输出结果.
图1—4
图1—5
2、实验结果
(1)考察原有变量是否适合进行因子分析
表1—1
表1—1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表1-2
由表1—2可知,巴特利特球度检验统计量观测值为148。715,相应的概率p值接近0,如果显著性水平α为0.05,由于概率p值小于显著性水平α,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0.635,根据Kaiser给出的KMO度量标准可知原有变量适合进行因子分析。
(2)提取因子
表1—3
表1-4
表1-3和表1-4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这6个指标.方差分解表也表明前两个因子能够解释6个指标的85。255%。综合以上,提取前两个因子最好了。
(3)因子的命名解释
表1-5
表1—6
由表1-5、表1—6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释。因子1主要解释的是人均GDP、人均收入和人均净收入,可以命名为经济因子;而因子2主要解释的是其余三个指标,人力资源指数、EDUCATION和健康指数。可以命名为民生因子.因子分析要求,最后得到的因子之间没有相关性,而因子转换矩阵显示,两个因子相关.可见,对因子进行旋转是完全有必要的.
(4)计算因子得分
表1—7
根据表1—7可写出以下因子得分函数:
F1=0.362人均GDP+0.038人力资源指数+0.332人均收入+0.350人均净收入-0。030EDUCATION—0.151健康指数
F2=-0。074人均GDP+0.324人力资源指数-0。059人均收入-0.025人均净收入+0。397EDUCATION+0.445健康指数
(5)计算综合得分。单击“转换→计算变量\",新建输出变量,命名为“score分”并输入其计算公式,如图1-6所示。然后,新建一个变量“rank”,一次输入1到29 。很清楚地可以对29个省进行评价。
图1—6
图1—7
综合以上分析,可以认为①指标人均GDP、人均收入、人均净收入代表了发展状况中的经济特征,而指标人力资源指数、健康指数、教育则代表了发展状况中的民生特征.
②各省市的排序如图1—7所示,即为上海>北京>广东〉江苏>浙江>辽宁>天津〉山东>四川〉河北〉福建〉湖北>湖南〉黑龙江>河南〉广西>安徽〉吉林>海南>云南>〉江西〉陕西>山西>内蒙〉贵州>甘肃〉青海〉宁夏
2、实验步骤:
1.打开数据文件“某市工业企业效益指标.sav”.
2.选择菜单“分析→降维→因子分析” ,弹出“因子分析\"对话框.在对话框左侧的变量列
表中选变量x1至x7,进入“变量”框,如图2-1。
3.单击“描述”按钮,弹出“因子分析:描述统计”对话框,在“统计量”中选“单变量
描述性\"项,输出各变量的均数与标准差,“在相关矩阵”栏内选“系数\",计算相关系数矩阵,并选“KMO 和Bartlett的球型度检验”项,对相关系数矩阵进行统计学检验,如图2-2。
图2-1
图2—2
4.单击“抽取”按钮,弹出“因子分析:抽取”对话框,选用“主成分\"方法提取因子,如
图2-3。
图2—3
5.单击“旋转”按钮,弹出“因子分析:旋转”对话框,在“方法”栏中选择“ 最大方
差”进行因子正交旋转,如图2—4。
6.单击“得分”按钮,弹出“因子分析:得分”对话框,选择“回归”项估计因子得分系数,
如图2-5.
7.单击“确定”钮,得到输出结果。
图2—4
图2—5
2、实验结果
(1)考察原有变量是否适合进行因子分析
表2-1
表2-1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表2—2
由表2—2可知,巴特利特球度检验统计量观测值为136。426,相应的概率p值接近0,如果显著性水平α为0.05,由于概率p值小于显著性水平α,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0。635,根据Kaiser给出的KMO度量标准可知原有变量适合进行因子分析。
(2)提取因子
表2—3
表2-4
表2—3和表2-4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这7个指标。方差分解表也表明前两个因子能够解释7个指标的84。619%.综合以上,提取前两个因子最好了。
(3)因子的命名解释
表2—5
表2-6
由表2-5、表2-6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释.因子1主要解释的是固定资产产值率、固定资产利税率、资金利润率、资金利税率和销售收入利税率,可以命名为盈利能力因子;而因子2主要解释的是其余两个指标,流动资金周转天数、和全员劳动生产率。可以命名为资金和人力因子。因子分析要求,最后得到的因子之间没有相关性,而因子转换矩阵显示,两个因子相关.可见,对因子进行旋转是完全有必要的。
(4)计算因子得分
表2-7
根据表2-7可写出以下因子得分函数:
F1=0。238固定资产产值率+0。191固定资产利税率+0。265资金利润率+0.270资金利税率+0.173流动资金周转天数+0。135销售收入利税率-0。046全员劳动生产率
F2=—0。 087固定资产产值率+0.096固定资产利税率-0.126资金利润率—0。160资金利税率-0。627流动资金周转天数+0.167销售收入利税率+0。477全员劳动生产率
(5)计算综合得分。单击“转换→计算变量”,新建输出变量,命名为“score分\"并输入其计算公式FAC1_1 * 0.66259 + FAC2_1 * 0。18360.将FAC1_1、FAC2_1和score原始变量标准化后,保存为新变量ZFAC1_1、ZFAC2_1和zscore然后,分别按ZFAC1_1、ZFAC2_1和zscore排序.得到因子得分值及排序表如表2—8所示。 企业 数源科技 中华电子 潮州二轻 南方制药 五羊自行 茂名石化 白云制药 广发卷烟 康佳电子 华南冰箱 岭南通信 华空空调 盈利能力 名次 1 —0627 —0.627 11 1。23755 0.69559 0。27476 —037374 0.19232 —038166 -0。56141 12 —0.09552 7 -0。34094 8 —058518 。13 0.69404 —109997 —0.24467 8 -0.33462 10 —0.3939 11 -0。65328 12 。3 14 -0.35569 9 -0。38577 10 。6 11 -0.71098 0.057 12 7 -0。00452 7 -0。35258 8 。2 4 5 10 2。21107 —0.8872 0.48185 0.0757 1.659 1 13 4 5 2 1.163 0.9557 0。799 0。285 0.14628 2 3 4 5 6 资金和人力 ZFAC2_1 。名次 11 综合得分 Zscore 1.88062 名次 1 ZFAC1_1 2。13056 中国长城 稀土高科 三星集团 —036788 。9 14 15 -1.267 15 —069309 。13 -0.87028 —204498 。—0.29465 9 0。07001 6 —0.91736 14 —195203 。15 表2—8