您好,欢迎来到九壹网。
搜索
您的当前位置:首页相应分析

相应分析

来源:九壹网
武夷学院实验报告

课程名称: 多元统计分析 项目名称: 相应分析 姓名:李玲 专业:信息与计算科学 班级:1班 学号:031 同组成员:无

一、 实验目的 相应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭示变量间的联系。交互表的信息以图形的方式展示。主要适用于有多个类别的定类变量,可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。适用于两个或多个定类变量。本文会通过数据对分析,达到熟练掌握相应分析操作的目的。 二、 实验内容 1.操作SPSS的基本方法(打开、保存、编辑数据文件) 2.问卷编码 3.录入数据并练习数据相关操作 4.对数据进行描述操作,并给出分析结论。 三、 实验步骤 1.开机 2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS 3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗 4.对一份给出的问卷进行编码和变量定义 5.按要求录入数据 6.练习基本的数据修改编辑方法 7.对数据进行相应分析操作 8.保存数据文件 9.关闭SPSS,关机。 四、 实验项目及结果 为研究我国东部地区11个城市的空气质量,这里选取二氧化硫、二氧化氮、一氧化碳及臭氧4类污染物作为评价指标来进行相应分析。 ㈠ 操作步骤 (1)数据录入。进行相应分析之前,需要对原始数据进行处理,整理成交叉表的单元格计数形式。具体操作如下: ① 开SPSS文件,按顺序:文件→新建→数据打开一个空白数据文件,进行变量的编辑,点击变量视图选项,录入3个变量。 ② 变量进行赋值,选择变量项需要作如下设置:在弹出的对话框里,对东部地区11个城市以及4个空气质量指标进行数字赋值。 完成变量的编辑后,返回到“数据视图”的窗口,录入数据,即为交叉表的单元格设计形式。 ③ 用加权个案。点击数据→加权个案功能,定义“浓度”为权重变量。 设置完成后,点击OK按钮进入相应分析。 ⑵点击分析→降维→对应分析,进入对应分析主对话框。 ① 行框用于设置行变量。这里,将“地区”变量放置于此。此时,“定义范围”按钮被激活,用于定义行变量参与分析的分类范围。本例的地区有11个,故最小值输入1,最大值输入11,然后点击更新。 ② 列框用于设置列变量。这里,将“消费支出结构”变量放置于此,点击“定义范围”按钮,定义列变量参与分析的分类范围。本例中空气质量指标有4个,故最小值输入1,最大值输入4,然后点击更新。 设置完成后,点击继续进入相应分析主对话框。 ⑶点击主对话框模型选项,用于指定相应分析模型,指定维度数、距离测度、标准化方法和正规化方法。 ①解的维数用于指定对应分析解的维度数,系统默认值为2,即分别对样品和变量进行因子分析时提取前两个因子。 ① 距离度量子选项用于选择相应表的行间距离和列间的距离测度。其中,Chi squre 为卡方距离测度,Euclidean为欧式距离。 ② 标准化方法子选项用于选择标准化方法选项。其中,Row and column means are removed 表示行和列两者均被中心化,Row means are removed 表示行被中心化,Column means are removed 表示列被中心化,Row totals are equalized and means are removed 表示先使行边际相等,再中心化行,Column totals are equalized and means are removed 表示先使列边际相等,再中心化列。 ③ 正态化方法子选项用于设定正规化方法。其中,Symmetrical表示对称度;Row principal表示行分数间的距离是在对应表中根据选定方法对距离测度的近似方法;Column principal表示列分数间的距离是在对应表中根据选定方法对距离测度的近似方法;Principal 表示行点与列点之间的距离是与选定的距离测度一致的对应表中距离的近似值,Custom表示自定义。 选中所需选项后,点击继续返回主对话框。 ⑷点击主对话框统计量选项,用于指定输出哪些数据表。 ① 对应数表示要求输出含有变量列和行边际概览的交叉分组列表;行点概览表示要求输出行概览表;列点概览表示要求输出列概览表;行轮廓表 表示行归一化处理后的分布表;列轮廓表表示列归一化处理后的分布表。 ② 置信统计量子选项中,行点为输出包括标准差和所有非辅助行点相关内容的表格,列点为输出包括标准差和所有非辅助列点相关内容的表格。 选中所需选项后,点击继续返回主对话框。 ⑸点击主对话框绘制选项,用于指定统计图选项。 ① 散点图子选项为散点图选项。其中,双标图为双维图法输出矩阵的行、列点联合图,行点为输出矩阵的行点图,列点为输出矩阵的列点图,散点图的标识标签宽度为设置散点图中ID标签宽度,默认值20。 ② 线图子选项为产生所选变量的每一个维度的线图。其中,已转换的行类别输出行分类转换图,已转换的列类别输出列分类转换图,线图的标识标签宽度 设置线图中ID标签宽度,默认值20。 ③ 图维数子选项为允许去控制在输出中显示的图的维度。其中,显示解中的所有维数为在散点图矩阵里显示解的所有维度,维数为显示的维度被在成对图。 选中所需选项后,点击继续返回主对话框。点击OK按钮,即可得到相应分析的结果。 二、输出结果 ⑴ 表8.5 表8.5为列联表。列联表给出了11个城市的4种污染物的观察值、总和。其中,Active Margin为行列有效的边际值,最下角的2708是所有观测值得和。 ⑵ 表8.6 表8.6为行轮廓表。相应表中每行观测值除以每行总和的归一化结果,每行的边际都为1。其中,Mass为各列的边际概率。 ⑶ 表8.7 表8.7为列轮廓表。相应表中每列观测值除以每列总和的归一化的结果,每行的边际都为1。其中,Mass为各行的边际概率。 ⑷ 表8.8 表8.8为总览表。总览表从左至右分别为维度、奇异值、惯量、卡方值及P值、惯量比例。其中,奇异值是惯量的平方根,相当于相关分析中的相关系数,而惯量是特征根。从该表中可以看出,由于第一个因子的贡献率为0.868,第二个因子的贡献率为0.123,二者的累积贡献率为99.1%,所以抽取前两个因子即可。 ⑸ 表8.9 表8.9为行概览表。行概览表从左至右依次为行变量各点的质量(“地区”变量各取值所占百分比)、因子得分(“地区”变量各取值在二个维度中的分值,实际就是坐标值)、惯量、点对维度惯量的贡献(每个类别对维度的相对重要性),维度惯量对点的贡献(每个维度解释每个取值的程度)。 ⑹ 表8.10

表8.10为列概览表。从左至右依次为列变量各分类的质量(即反映消费支出结构各变量所占百分比)、因子得分(各变量在二个维度上的得分)、惯量、点对维度惯量的贡献、维度惯量对点的贡献。 ⑺ 图8.12 图8.12为对应分析图。在解读该图形时有两个原则:第一,首先分不同变量分别检查横轴和纵轴方向上的区分情况,如果同一变量不同类别在某个方向上靠得较近,则说明这些类别在该维度上区别不大;第二,比较不同变量各个取值分类间的位置关系,落在从图形中心(0,0)点出发相同方向上大致相同区域内的不同变量的分类点彼此有联系。现按照上述原则分析图8.12。“空气质量指标”四个指标在第一维度上分布得更分散些,而在第二维度上相对集中些;“地区”这个变量的11个城市则在第一和第二维度上的分布比较离散。从图中可以看出,福州和海口两个城市的空气质量是最好的,其中,福州离二氧化氮比较近,离其他三个指标比较远,说明福州的二氧化氮浓度相对要高一些。而海口离臭氧比较近,离其他三个指标比较远,说明海口主要是臭氧浓度稍高一些。其他城市的情况如下:上海、北京、广州、杭州臭氧浓度比较高;南京二氧化氮浓度相对更高一些;天津、济南、石家庄一氧化碳浓度相对更高一些;沈阳二氧化硫浓度相对更高一些。 五、 实验小结 通过对应分析可以大致了解地区与空气指标质量的关系,并且实现了对应分析理论知识与实际操作的结合,此次试验的难点在于对输出数据的具体分析思维。由以上所有分析我们可以大胆推断地区的发展情况与空气指标质量密切的联系,地区很大的着空气指标质量情况。在属性变量的取值较少时,可以将所有数据放到一张列联表中就可以直观的对各种取值之间的相关性作出判断。而当取值较多时,就需要利用降维思想简化列联表。在对应分析时,若有需要应先进行数据加权,然后进行性检验,以确定对应分析是否可行。 实验报告成绩(百分制)__________ 实验指导教师签字:__________

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务