聚类分析与判别分析的例题
1、某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。  销售情况 产品序号 1 畅销 2 3 4 5 平销 6 7 8 滞销 9 10 销售价格 2.2 2.5 3.0 3.2 2.8 3.5 4.8 1.7 2.2 2.7 口味评分 5 6 3 8 7 8 9 3 4 4 信任度评分 8 7 9 6 6 7 8 4 2 3 (1)根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。
(2)现有一新品牌的饮料再该超市试销,其销售价格为3.0,顾客对其口味的评分平均分为8,信任评分为5,试预测该饮料的销售情况。
2、银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄、受教育程度、现从事工作的年龄、未变更住址的年数、收入,负债收入比例、信用卡债务、其他债务等来判断其信用情况。下表是某银行的客户资料中抽取的部分数据,(1)根据样本资料分别用距离判别法、贝叶斯判别法和费系尔判别法建立判别函数和判别规则。(2)某客户的如上情况资料为(53,1,9,18,50,11,20,2.02,3.58),对其进行信用好坏的判别。 目前信客户序X1 23 34 X2 1 1 X3 7 17 X4 2 3 X5 31 59 X6 6.6 8.0 X7 0.34 1.81 X8 1.71 2.91 用好坏 号 已履行还贷责1 2 任 3 4 5 42 39 35 37 29 32 28 26 2 1 1 1 1 2 2 1 7 19 9 1 13 11 2 4 23 5 1 3 1 6 3 3 41 48 34 24 42 75 23 27 4.6 13.1 5.0 15.1 7.4 23.3 6.4 10.5 0.94 1.93 0.40 1.80 1.46 7.76 0.19 2.47 0.94 4.36 1.30 1.82 1.65 9.72 1.29 0.36 未履行还贷责任 6 7 8 9 10
3、从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行思想生化指标的化验:血清铜蛋白、蓝色反应、尿吲哚乙酸和中性硫化物,数据见下表。试用距离判别法建立判别函数,并根据此判别函数对原样本进行回判。 类别 病人序号 1 2 胃癌患者 3 4 5 6 萎缩性胃炎患者 7 8 9 10 11 12 非胃炎患者 13 14 15
X1 228 245 200 170 100 225 130 150 120 160 185 170 165 135 100 X2 134 134 167 150 167 125 100 117 133 100 115 125 142 108 117 X3 20 10 12 7 20 7 6 7 10 5 5 6 5 2 7 X4 11 40 27 8 14 14 12 6 26 10 19 4 3 12 2 4、为了了解儿童的生长发育规律,今随机抽取了男孩从出生到11岁每年平均增长的重量数据表,试问男孩发育可分为几个阶段?
表 1~11岁儿童每年平均增长的重量
年龄(岁) 1 2 1.8 3 1.9 4 1.7 5 1.5 6 1.3 7 1.4 8 2.0 9 1.9 10 11 增重(千克) 9.3
2.3 2.1 5、下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K均值法分别对这些公司进行聚类,并对结果进行分析。 公司编净资产号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
收益率 11.09 11.96 0 11.58 -6.19 10 10.49 11.12 3.41 1.16 30.22 8.19 95.79 16.55 -24.18 每股净利润 0.21 0.59 0.03 0.13 -0.09 0.47 0.11 -1.69 0.04 0.01 0.16 0.22 -5.2 0.35 -1.16 总资产周转率 0.05 0.74 0.03 0.17 0.03 0.48 0.35 0.12 0.2 0.54 0.4 0.38 0.5 0.93 0.79 资产负债率 96.98 51.78 181.99 46.07 43.3 68.4 82.98 132.14 67.86 43.7 87.36 30.31 252.34 72.31 56.26 流动负债比率 70.53 90.73 100 92.18 82.24 86 99.87 100 98.51 100 94.88 100 99.34 84.05 97.8 每股净资产 1.86 4.95 -2.98 1.14 1.52 4.7 1.02 -0.66 1.25 1.03 0.53 2.73 -5.42 2.14 4.81 净利润增长率 -44.04 7.02 103.33 6.55 -1713.5 -11.56 100.23 总资产增长率 81.99 16.11 21.18 -56.32 -3.36 0.85 30.32 -4454.39 -62.75 -11.25 -87.18 729.41 -12.31 -11.43 -7.41 -9.97 -2.77 -9816.52 -46.82 115.95 -533. 123.41 -27.74 6、下表是某年我国16个地区农民支出情况的抽样调查数据,每个地区调查了反映每人平均生活消费支出情况的六个经济指标。试通过统计分析软件用不同的方法进行系统聚类分析,并比较何种方法与人们观察到的实际情况较接近。 地区 北京 天津 河北 山西 食品 190.33 135.2 95.21 104.78 衣着 43.77 36.4 22.83 25.11 燃料 9.37 10.47 9.3 6.4 住房 60.54 44.16 22.44 9. 交通和通讯 49.01 36.49 22.81 18.17 娱乐教育文化 9.04 3.94 2.8 3.25 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南
128.41 145.68 159.37 116.22 221.11 144.98 169.92 135.11 144.92 140.54 115.84 101.18 27.63 32.83 33.38 29.57 38. 29.12 32.75 23.09 21.26 21.5 30.26 23.26 8.94 17.79 18.37 13.24 12.53 11.67 12.72 15.62 16.96 17. 12.2 8.46 12.58 27.29 11.81 13.76 115.65 42.6 47.12 23.54 19.52 19.19 33.6 20.2 23.99 39.09 25.29 21.75 50.82 27.3 34.35 18.18 21.75 15.97 33.77 20.5 2.27 3.47 5.22 6.04 5. 5.74 5 6.39 6.73 4.94 3.85 4.3 7、下表是2003年我国省会城市和计划单列市的主要经济指标:人均GDP元、人均工业产值元、客运总量万人、货运总量万人、地方财政预算内收入亿元、固定资产投资总额亿元、在岗职工人数占总人口的比例%、在岗职工人均工资额元、城乡居民年底储蓄余额亿元。试通过统计分析软件进行系统聚类分析,并比较何种方法与人们观察到的实际情况较接近。 城市 北京 天津 石家庄 太原 X1 31886 233 15134 15752 X2 33168 43732 13159 15831 11257 15446 27615 21045 7561 77083 43853 49823 47904 11714 X3 30520 3507 11843 2975 3508 6612 11001 6999 58 7212 16790 21349 24938 6034 X4 30671 34679 10008 15248 4155 14636 21081 102 9518 63861 14805 16815 13797 41 X5 593 205 49 33 21 81 111 46 76 9 136 150 139 36 X6 2000 934 416 197 182 557 407 294 423 2274 794 717 555 245 X7 37.8 18.8 9.5 22.8 13.5 14.8 14.7 12.5 17.7 21 15.4 11.8 10.9 8.3 X8 25312 188 12306 12679 14116 14961 17560 13870 12451 27305 22190 24667 23691 13901 X9 41 1825 1044 660 255 1423 1310 831 1154 6055 1134 1466 1060 359 呼和浩特 191 沈阳 大连 长春 哈尔滨 上海 南京 杭州 宁波 合肥 23268 29145 18630 14825 46586 27547 32667 32543 10621 福州 厦门 南昌 济南 青岛 郑州 武汉 长沙 广州 深圳 南宁 海口 重庆 成都 贵阳 昆明 西安 兰州 西宁 银川 22281 53590 14221 23437 24705 16674 21278 15446 48220 21310 93126 9205 22634 35506 14023 17083 8873 55404 9680 4441 5728 5810 14666 10709 11882 10609 29751 8250 3055 4454 14354 30533 7847 16610 10631 28859 6793 53 3304 32450 28798 5318 12338 9392 5581 2037 2127 12754 67 70 31 76 120 66 80 60 275 291 36 12 162 90 40 60 65 21 8 12 41 376 238 210 429 548 373 623 434 10 875 170 99 1187 788 231 342 446 203 76 134 180 11.8 38.6 11 13.5 14.5 12.7 17.4 10 25.1 69.6 8.3 16.5 6.5 11.9 15.8 14.6 15.9 18 10.1 21.9 26.1 15053 19024 13913 16027 15335 13588 13730 16987 28805 31053 13171 14819 12440 15274 12181 14255 13505 134 14629 13497 16509 876 397 483 758 908 1048 1286 705 3727 2199 451 284 17 1494 345 709 1211 468 175 193 420 191838 347519 109 8176 142 7190 17914 11046 16215 13140 14459 7066 11787 3390 14553 5076 92 10350 11601 13 17136 5605 11013 17137 7016 13284 58290 72793 18511 5126 11413 2209 2788 2146 2188 乌鲁木齐 22508 怎样对这些城市进行综合评价,并排名次。
8、下表是我国1991~2003年的固定资产投资价格指数,试对时期进行分段,并根据此对我国固定资产投资的价格变化情况进行分析。 年份 指数 年份 指数
1991 109.5 1998 99.8 1992 115.3 1999 99.6 1993 126.6 2000 101.1 1994 110.4 2001 100.4 1995 105.9 2002 100.2 1996 104.0 2003 100.2 1997 101.7