聚类分析与判别分析的例题
1、某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。  销售情况 产品序号 1 2 畅销 3 4 5 平销 6 7 8 滞销 9 10   3.0 3.2 2.8 3.5 4.8 1.7 2.2 2.7   3 8 7 8 9 3 4 4   9 6 6 7 8 4 2 3   销售价格 2.2 2.5 口味评分 5 6 信任度评分 8 7
(1)根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。 (2)现有一新品牌的饮料再该超市试销,其销售价格为3.0,顾客对其口味的评分平均分为8,信任评分为5,试预测该饮料的销售情况。
2、银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄、受教育程度、现从事工作的年龄、未变更住址的年数、收入,负债收入比例、信用卡债务、其他债务等来判断其信用情况。下表是某银行的客户资料中抽取的部分数据,(1)根据样本资料分别用距离判别法、贝叶斯判别法和费系尔判别法建立判别函数和判别规则。(2)某客
户的如上情况资料为(53,1,9,18,50,11,20,2.02,3.58),对其进行信用好坏的判别。  目前信用好坏 客户序号 1 2 已履行还贷责任 3 4 5 6 7 未履行还贷责任 8 9 10    23 1 34 1 42 2 39 1 35 1 37 1 29 1 32 2 28 2  7  2   31 6.6 59 8.0    0.34 1.71 1.81 2.91 0.94 0.94 17 3 7 23 41 4.6 19 5 9 1 1 3 48 13.1 1.93 4.36 34 5.0 0.40 1.30 24 15.1 1.80 1.82 42 7.4 1.46 1.65 13 1 11 6 2 3 75 23.3 7.76 9.72 23 6.4 0.19 1.29    26 1 4 3 27 10.5 2.47 0.36                 3、从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行思想生化指标的化验:血清铜蛋白、蓝色反应、尿吲哚乙酸和中性硫化物,数据见下表。试用距离判别法建立判别函数,并根据此判别函数对原样本进行回判。
类别 病人序号 1 2 胃癌患者 3 4 5 萎缩性胃炎患者 6 228 245 200 170 100 225  134 134 167 150 167 125  20 10 12 7 20 7  11 40 27 8 14 14  7 8 9 10 11 12 非胃炎患者 13 14 15   130 150 120 160 185 170 165 135 100   100 117 133 100 115 125 142 108 117   6 7 10 5 5 6 5 2 7   12 6 26 10 19 4 3 12 2      4、为了了解儿童的生长发育规律,今随机抽取了男孩从出生到11岁每年平均增长的重量数据表,试问男孩发育可分为几个阶段?
表 1~11岁儿童每年平均增长的重量  年龄(岁) 增重(千克)    1 2 3 4 5 6 7 8 9 10 11 9.3 1.8 1.9 1.7 1.5 1.3 1.4 2.0 1.9 2.3 2.1                       5、下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K均值法分别对这些公司进行聚类,并对结果进行分析。  公司净资产收每股净总资产编号 益率 1 2 3 11.09 11.96 0 利润 0.21 0.59 0.03 资产负流动负债每股净净利润增总资产增比率 70.53 90.73 资产 1.86 4.95 长率 -44.04 7.02 长率 81.99 16.11 21.18 周转率 债率 0.05 0.74 0.03 96.98 51.78 181.99 100 -2.98 103.33 4 5 6 7 8 9 10 11 12 13 14 15    11.58 -6.19 10 10.49 11.12 3.41 1.16 30.22 8.19 95.79 16.55 0.13 0.17 46.07 43.3 68.4 82.98 92.18 82.24 86 99.87 1.14 1.52 4.7 1.02 6.55 -56.32 -0.09 0.03 0.47 0.11 0.48 0.35 -1713.5 -3.36 -11.56 100.23 0.85 30.32 -1.69 0.12 0.04 0.01 0.16 0.22 -5.2 0.35 0.2 0.54 0.4 0.38 0.5 0.93 132.14 100 67.86 43.7 87.36 30.31 98.51 100 94.88 100 -0.66 -4454.39 -62.75 1.25 1.03 0.53 2.73 -11.25 -87.18 729.41 -12.31 -11.43 -7.41 -9.97 -2.77 252.34 99.34 72.31 56.26   84.05 97.8   -5.42 -9816.52 -46.82 2.14 4.81   115.95 123.41 -24.18 -1.16 0.79       -533. -27.74     6、下表是某年我国16个地区农民支出情况的抽样调查数据,每个地区调查了反映每人平均生活消费支出情况的六个经济指标。试通过统计分析软件用不同的方法进行系统聚类分析,并比较何种方法与人们观察到的实际情况较接近。
地区 北京 天津 河北 山西 食品 衣着 燃料 住房 60.54 交通和通讯 49.01 36.49 22.81 18.17 23.99 39.09 25.29 21.75 娱乐教育文化 9.04 3.94 2.8 3.25 2.27 3.47 5.22 6.04 190.33 43.77 9.37 135.2 95.21 36.4 10.47 44.16 22.44 9. 12.58 22.83 9.3 104.78 25.11 6.4 内蒙古 128.41 27.63 8.94 辽宁 吉林 145.68 32.83 17.79 27.29 159.37 33.38 18.37 11.81 黑龙江 116.22 29.57 13.24 13.76 上海 江苏 浙江 安徽 福建 江西 山东 河南    221.11 38. 12.53 115.65 50.82 144.98 29.12 11.67 42.6 169.92 32.75 12.72 47.12 135.11 23.09 15.62 23.54 144.92 21.26 16.96 19.52 140.54 21.5 17. 19.19 33.6 20.2   27.3 34.35 18.18 21.75 15.97 33.77 20.5   5. 5.74 5 6.39 6.73 4.94 3.85 4.3   115.84 30.26 12.2 101.18 23.26 8.46       7、下表是2003年我国省会城市和计划单列市的主要经济指标:人均GDP元、人均工业产值元、客运总量万人、货运总量万人、地方财政预算内收入亿元、固定资产投资总额亿元、在岗职工人数占总人口的比例%、在岗职工人均工资额元、城乡居民年底储蓄余额亿元。试通过统计分析软件进行系统聚类分析,并比较何种方法与人们观察到的实际情况较接近。
城市 北京 天津 石家庄 太原 呼和浩特 沈阳 大连 长春 哈尔滨 上海  31886 233 15134 15752 191 23268 29145 18630 14825 46586  33168 43732 13159 15831 11257 15446 27615 21045 7561 77083        30520 30671 593 2000 37.8 25312 41 3507 34679 205 934 18.8 188 1825 9.5 12306 1044 22.8 12679 660 13.5 14116 255 14.8 14961 1423 14.7 17560 1310 12.5 13870 831 17.7 12451 1154 27305 6055 11843 10008 49 416 2975 3508 6612 15248 33 197 4155 21 182 14636 81 557 11001 21081 111 407 6999 58 7212 102 46 294 9518 76 423 63861 9 2274 21 南京 杭州 宁波 合肥 福州 厦门 南昌 济南 青岛 郑州 武汉 长沙 广州 深圳 南宁 海口 重庆 成都 贵阳 昆明 西安 兰州 西宁 银川 乌鲁木齐   27547 32667 32543 10621 22281 53590 14221 23437 24705 16674 21278 15446 48220 43853 49823 47904 11714 21310 93126 9205 22634 35506 14023 17083 8873 55404 16790 14805 136 794 21349 16815 150 717 24938 13797 139 555 6034 9680 4441 5728 5810 41 8250 3055 4454 36 245 67 376 70 238 31 210 15.4 22190 1134 11.8 24667 1466 10.9 23691 1060 8.3 13901 359 11.8 15053 876 38.6 19024 397 11 13913 483 14354 76 429 13.5 16027 758 14.5 15335 908 12.7 13588 1048 17.4 13730 1286 10 16987 705 14666 30533 120 548 10709 7847 66 373 11882 16610 80 623 10609 10631 60 434 29751 28859 275 10 25.1 28805 3727 291 875 36 170 12 99 69.6 31053 2199 8.3 13171 451 16.5 14819 284 191838 347519 109 6793 8176 142 7190 17914 11046 16215 13140 14459 7066 11787 22508   3390 14553 5076 92 10350 11601 13 17136 5605 11013 17137   7016 53 13284 3304 58290 32450 162 1187 6.5 12440 17 72793 28798 90 788 18511 5318 5126 40 231 11.9 15274 1494 15.8 12181 345 14.6 14255 709 15.9 13505 1211 18 134 468 12338 60 342 65 446 21 203 8 76 11413 9392 2209 2788 2146 2188   5581 2037 2127 10.1 14629 175 21.9 13497 193 26.1 16509 420       12 134 12754 41 180
怎样对这些城市进行综合评价,并排名次。
8、下表是我国1991~2003年的固定资产投资价格指数,试对时期进行分段,并根据此对我国固定资产投资的价格变化情况进行分析。  年份 指数   年份 指数
1991 109.5   1998 99.8   1992 115.3   1999 99.6   1993 126.6   2000 101.1   1994 110.4   2001 100.4   1995 105.9   2002 100.2   1996 104.0   2003 100.2   1997 101.7