2023-2024学年辽宁省辽阳市高中数学人教A版选修三
成对数据的统计分析
专项提升(9)
姓名:____________   班级:____________   学号:____________
考试时间:120分钟
题号评分
*注意事项:
1、答题前填写好自己的姓名、班级、考号等信息2、请将答案正确填写在答题卡上
阅卷人得分
满分:150分
四
五
总分
一二三
一、选择题(共12题,共60分)
1. 已知具有线性相关的两个变量x,y之间的一组数据如下:且回归方程是 x01234y2.24.34.54.86.7A. 8.4
B. 8.3
C. 8.2
,则当  时,y的预测值为( )
D. 8.1
2. 为了研究某班学生的右手一拃长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取了12名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为, 若某学生的右手一拃长为22厘米,据此估计其身高为( )A. 175
B. 179
C. 183
,则实数a的值为(   )411
5aC. 20
621
D. 22D. 187 , 已知
,
,
3. 已知下表所示数据的回归直线方程为y xyA. 16
23
37B. 18
4. 某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的2×2列联表.根据列联表的数据判断有多少的把握认为“成绩与班级有关系”.(   )
优秀非优秀合计
甲班乙班合计K2≥kk
102030
503080
60501100.0503.841
0.0255.024
0.0106.635
0.00110.828 .
B. 95%
C. 99%
第 1 页   共 13 页
0.1002.706
参考公式与临界值表:K2= A. 90%
D. 99.9%
5. 2020年全球经济都受到了新冠疫情影响,但我国在中国党的正确领导下防控及时、措施得当,很多企业的生产所受影响甚微.我国某电子公司于2020年6月底推出了一款领先于世界的5G电子产品,现调查得到该5G产品上市时间x和市场占有率y(单位:%)的几组相关对应数据.如图所示的折线图中,横轴1代表2020年8月,2代表2020年9月……,5代表2020年12月,根据数据得出y关于x的线性回归方程为  .若用此方程分析并预测该产品市场占有率的变化趋势,则该产品市场占有率最早何时能超过0.5%(精确到月)(    )
A. 2021年5月B. 2021年6月C. 2021年7月D. 2021年8月
6. 某学校为了了解该校学生对于某项运动的爱好是否与性别有关,通过随机抽查110名学生,得到如下2×2的列联表:
喜欢该项运动不喜欢该项运动
男女总计由公式K2= 附表:p(K2≥k0)
k0
0.0255.024
0.016.635
0.0057.879
402060
203050
总计6050110
,算得K2≈7.61
参照附表,以下结论正确是(   )
A. 有99.5%以上的把握认为“爱好该项运动与性别有关”C. 有99%以上的把握认为“爱好该项运动与性别有关”
B. 有99.5%以上的把握认为“爱好该项运动与性别无关”D. 有99%以上的把握认为“爱好该项运动与性别无关”
7. 在如图的各图中,每个图的两个变量具有线性相关关系的图是(    )
A. ①②B. ①③C. ②④D. ②③ 列联表:
8. 复兴村“乡间小屋”驿站对30位游客的游玩意向进行了一次调查,列出了如下
都市游
35岁以下35岁以上合计
41620
乡村游8210
合计121830
下列说法正确的是(    )附:参考公式和临界值表 P(K2≥k0)0.10k0A.
2.706
0.053.841
0.016.635
0.0057.7
0.00110.828
在犯错误的概率不超过0.001的前提下,认为“游客的游玩意向与年龄无关”
第 2 页   共 13 页
A.
B. 在犯错误的概率不超过0.001的前提下,认为“游客的游玩意向与年龄有关”C. 有99.5%以上的把握认为“游客的游玩意向与年龄无关”D. 有99.5%以上的把握认为“游客的游玩意向与年龄有关”9. 在画两个变量的散点图时,下面哪个叙述是正确的(    )A. 预报变量在x轴上,解释变量在y轴上C. 可以选择两个变量中任意一个在x轴上10. 性检验中,假设 下列结论正确的是(   )
B. 解释变量在x轴上,预报变量在y轴上D. 以选择两个变量中任意一个在y轴上
的观测值
.
:运动员受伤与不做热身运动没有关系.在上述假设成立的情况下,计算得
A. 在犯错误的概率不超过0.01的前提下,认为运动员受伤与不做热身运动有关B. 在犯错误的概率不超过0.01的前提下,认为运动员受伤与不做热身运动无关C. 在犯错误的概率不超过0.005的前提下,认为运动员受伤与不做热身运动有关D. 在犯错误的概率不超过0.005的前提下,认为运动员受伤与不做热身运动无关
11. 为了了解居家学习期间性别因素是否对学生体育锻炼的经常性有影响,某校随机抽取了40名学生进行调查,按照性别和体育锻炼情况整理出如下的列联表:性别
锻炼情况不经常经常
7
合计21
女生/人14男生/人8合计/人22注:
11191840
.
性检验中,
常用的小概率值和相应的临界值如下表:0.1
0.050.010.0050.0012.7063.8416.6357.87910.828根据这些数据,给出下列四个结论:
①依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性有影响;②依据频率稳定于概率的原理,可以认为性别对体育锻炼的经常性没有影响;③根据小概率值误的概率不超过0.05;④根据小概率值认为性别对体育锻炼的经常性没有影响.其中,正确结论的序号是(   )A. ①③
B. ①④
C. ②③
D. ②④
的性检验,可以认为性别对体育锻炼的经常性有影响,这个推断犯错的性检验,没有充分证据推断性别对体育锻炼的经常性有影响,因此可以
12. 有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;
④森林中的同一种树木,其横断面直径与高度之间的关系,
第 3 页   共 13 页
其中有相关关系的是(    )A. ①②③阅卷人得分B. ①②C. ②③D. ①③④二、填空题(共4题,共20分)13. 为研究大气污染与人的呼吸系统疾病是否有关,对重污染地区和轻污染地区做跟踪调查,得出如下资料:患呼吸系统疾病重污染地区轻污染地区总计10313116未患呼吸系统疾病139714872884150015003000总计根据列联表,求得K2的值为                        .14. 某市利用历史资料算得煤气年消耗量y(单位:万立方米)与使用煤气户数x(单位:万户)之间的回归直线方程为:  =  x﹣ 方米. .若市下一步再扩大2300煤气用户,试利用回归直线方程估计该市年煤气消耗量将增加                        万立15. 根据下面的数据:132248372488求得  关于  的回归直线方程为 注:残差是指实际观察值与估计值之间的差.) ,则这组数据相对于所求的回归直线方程的4个残差的方差为                        .(16. 某车间需要确定加工零件的加工时间,进行了若干次试验.根据收集到的数据(如表):零件数x(个)加工时间y(分钟)106220683075408150由最小二乘法求得回归直线方程  ,则  的值为                        .阅卷人得分三、解答题(共6题,共70分)17. 调查在 晕船附:.  级风的海上航行中71名乘客的晕船情况,在男人中有12人晕船,25人不晕船,在女人中有10人晕船,24人不  0.250.150.100.050.025    1.3232.0722.7063.8415.024(1) 作出性别与晕船关系的列联表;(2) 根据此资料,能否在犯错误的概率不超过0.1的前提下认为 晕船男人女人总计18. 据统计某品牌服装专卖店一周内每天获取得纯利润  (百元)与每天销售这种服装件数  (百件)之间有如下一组数据.不晕船总计 级风的海上航行中晕船与性别有关?第 4 页   共 13 页34567666973819091
该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500).附表:(随机数表第7行至第9行)
84421  75331  57245  50688  77047  44767  21763  35025  83921  2067663016  47859  16955  56719  98105  07185  12867  35807  44395  2387933211  23429  785  60782  52420  74438  15510  01342  99660  27954参考数据:
,
,
.
参考公式:  ,
(1) 利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2) 求该专卖店每天的纯利  与每天销售件数  之间的回归直线方程.(精确到0.01)(3) 估计每天销售1200件这种服装时获多少纯利润?
19. 新型冠状病毒的传染性是非常强的,而且可以通过接触传播或者是呼吸道飞沫传播,感染人群年龄大多数是40岁以上的人群.该病毒进入人体后有潜伏期,并且潜伏期越长,感染他人的可能性越高,现对100个病例的潜伏期(单位:天)进行调查,统计发现潜伏期中位数为5,平均数为7.21,方差为5.08.如果认为超过8天的潜伏期属于“长潜伏期”.按照年龄统计样本得到下面的列联表:
长潜伏期40岁以上40岁及以下附:
0.12.706
若随机变量  服从正态分布
, 1510
.0.053.841
,则
.
,
,
非长潜伏期5520
(1) 能否有90%以上的把握认为“长潜伏期”与年龄有关;(2) 假设潜伏期  服从正态分布
,其中  近似为样本平均数,
近似为样本方差,现在很多省份对入境旅客一律
要求隔离14天,请用概率的知识解释其合理性;(3) 以题目中的样本频率估计概率,并计算4个病例中有
个进入“长潜伏期”的期望与方差.
20. 某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1) 应收集多少位女生的样本数据?
(2) 根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],试估计该校学生每周平均体育运动时间的平均数.
第 5 页   共 13 页
(3) 已知在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成下面的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间超过4小时与性别有关”.
附:K2=
.
总计
每周平均体育运动时间每周平均体育运动时间
超过4小时
男女总计
60
不超过4小时
300
21. 某网店为预估今年“双11”期间商品销售情况,随机抽取去年“双11”期间购买该店商品的100位买主的购买记录,得到数据如表格所示:
500元及以上少于500元合计男女
2515
253560
5050100
,
.
合计40附:
0.100.050.050.010.0050.0012.7063.8415.0246.6357.87910.828(1) 依据
的性检验,能否认为购买金额是否少于500元与性别有关?
(2) 为增加销量,该网店计划今年“双11\"期间推出如下优惠方案:购买金额不少于500元的买主可抽奖3次,每次中奖概率为(每次抽奖互不影响),中奖1次减50元,中奖2次减100元,中奖3次减150元.据此优惠方案,求在该网店购买500元商品,实际付款数X(元)的分布列和数学期望.
第 6 页   共 13 页
答案及解析部分
1.
2.
3.
4.
5.
第 7 页   共 13 页
6.
7.
8.
9.
第 8 页   共 13 页
10.
11.
12.
13.
14.
第 9 页   共 13 页
15.
16.
17.(1)
(2)
18.(1)(2)
第 10 页   共 13 页
(3)
19.(1)
(2)
(3)
第 11 页   共 13 页
20.(1)
(2)
(3)
21.(1)
(2)
第 12 页   共 13 页
第 13 页   共 13 页