河南科技大学
2013年硕士研究生入学考试试题答案及评分标准
考试科目代码: 840 考试科目名称: 统计学
一、简答题(每题15分,共75分)
1. 众数是一组数据中出现次数最多的变量值。众数主要用于测度分类数据的集中趋势,也适用于作为顺序数据
以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。………5分 中位数是一组数据排序后处于中间位置上的变量值。中位数主要用于测度顺序数据的集中趋势,也适用于测度数值型数据的集中趋势,不适用于分类数据。 ………5分 平均数是一组数据相加后除以数据的个数得到的结果。平均数主要适用于数值型数据,不适用于分类数据和顺序数据。 ………5分 2. 卡方分布、t分布、F分布均为由正态分布导出的分布。其中:
卡方分布:设随机变量X1,X2,n,Xn相互,且Xi(i1,2,,n)服从标准正态分布,则它们的平方和
2i1Xi2服从自由度为n的卡方分布。 ………5分
t分布:设随机变量X~N(0,1),Y~2(n), 且X与Y相互,则tX服从自由度为n的t分布,Y/n记为t~t(n). ………5分
F分布:设随机变量X与Y相互,且X和Y分别服从自由度为m和n的卡方分布,则随机变量
X/m服从第一自由度为m,第二自由度为n的F分布,记为F~F(m,n)。 ………5分 FY/n3. 假设检验中若原假设H0为真时拒绝H0,称为犯第一类错误; ………5分
若原假设H0不真时接受H0,称为犯第二类错误; ………5分 一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,只能增加样本容量。 ………5分 4. 指数平滑法是通过对过去的观测值加权平均进行预测的一种方法; ………5分
该方法使t1期的预测值等于t期的实际观察值与t期的预测值的加权平均值; ………5分 指数平滑法是加权平均法的一种特殊形式,观察值时间越远,其权数也跟着呈现指数下降趋势,因而称为指平滑法。 ………5分 5. ⑴因变量与自变量之间具有线性关系; ………3分 ⑵在重复抽样中,自变量x的取值是固定的,即假定x是非随机的; ………3分 ⑶误差项是一均值为0的随机项; ………3分 ⑷对所有的x值,误差的方差都相; ………3分 ⑸误差项是一个服从正态分布的随机变量,且。 ………3分 二、计算题(共75分) 1. (10分)
令A1,A2,A3分别表示采购的产品来自甲、乙、丙三家企业;令B表示抽取的产品为次品,则由题设知
P(A1)0.25,P(A2)0.3,P(A3)0.45,P(B|A1)0.04,P(B|A2)0.05,P(B|A3)0.03.第1页(共3页)
………2分
⑴ 由全概率公式可得,抽出次品的概率为
P(B)P(A1)P(B|A1)P(A2)P(B|A2)P(A3)P(B|A3) 0.250.040.30.050.450.03 ………4分
0.0385.⑵ 由条件概率公式,若抽出的产品是次品,则该产品来自丙厂的概率为
P(A3|B)P(A3)P(B|A3)0.450.030.351. ………4分
P(B)0.03852. (15分)
⑴ 由题知,样本容量n16,样本均值x1490,样本的标准差s24.77,则这批灯泡平均寿命的95%的置信区间为 xt/2(n1)ss,xt/2(n1) ………5分 nn其中t/2(n1)t0.025(15)2.131,是自由度为15的t分布的上侧0.025分位点,经计算得该置信区间为
(1476.8,1503.2). ………3分
⑵ 该说法不正确; ………2分
0.95这个概率不是用来描述某个特定的区间包含总体参数真值的可能性,而是针对随机区间而言的; …2分 0.95的置信区间,通俗地说是如果抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值,而另外5个区间则不包含总体均值。 ………3分 3.(15分)
⑴ 在设立原假设和备择假设时,需要考虑问题的实际背景和研究出发点,因为厂家相信自己的产品质量优于
25000公里,除非有很强的理由,否则不应推翻这一信念,因此从厂家角度出发,原假设应为H0:25000,备择假设为H1:25000。 ………4分 ⑵ 因为消费者已经怀疑厂家广告夸大,故从消费者角度出发,原假设和备择假设应为:
H0:25000,H1:25000 ………4分 这意味着有较强的证据才能相信厂家质量更优; 这是正态总体标准差未知的情形,应采用t检验;
已知025000,x27000,s5000,n16,0.05,t统计量的值为 tx027000250001.6 ………3分
5000/4s/n当0.05时,检验的拒绝域为{tt(n1)t0.05(15)1.731},因为1.61.731,即样本未落入拒绝域,故接受H0,认为该厂的广告真实。 ………4分 4.(15分)
⑴方差分析的基本假定:a.每个总体都应服从正态分布。………2分
b.各个总体的方差必须相同。 ………2分 c.观测值相互。 ………2分
⑵设三种不同包装的该种食品的总体均值分别为1,2,3,则原假设和备择假设为
第2页(共3页)
H0:123;H1:i(i1,2,3)不全相等。 ………2分 ⑶检验统计量为FSSA/(k1) ………2分
SSE/(nk)其中SSA为组间平方和,SSE为组内平方和;n18为总的观测值数,k3为因素水平数。将表中数据代入算得
F71.0811/(31)35.5406617.51629
30.435/(183)2.029因无F值表可查,可利用P-value做结论。因0.00019<0.05=,所以拒绝原假设,即认为不同的包装对销售量的影响显著。 ………3分
⑷方差分析中的多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异。 ………2分
5.(20分)
⑴
方差分析 回归 残差 总计 df 1 14 15 SS 4.455 4.434 8.8 MS 4.455 0.3163 — F 14.07 — — Significance F 0.0022 — — ………每空0.5分,共3.5分
⑵ 一元线性回归模型为y01x,其中为随机误差项;若用y表示某年的红利值,x表示每股账面价值, ………0.5分 则每股账面价值和红利的回归方程为
ˆ0.47980.0729x ………2分 y其中回归系数0.0729表示每股账面价值每增加1元,红利值平均增加0.0729元。………2分
⑶ 为进行回归方程的显著性的检验,建立原假设与备择假设
H0:10;H1:10 ………2分 选择检验统计量F,并计算其值FSSR/14.455/114.07
SSE/144.434/14其中SSR为回归引起的平方和,SSE为误差引起的平方和.
由Significance F值为0.002可知若显著性水平选择0.05,则拒绝原假设即回归方程显著。………3分 ⑷ 判定系数R2SSR是回归平方和占总平方和的比例。………2分 SST判定系数测度了回归直线对观测数据的拟合程度,其取值范围是[0,1],越接近于1,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x解释y值变差的部分就越多,回归直线拟合得越好;反之,越接近于0,回归直线拟合程度就越差。 ………3分 ⑸若序号为9的公司的每股账面价值增加1元,则当年的红利预测值为
ˆ0.47980.072913.141.4377。 ………2分 y
第3页(共3页)