多阶抽样
第九章 多阶段抽样
第一节 多阶抽样概述
一、 多阶抽样的概念
将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。
多阶抽样的特征:便于组织抽样
;抽样方式灵活,有利于提高抽样的估计效
率
;多阶段抽样对基本调查单元的抽选不是一步到位的;多阶段抽样实质上
;多阶抽样在抽样时并不需要二阶或更低阶
;多阶抽样还可用于“散料”的抽样,即散料抽样。
是分层抽样与整群抽样的有机结合单元的抽样框
第二节 一阶单元等大小的二阶抽样
第一阶段在总体N个初级单元中,以简单随机抽样抽取n个初级单元,第二阶段在被抽取的初级单元包含的M个二级单元中,以简单随机抽样抽取m个二级单元,即最终接受调查的单元。
(一)估计量及其方差
对于二阶抽样,若两个阶段的抽样都是简单随机的,则其总体均值Y的无偏估计量为
nmˆ1nYyyijm0yi.
ni1i1j1由于在每个一阶单元中的第二阶抽样是相互独立进行的,所以,在二阶段
都用不放回方法抽样时,其总体均值估计量的方差可构造为
V(y)1f121f22S1S2 nmn
SS12S=(S12)21 nMmnN222可以证明其方差的无偏估计量为
2ˆ(y)1f1s2f1(1f2)s2V12nmn22
22其中,s2为S2的无偏估计,s1不属于S1的无偏估计,S1的无偏估计为
ˆ2s21f2s2S112m
式中右边第一部分相当于第一阶段抽样的误差,它只与各一阶单元间差异大小有关;第二部分相当于第二阶段抽样的误差,它只与各一阶单元内(即各二阶单元间)差异有关。
(二)最佳抽样比的确定
在总费用一定时,考虑下述简单的线性费用函数:
CC0C1nC2nm
若一阶级单元间的旅费不占重要位置,则上述费用函数被证明是适用的。这里C0是与样本量无关的固定费用,C1,C2分别为平均每调查一个一阶单元和二阶单元的费用。
又方差函数
22S2S1212S2V(y)(S1)nMmnN
式中右边的最后一项与n及m的选择无关,建立函数
Q(V12S1)(CC0)N
22S212S2[(S1)](C1nC2nm)nMmn22S2S22[S1](C1C2m)Mm则当费用固定条件下,使方差极小,或在方差固定条件下使费用极小,等价于使函数Q极小化。故使Q关于m的偏导数等于零,则可求得m的最优值为
moptS2S12SM22C1C2 (其中
2S12S2M)
当m不为整数时,应取整。令m[mopt]
2若moptm(m1),则取mm1; 2若moptm(m1),则取mm
2M0,则取mM 若moptM或S12S22ˆ2s2,Sˆ2s2,当S12,S2的值未知时,可以用试点调查的结果加以估计,即取S1122则可以按上述同样的思路求得mopt的估计量。
求出m后,将其代入估计量方差的计算公式或上述线性费用函数式中,即可求出n的值。这样就可确定出最佳的抽样比f1和f2。特别地,当f21时,即
mM时,二阶抽样就化为对一阶单元进行的单级整群抽样,故其估计量的方差及其估计量就转变为整群抽样估计量的方差及其估计。当f11,即nN时,二阶抽样就化为按比例分配的分层随机抽样,且其层权相等,此时二阶抽样估
计量的方差及其估计也就转变为分层随机抽样估计量的方差及其估计。所以,一般地二阶抽样也可看作是把一阶单元作为层的不完全的分层抽样。
第三节 一阶单元不等大小的两阶抽样
一、等概率抽样
1、简单估计量
由于两阶段的抽样都是简单随机的,因此总体总和的无偏估计量为
ˆNYunNˆYini1nMii1minNyijni1nMi1niyi
当两阶段均为不放回抽样时,其方差为
ˆ)V(YuN2(YY)(1f)i1i1N22NNMi2(1f2i)S2i ni1minN1方差的无偏估计量为
ˆ(Yˆ)VuN2ˆYˆ)(Y(1f)iu1i1n22NnMi2(1f2i)s2ini1minn1
其中f1=n/N为第一阶段抽样比,f2imi/Mi为第i个一阶单元内的抽样比;
1Mi2S(yY)ijiMi1j122i22i,
1mis(yijyi)2mi1j1YiYi/Mi,yiyi/mi,1nˆˆYYini1若f2if2,即第二阶段的抽样比为常数,则
ˆNYunf2y
iji1j1nmiˆ是自加权的,nf2是总体中每个二阶单元入样的概率。 可见,此时YuN若估计总体均值,则有
ˆYˆYu,
M0其方差为
ˆˆ)/M2 V(Y)V(Yu0方差估计量为
ˆˆ(Yˆ(Yˆ)/M2 V)Vu0其中M0Mii1N
2、比估计量
ˆ虽然是无偏的,但效果一般不好,方差较大。因此也可利用简单估计量Yu以Mi为辅助变量来构造比估计量。
ˆMYRi10nMyiniMi10Yˆi1ni1ni
iiMˆYRMi1ni1niyii
M
ˆ的近似方差为 比估计量是有偏的,其估计量YRˆ)V(YR方差估计量为
N2M(1f)1i1N2i(YiY)2nN12NNMi2(1f2i)S2ini1mi
2N(1f1)ˆ(Yˆ)VRnˆ22M(yYiiR)ni1n12NnMi2(1f2i)s2ini1mi
ˆ由此易得关于估计量YR的相应结果
ˆˆ)/M2V(YR)V(YR0ˆ2ˆ(YˆVR)V(YR)/M0
,
其中M用
1nMini1估计。
3、比例的估计
在估计Y的公式中,令
j个二阶单元具有某特性,1,若第i个一阶单元中第yij
若第i个一阶单元中第j个二阶单元不具某特性,0,就可得到估计比例P的公式。由于二阶单元总数通常是未知的,这里给出比估
计的公式。
ˆ表示第i个一阶单元的二阶样本单元中具有某特性的单位占的比例,设Pi则总体中具有该特性的单位占的比例的估计量
ˆP
ˆMP
i
i1
nn
i
M
i1
i
其方差估计量
ˆ(Pˆ)1f1Vˆ2nM其中
mi1n2iˆPˆ)(Pin11ˆ2nNMˆ(1Pˆ)Pii M(1f2i),mi1i1n2i
1nˆMMini1
二、不等概率抽样
这里只讨论当n>1时的一般情形。 (一)放回的不等概率抽样 1、估计量及其方差
设总体由N个一阶单元组成,第i个一阶单元包含Mi个二阶单元。按PPz抽样(与第一阶单元的大小成比例的放回地逐个独立地抽样)抽取了n个一阶单
MMi'Mi'为元,第i个一阶单元入样的概率为zi,zi1,(ziM/M,'i'0'0i1i1NN衡量第i个一阶单元大小尺度;若M为确知,则ziMi/M0)。然后在被抽
'iNi1中的一阶单元中,按简单随机抽样,抽取mi个二阶单元,
f2imi/Mi(i1,2,,n)。
(1)如果一阶单元被重复抽中,则原来在第二阶段抽样中被抽中的mi个二阶单元也放回,按简单随机抽样再抽mi个二阶单元。在这种情况下,总体总和的无偏估计量是
ˆYppzˆ1nMy1nYiiini1zini1zi
(2)当一阶单元被重复抽中时,抽取二阶单元的其它方法:
①若第i个一阶单元被抽中ti次,就从中一次随机抽取miti个二阶单元(假定mitiMi),此时
ˆ)V(Yppz减少
n1N2MiS2ini1
②不论第i个一阶单元被抽中多少次,都只从中随机抽mi个二阶单元,这时
ˆ)V(Yppz增加
2n1NMi2(1f2i)S2ini1mi
在①、②两种情况下,估计量均为
ˆtiMiyi Ynzii1N其中ti为第i个一阶单元被抽中的次数。
2、估计量为自加权的条件
在ppz抽样时,由
1nMiyi1nMiˆYppzni1zini1zimiy
ijj1miˆ自加权的条件是 得YppzMi1Knzimif0
此时
ˆKyYppziji1j1nmi
其中K为常数,f0nzimi是任意一个二阶单元被抽中的概率,因而,上式表示Mi任意一个二阶单元被抽中的概率都相等。在实际应用中,若f0事先确定,
f2imif0也可按已被抽中的二阶单元确定。 Minzinˆ(Yˆ)Vppzn(n1)f02min对自加权的样本,其方差估计量可简化为
(yi1iy)2
其中yiyij是第i一阶单元中的mi个二阶单元之和。
j1在PPS抽样(即ziMi/M0)时,估计量简化为
ˆYppsM0ny
ij1miˆMy为自加权,Yˆ也是Y的无偏估计。它的一个无偏当mim时,Ypps0pps的方差估计量为:
2ˆnYMpps20ˆ(Yˆ)V(yi)ppsn(n1)i1M0M(yiy)2n(n1)i1n20
其中
1nmyyijnmi1j1
(二)不放回的不等概抽样
设总体由N个一阶单元组成,第i个一阶单元包含Mi个二阶单元。第一阶段抽样是不放回的不等概率抽样, i为第i个一阶单元入样的概率,
inzi,ij为第i和第j个一阶单元同时入样的概率。第二阶段是简单随机抽样。
此时,总体总和可采用以下形式估计
nMyˆYHTiii1niˆ1Yini1zii1inˆYi
ˆ是Y的无偏估计量,其方差为 可以证明YHT
2Mˆ)()()i(1f2i)S2 V(YHTijij2iijimii1jii1NNYiYj2Nˆ)的一个无偏估计量为 方差V(YHT2ˆNˆYijYM(1f2i)2ijj2iiˆ(Yˆ)V()s2i HTijijimii1jii1nn
因篇幅问题不能全部显示,请点此查看更多更全内容