首页 百科知识 多阶段分层不等概率抽样的估计

多阶段分层不等概率抽样的估计

时间:2023-03-20 百科知识 版权反馈
【摘要】:由于是全国性大样本的调查,在各个阶段中用到了多种复杂抽样方法的组合,包括PPS抽样[4]、简单随机抽样、等距抽样、KISH表抽样、典型抽样等。由于抽样阶段很多,每个层次涉及到的抽样方法各不相同,在进行最终统计推断时非常复杂。因此在这一阶段,我们采用分层随机抽样的统计推断方法来对总体进行估计。自代表城市的样本,没有经过抽取城市的第一阶段,因此在统计推断时其总体方差仅来自于层内差,即公式。
统计推断_全国国民阅读调查报告. 2010

本次研究采用的抽样方法为多阶段分层不等概率抽样。由于是全国性大样本的调查,在各个阶段中用到了多种复杂抽样方法的组合,包括PPS抽样[4]、简单随机抽样、等距抽样、KISH表抽样、典型抽样等。

由于抽样阶段很多,每个层次涉及到的抽样方法各不相同,在进行最终统计推断时非常复杂。为了简化参数估计的计算,对总体的推断有更加清晰的了解,我们将复杂的抽样过程简化为两个阶段:初级抽样单元(PSU),即抽取到的城市;二级抽样单元(SSU),即抽取到的最终样本——个人。

根据方差分析原理,对总体进行分层后,总体方差可以分解为两部分,一部分是层间方差,一部分是层内方差。初级抽样单元PSU之间的方差为层间方差;二级抽样单元SSU之间的方差为层内方差。两个层的方差估计过程如下:

第一阶段,城市的抽取,采用的是PPS抽样。PPS抽样的估计,可直接应用汉森—赫维茨(Hansen-Hurwitz)估计量的公式进行计算。具体计算过程如下:

记Yij为总体的第i个群中第j个次级单元的观测值(i=1,2,...,N;j=1,2,...,Mi),其中Mi是群的大小。yij为样本中第i个群中第j个次级单元的观测值(i=1,2,..., n;j=1,2,...,mi)其中mi是群的大小。

总体总量Y的估计量为

其中(Mi是分层抽样中群的大小,Mo是总体中所有群大小之和)。

第二阶段,从抽到的城市中抽取访问的个体。这个过程分成了多个阶段,地图块的抽取采用简单随机抽样,从地图块抽取户采用等距抽样,从户中抽取最终访问的样本采用KISH表抽样。在这一阶段中虽然采用了多种抽样方法的结合,但这几种方法组合的抽样原理基本可以认为与分层随机抽样一致。因此在这一阶段,我们采用分层随机抽样的统计推断方法来对总体进行估计。

在抽中的PSU所含的全部Mi个SSU中抽取mi个,总体方差的估计公式为

非自代表城市的样本,是通过以上两阶段抽取,在统计推断时其总体方差估计=公式(1)+公式(2)。自代表城市的样本,没有经过抽取城市的第一阶段,因此在统计推断时其总体方差仅来自于层内差,即公式(2)。

农业人口样本,在抽取县和行政村时采用了就近抽样的典型抽样方法,这种方法的变异量要高于随机抽样。因此在估计农业人口样本的总体方差时需要适当扩大公式(2)的值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈