7.4.1 抽样方案设计
抽样方案是指对整个抽样调查过程的具体组织实施办法。 要使抽样推断工作顺利进行,需要全盘考虑,进行抽样方案设计。 抽样方案设计的内容包括:
①确定抽样调查的目的和调查项目;
②确定调查对象(总体);
③确定抽样调查的组织方式和抽样方法;
④确定抽样调查达到的可靠程度和准确性的要求;
⑤确定必要的抽样数目;
⑥确定抽样估计的方法;
⑦确定工作机构及经费管理。
在抽样组织实施过程中要注意保证实现抽样的随机性原则;保证实现最大的抽样效果。
7.4.2 必要抽样单位数目的确定
在抽样推断中,影响抽样误差的因素有抽样单位数n。 抽样单位数越多,抽样误差越小,抽样推断越可靠。 但是,抽取的样本单位数太多,会浪费大量的人力、物力和时间;抽样单位数太少,抽样误差太大,无法达到准确性和可靠性要求的目的。 因此,若要控制抽样误差,保证抽样结果能达到预期目的,可以在抽样调查之前,合理地确定抽样单位数目。
在简单随机抽样方式下,可根据抽样极限误差的公式推导出来。 如在重复抽样条件下平均数估计时必要的抽样数目,根据抽样极限误差:
Δx=tμx
同理可以推得,成数估计时的必要抽样数目为:
在不重复抽样条件下,对平均数估计的必要抽样数目为:
对成数估计的必要抽样数目为:
上述公式计算时要注意的问题:
①计算时一般总体的方差(σ2或P(1-P))未知,在没抽样之前也无法用样本方差(s2或p(p-1))代替。 一般可以前一次或用历史资料代替。 如果以前没有调查资料,可事先作一些试验性调查,用试验结果得到的方差代替。
②如果方差同时有多个不同的结果,对σ2而言选择最大的一个值。 对P而言选择最接近0.5的那个数值,它能使成数的方差P(1-P)为最大值,才能保证抽样调查一定的准确性。
③在同一调查中,平均数和成数估计所需的抽样单位数目不同时,或者有多个抽样单位数目资料时,为了保证抽样的准确性和可靠性,应该取其中较大的数值n作为共同使用的抽样单位数目。
例7.13 以抽样调查学生生活消费支出为例,根据以前调查,学生平均生活消费支出的标准差为80元,要求抽样误差不超过30元,概率保证程度要达到99.73%,那么,应抽取多少个样本单位为宜?
根据以上条件,σ=80,t=3,Δx=30。
重复抽样,平均数抽样单位数目为:
不重复抽样,平均数抽样单位数目为:
若根据以前调查,学生生活消费在300元以下人数占71%,要求允许误差不超过15%,概率保证程度要达到99.73%应抽取多少单位数目?
已知:P=71% Δp=15% t=3。由
P(1-P)=0.71×0.29=0.2059
重复抽样,成数的抽样单位数目为:
不重复抽样,成数的抽样单位数目为:
根据以上计算可知,要达到以上要求,估计学生月平均消费支出和生活消费在300元以下人数比重,至少应抽取样本单位数目为83人。
例7.14 如果想从一个专业500名学生中抽选随机样本,以估计他们每天用于学习的平均时间。 据有人调查,平均时间的标准差为30min。 要求允许误差不超过5min,概率保证程度为95.45%,应抽取多大的样本?
已知:N=500,σ=30,Δx=5,t=2。
重复抽样:
不重复抽样:
结果表明,要达到以上要求,按重复抽样应抽取144人,不重复抽样应抽取112人。
由以上计算可知,影响抽样单位数目的因素有:
①t值的大小,即可靠性的大小。 t值大,可靠性F(t)高,就需要多抽;反之,就可以少抽。
②Δx或Δp值的大小,即准确性的大小。准确性高(允许误差范围小)需要多抽;反之,就可以少抽。
③σ2或P(1-P)值的大小,即总体变量值差异程度的大小。 在准确性和可靠性一定的情况下,差异程度大需要多抽;反之,就可以少抽。
④抽样方法的不同。 在达到一定准确性和可靠性的情况下,一般重复抽样需要多抽,不重复抽样可以少抽。
下面用实例说明,在其他条件不变的情况下,如果改变允许误差范围抽样单位数目将如何变化。
例7.15 以例7.13的资料,若允许误差范围为原来(30)的一半Δx=15,按重复抽样的抽样单位数目将如何变动。
可以由公式计算得:
这说明,抽样允许误差范围只减少一半(准确性提高了),抽样单位数目就要增加为原来(64人)的4倍,这将增加许多调查工作量。
允许误差范围比原来增加一倍Δx=60,抽样单位数目就只要原来的1/4,即
当允许误差增加一倍(即为原来的2倍)时,抽样单位数目:
7.4.3 抽样组织方式
抽样有5种基本组织方式:简单随机抽样、类型抽样、等距抽样、整群抽样和多阶段抽样。 由于不同的抽样方式,抽样平均误差计算不同,抽样估计的结果有所不同。 前面所计算的抽样平均误差、抽样单位数目以及进行区间估计,都是在简单随机抽样方式下进行的。
1)简单随机抽样
简单随机抽样又叫纯随机抽样,它是按随机原则直接从总体N个单位中抽取样本容量为n的样本单位。 这种抽样方式能使总体中每一个单位有同等被抽中的机会,比较适用于总体差异程度较小时采用,是抽样调查最基本的组织方式。
简单随机抽样通常是用抽签的方式抽取所要调查的单位。 具体过程是,先将总体各单位编上号,然后随机抽取。 抽取时可直接抽签,也可用《随机数值表》进行抽取。
2)类型抽样
类型抽样又称分类抽样,它的特点是先对总体各单位按有关标志进行分类(组),再从各类中按随机原则抽取一定数量的单位。 由于事先将总体单位分类,把性质比较接近的单位划在同一类型中,从而缩小了各单位之间的差异程度,抽选时每一种类型都抽到了。 因此,抽出的样本具有较高的代表性,抽样误差较小。 如对某地区居民收入情况进行调查,首先对居民收入进行初步了解(如职业、工作单位、职务、职称等)的基础上,按收入划分成高收入、中等收入和低收入3类,然后在各类中抽出部分单位构成样本进行调查。
类型抽样是从总体N个单位,分为k组,各组单位数Ni(i=1,2,…,k),从N中抽取n个单位,n是由从各组Ni中分别抽取ni(i=1,2,…,k)个单位构成。 样本单位在各类之中抽选多少,有两种分配方法:一是按各种类型单位数占总体单位数的比例的大小分配;另一种是按各种类型标志变动程度大小分配,变动程度大的多抽,反之,少抽。 通常采用前一种分配方法。
3)等距抽样
等距抽样又称机械抽样。 它事先将总体各单位按某一标志排队,然后,每隔一定的距离抽取一个调查单位。 第一个样本单位按随机性抽选,第一个单位一经确定,其余的单位每隔一定距离抽选。 排队的标志可采用与调查目的有关标志,也可采用无关标志。
如对某行业职工收入进行调查,按职工工资收入由低到高进行排队,每隔一定距离抽一职工。 抽到的职工各工资层次都有,构成的样本代表性也较高。 按与调查目的有关标志排队进行抽样,能保证抽取调查单位在总体中均匀分布,并能缩小各单位间的差异程度。 这种抽样误差通常比简单随机抽样误差小,与类型抽样近似。
按无关标志排队,按职工年龄由低到高进行排队,每隔一定距离抽一职工,抽到各年龄层次的职工,但年龄与收入不一定有关,按与调查目的无关标志排队进行抽样,并不能缩小各单位间的差异程度,这种抽样与简单随机抽样近似。
4)整群抽样
整群抽样是将总体各单位划分成若干群,然后随机抽取一些群,对选中的群的全部单位都进行调查。 整群抽样比较容易组织,有些现象适用于整群抽样。 如对某大学学生生活消费支出进行调查,可以采用整群抽样,把一个班作为一个样本群,抽到的群每一个同学都进行调查。 又如,大批量连续生产产品进行质量检验,每隔10h抽出1h生产的产品进行检验。 这是把连续生产的时间划分每1个小时为一群,凡抽到群(1h)的全部产品都进行检验。
5)多阶段抽样
以上4种方式都是指经过一次抽选就可以直接确定样本单位的抽样方法。 但在实际调查中,调查总体很大,总体单位分布又广,抽样调查直接抽选总体单位有困难时,采用多阶段抽样比较恰当。
多阶段抽样就是把抽取样本单位的过程分为两个以上的阶段进行。 先从总体中抽选若干大的样本单位,这是第一阶段抽样。 然后,从被抽中若干大的单位中抽选较小的样本单位,这是第二阶段抽样。 以此类推,再在被抽中单位中抽选较小的样本单位,可以有第三阶段、第四阶段等,最后抽出所需的样本来。
如某地区教育主管部门要了解目前大学生就业情况。 如果直接抽查学生有一定困难,可以采用多阶段抽样。 首先,按照随机原则抽选一些学校,然后,在被抽到的学校中随机抽选一些系或专业,再在被抽到的系或专业中抽选一些人进行调查。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。