首页 百科知识 样本规模的确定

样本规模的确定

时间:2023-06-29 百科知识 版权反馈
【摘要】:5.4 样本规模的确定样本规模又称样本容量或样本大小,指的是样本中所含个体数量的多少。置信度和置信区间是说明样本规模与抽样可靠性、精确度关系的两个重要概念。

5.4 样本规模的确定

样本规模又称样本容量或样本大小,指的是样本中所含个体数量的多少。确定样本容量是每一项具体的社会研究所必须解决的问题之一,同时也是抽样设计最重要的内容之一。样本的大小不仅直接影响样本的代表性,而且还直接影响调查费用和人力的花费。样本太大,会造成人力、物力、财力的浪费,增加工作量;样本太小,又会使调查结果与实际情况相差太大,影响调查质量,降低调查的效果。因此样本大小“适当”是非常重要的,应科学合理地确定样本的大小。

5.4.1 影响样本规模确定的因素

适当的样本依研究所要求的精确度、总体规模、总体的异质性及抽样所费的人、财、物和时间等因素而定,确定样本容量时必须综合考虑以上因素。

1.研究所要求的精确度

研究的目的往往要求通过样本推断总体,例如通过一部分妇女的生育水平估计全国妇女的生育水平,而推断的可靠性和精确度与样本规模有密切关系。因此,在研究目的是由样本推断总体时,首先要依研究的目的确定抽样的精确度。某一研究要求的精确度就是这项研究能允许的样本估计量有多大的误差,即允许误差。置信度和置信区间是说明样本规模与抽样可靠性、精确度关系的两个重要概念。一般来说,在其他条件不变的情况下,置信度越高,即推断的可靠程度越高,所要求的样本规模就越大;置信区间越小,即样本值与总体值之间误差范围越小,所要求的样本规模就越大。反之,则要求的样本规模越小。在简单随机抽样中,样本规模与置信度、抽样误差之间的关系,可用以下公式表示:

img35

公式中,N为样本规模,P=0.5取置信度为95%时,Z值为1.96,当抽样误差SE定为3%时:

img36

这就是说,当抽样误差为3%、置信度为95%时,最低样本规模是1067个,当抽样误差从3%变为2%时:

img37

在简单随机抽样中,置信度越高、抽样允许误差范围越小,样本规模就越大。在精确度一定时,总体越大则样本也应越大。因此样本大小视研究所要求的精确度,即允许误差与置信水平而定。据计算,它们之间数量变化的关系如表5-11所示。

表5-11 置信度、允许误差与样本规模之间的关系

资料来源:福武直.社会调查方法.王康乐,译.湖南大学出版社,1986.

2.总体的规模

人们习惯上认为,在精确度要求下,样本规模应该与其选自的总体规模有某种比例关系,即总体越大者其样本容量要求也应越大。实际上,在置信度和抽样误差不变的条件下,样本占总体的比重是随着总体规模的扩大而不断缩小的。在置信度为95%、置信区间±3%、总体异质性较大的情况下,总体规模与样本规模的关系如表5-12所示。

表5-12 总体规模与样本规模的关系

由此可见,当总体规模增大时,必需的样本规模并不同它保持同样的增长速度,总体增大到一定规模后,样本规模基本上不再增加。如表5-12所示,对一组已知的条件(总体可信度、方差、误差界限等)来说,当总体规模从1000增大到500000或更大时,样本必需量有所增长,但当总体规模达到足够大时,样本的必需量相对于总体来说,只是受到较小影响,实际上规模在10000以上的总体,样本必需量是相当接近的。因此,当总体规模大到一定程度时(例如,100万)时,样本规模的增加对抽样误差的影响就微乎其微了,而且所要调查的总体规模越大,使用抽样调查越经济合算。这正是美国定期进行全国抽样调查的样本通常不超过3000人的原因。可见,认为样本规模越大越好只是一种误解。

3.总体的异质性

总体异质性是指总体各单位在研究特性上的差异程度,即总体标准差的大小。在其他条件和抽样误差不变的情况下,总体各单位之间的差异越大,即总体标准差越大,需要的样本规模就越大;反之,总体各单位之间的差异越小,即总体标准差越小,需要的样本规模就越小。因此,在考虑样本规模与抽样误差的关系时,必须把总体各单位的异质性程度考虑进去。

4.人、财、物和时间

一般地,样本规模越大,调查工作难度越大,调查成本就越高。因此,确定样本规模的大小应考虑现有的人、财、物和时间等条件。抽取多少数目的样本受到人、财、物和时间的限制,人多可多抽取样本,人少则少抽取样本;财物许可,样本可大一些,反之,就要小一些;时间许可,样本可大一些,时间紧张,样本则可小一些。在实际抽样调查中,调查者有时受财力等条件的限制,或者为了少用一些经费,或者为了少花时间、突出时效性,宁可冒一定的风险,降低精确度的要求。但精确度降低多少,应依调查本身的研究目的、总体性质、客观条件而定。

5.抽样类型

在抽样调查中,抽样类型的选择是根据调查的目的和调查对象的特点来确定的。但是,不同的抽样类型,抽取样本的性质、大小是不一样的。在同样条件下采用不重复抽样比采用重复抽样所需的样本数量可小一些;采用分层抽样、等距抽样比采用简单随机抽样所需的样本数量可以小一些;单个抽样比整群抽样所需的样本数量可以小一些。

5.4.2  样本容量的经验确定法

在统计学中,将样本的数量小于或等于30个个体的样本称为小样本,大于或等于50个个体的样本称为大样本。在社会调查中,由于它的研究总体和总体异质性均较大,所以一般都是抽取大样本。由上面的介绍可以看出,样本容量的研究要受到各种因素的制约,其精度要求与费用、抽样误差与非抽样误差始终是两对难以处理的矛盾,而且要精确地确定样本容量还需要有概率论和数理统计的知识,需要进行复杂的计算,但是单纯的计算不可能考虑到各种复杂的社会因素。而在一般的社会调查研究中,实际上并不要求很高的精确度,调查人员一般是凭经验确定样本数目的大致范围(一般来说,社会调查的样本数为50~5000)。随着抽样理论的发展和抽样调查的广泛应用,其中成功的经验逐渐成为样本设计的依据。例如,美国的民意测验,样本数一般为1600~2000人,即使调查总体近1亿人,它的样本也很少超过3000人,而最重要的全国调查样本则为15万~20万人。表5-13是经验确定样本数目的大致范围,仅供参考。

表5-13 经验确定样本容量的大致范围

应当注意的是,由经验确定的样本调查,不能由样本的状况来精确推论总体的状况,它们的调查结论仅作为了解总体状况的参考依据。要想精确地推论总体的状况,不仅要对样本代表性进行检验,而且要检查抽样方法是否科学。精确的抽样调查不仅需要抽样专家,也需要专业研究人员的指导。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈