首页 理论教育 样本量的大小

样本量的大小

时间:2023-04-22 理论教育 版权反馈
【摘要】:四、样本量的大小样本量是指样本中所含个体数量的多少。样本量不仅会影响样本对总体的代表性,而且还直接影响着调查的成本。此外,样本量的大小还与研究中所涉及的变量个数和结果汇总要求有关。确定样本量的大小除了考虑总体规模的影响外,还要考虑总体内部个体差异程度的影响。此外,在同样的精度要求下,样本量的大小还因抽样组织方式的不同而不同。

四、样本量的大小

样本量是指样本中所含个体数量的多少。样本量不仅会影响样本对总体的代表性,而且还直接影响着调查的成本。太大的样本会造成人力、财力的浪费;太小的样本则会降低调查的价值。因此,确定最恰当的样本量是非常重要的。

(一)决定样本量大小的因素

样本量的大小是根据研究的目的、总体的性质和客观条件而确定的。

1.研究目的

开展一项调查,其主要目的是看是否为了推知总体的状况。如果要推知总体的状况,就需要开展定量调查,就需要从统计学意义上确定较大的样本量;如果不是为了推知总体,而只是关心某一部分人的观念和态度,或是希望获得对某个问题的初步认识,就可以开展定性调查,这时一般抽取一个小样本进行调查就可以了。同时,从另一个角度,如果开展调查是为了重要的决策,就需要较大的样本量;反之,样本量就可以稍微小一些。

对于定量调查,不同的调查对样本的代表性有不同的要求,一般用估计的精度来衡量。所谓精度就是用样本去估计总体时所允许的最大误差。对样本的精度要求越高,所允许的误差就越小,样本量就要越大,反之亦然。

此外,样本量的大小还与研究中所涉及的变量个数和结果汇总要求有关。一般来说,涉及的变量越多,所需的样本量也就越大;在结果汇总时所需的分类越多,所需的样本量也就越大。

2.总体的性质

总体的性质主要指总体的大小、总体内个体间的差异程度、总体的分布特性等。

在一定的精度要求下,总体越大则样本量也应该越大,但当总体增大到一定规模后,样本量基本可以不再增加。

确定样本量的大小除了考虑总体规模的影响外,还要考虑总体内部个体差异程度的影响。如果总体内个体间差异不大,抽取少量的个体就可以代表总体;但一个同样大小、而内部个体间差异很大的总体,就需要一个较大的样本才能保证总体中的各种情况都能在样本中被代表。

此外,在同样的精度要求下,样本量的大小还因抽样组织方式的不同而不同。而选择哪种抽样组织方式是根据总体的分布特征确定的。每一种概率抽样方法都有自己的计算样本量的公式,因此,在考虑总体分布特征的前提下确定了恰当的抽样方法后,需专门计算这一抽样方法所要求的样本量。

3.客观条件

所谓客观条件就是能够用于研究的人力、财力、时间。样本量越大,所需的费用也就越多,所以确定样本量时不得不兼顾研究费用的限制。当费用过于紧张时,有时不得不放弃较高的精度要求而适当减少一些样本量。

(二)样本量的确定

在统计学中,一般将少于或等于30个个体的样本称为小样本,大于或等于50个个体的样本称为大样本。定性研究的样本基本都是小样本,比较容易确定。而媒介研究范畴的定量研究,其总体一般比较大,总体中个体的差异性也很大,一般来说,其样本量都在几百人和几千人之间。

1.当总体很大时

要精确地确定定量调查的样本量需要有概率论和数理统计的知识,需要进行复杂的计算,这里从略。表1—13给出了当总体很大时非常简单随机抽样的样本量要求,这是根据估计的精度要求来推断的。例如,要估计某一电视栏目在北京地区观众的比例,本研究的总体是北京地区的所有观众。精度要求是在95%的把握(置信度)下,用样本推断总体时误差控制在3%的范围内,也就是说,如果通过对样本的调查获得样本中该栏目的观众比例是P,则总体中该栏目观众的比例有95%的把握在P±3%的范围内,这时样本量必须达到1067人。

表1—13   非常简单随机抽样所需的最小样本量

img26

如果在估计全部观众比例的同时还要以同样的精度估计总体中儿童观众的比例,则样本中儿童的人数就要达到1067人,若已知北京地区4岁以上儿童(有收视能力)占全部人口的1/8,则随机抽样的总样本就应该是1067÷1/8=8536人,这时在估计全部观众比例时的误差范围实际比3%小得多。

从这个例子可以看出,当很多估计指标的估计精度对样本量同时提出了不同的大小要求时,如果要满足所有的精度要求,就要把样本量设置为要求最高的情况,即样本量最大的情况,这样在估计其他指标时的实际精度比要求的要高。

以上讨论的是非常简单随机抽样以及总体较大的简单随机抽样的最小样本量要求,其他抽样方式的样本量会有不同。一般情况下,在保证相同的精度要求下,分层抽样的样本量可小于非常简单随机抽样,整群抽样的样本量应大于非常简单随机抽样。

2.当总体不太大时

当总体不是足够大而且总体中个体差异较大时,样本量应该随着总体的增大有一定程度的增大。表1—14给出了在置信度为95%、最大误差范围为3%的精度要求下非常简单随机抽样的样本量随总体大小的变化情况(在总体中个体的差异较大的情况下)。

表1—14   不同大小的总体样本量的要求

img27

以上两种确定样本量的方式是通过单纯的计算进行的,没有考虑各种复杂的社会因素,而实际情况远非这么简单。因此,具体的抽样常常需要专业抽样人员的指导。

(三)关于样本量的讨论

1.样本量越大,代表性越好的原因

相信很多人还记得1936年美国《文学摘要》预测总统选举时的样本量是230万人,可是并没有正确地预测大选结果,这就是一个很好的说明。样本对总体的代表性取决于抽样的方法是否科学、是否能保证随机。如果抽样方法是偏的,那么样本量越大,代表性可能反而越差,从而造成错误结论的可能性也就越大。

2.样本量越大,估计的精度越高的原因

对于随机样本来说,这种说法在一定程度上是对的。但抽样误差的大小并不是与样本量n成反比,而是与样本量的平方根img28成反比。在实际操作上,当样本量增大到一定程度(如3000人)后,再继续增加样本量,精度提高的幅度将越来越小,而成倍地增加调查的费用获得这样的收益是得不偿失的。一般的抽样调查样本量总是取1000~3000之间,这样既能达到足够的精度,又能够保证费用的节约。

3.总体越大,所需的样本量也要越大的原因

对于不是无限大的总体,这是对的,我们确定样本量时需要参考总体的大小。但是对于同样是无限大的总体,例如全国调查和全省调查,是否全国调查的样本量应当远远大于某省全省内调查的样本量呢?不少人的确会这样想。事实上,不管是全国调查还是全省调查,总体的大小N对样本量的影响是很小的,这两种情况下的n/N都几乎为0,而确定样本量时对总体大小的考虑实际上考虑的是n/N,所以两种情况下的样本量是基本没有差别的。因此,只有当总体很小,即n/N比较大(超过10%时)时,总体的大小对样本量的影响才有明显的意义。如果不考虑其他因素,在全国、全省和全市进行抽样调查所需的样本量基本上不应有太大的差别。

【注释】

[1]袁方主编:《社会研究方法教程》,北京大学出版社1997年版,第8页。

[2]袁方主编:《社会研究方法教程》,北京大学出版社1997年版,第4页。

[3]袁方主编:《社会研究方法教程》,北京大学出版社1997年版,第4页。

[4]Roger Wimmer &Joseph Dominick著,李天任、蓝莘译:《大众媒体研究》(Mass Media Research-An Introduction),台湾亚太图书出版社1995年版,第12页。

[5]袁方主编:《社会研究方法教程》,北京大学出版社1997年版,第10页。

[6]肖明、丁迈著:《精确新闻学》,中国广播电视出版社2002年版,第74页。

[7]Shearon A.Lowery,Melvin L.De Fleur著,王嵩音译:《传播研究里程碑》(Milestones in Mass Communication Research),台湾远流出版事业股份有限公司1993年版,第36页。

[8]柯惠新等著:《传播统计学》,北京广播学院出版社2003年版,第4页。

[9]Roger Wimmer &Joseph Dominick著,李天任、蓝莘译:《大众媒体研究》(Mass Media Research-An Introduction),台湾亚太图书出版社1995年版,第29页。

[10]袁方主编:《社会调查原理与方法》,高等教育出版社2000年版,第108页。

[11]David H.Weaver,Jian-Hua Zhu and Lars Willnat:《The bridging function of interpersonal communication in agenda-setting》,Journalism Quarterly,Vol.69,No.4,Winter 1992,p 856-867.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈