首页 百科知识 类型及作用

类型及作用

时间:2023-03-11 百科知识 版权反馈
【摘要】:第一节 抽样的概念、类型及作用一、抽样的基本概念1.总体总体通常与构成它的元素共同定义:总体是构成它的所有元素的集合,而元素则是构成总体的最基本单位,总体一般用大写字母N表示。在社会研究中,资料的收集工作往往是在样本中完成的。在统计中最常见的总体值就是某一变量的平均值。它是指在一定的置信度下,样本统计值与总体参数值之间的误差范围。
类型及作用_社会调查与统计

第一节 抽样的概念、类型及作用

一、抽样的基本概念

1.总体(population)

总体通常与构成它的元素共同定义:总体是构成它的所有元素的集合,而元素则是构成总体的最基本单位,总体一般用大写字母N表示。在社会研究中,最常见的总体是由社会中的某些个人组成的,这些个人便是构成总体的元素。比如,当我们开展对某省大学生的择业倾向进行研究和探讨时,该省所有在校大学生的集合就是我们研究的总体,而每一个在校大学生便是构成总体的元素。又比如,我们打算研究某城市居民的家庭生活质量。那么,该市所有的居民家庭就构成我们研究的总体,而其中的每一户家庭都是这个总体中的一个元素。

2.样本(sample)

样本就是从总体中按一定的方式抽取出的一部分元素的集合。样本数目一般用小写字母n表示。或者说,样本就是总体的一个子集。比如,从某省总数为11.8万人的大学生总体中,按一定方式抽取1000名大学生进行调查,这1000名大学生就构成该总体的一个样本(当然,从一个总体中可以抽取若干个不同的样本)。在社会研究中,资料的收集工作往往是在样本中完成的。

3.抽样(sampling)

明白了总体和样本的概念,再来理解抽样的概念就十分容易了。抽样就是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。比如,从3000名工人所构成的总体中,按一定的方式抽取200名工人的过程;或者从1000户家庭构成的总体中,按一定方式抽取一个由100户家庭构成的样本的过程,这都叫做抽样。

4.抽样单位(sampling unit)

抽样单位就是一次直接的抽样所使用的基本单位。抽样单位与构成总体的元素有时是相同的,有时又是不同的。比如,上面所举的例子中,单个的大学生既是构成某省11.8万名大学生这一总体的元素,又是我们从总体中一次直接抽取1000名大学生的样本时所用的抽样单位;但是,当我们从这一总体中一次直接抽取40个班级,而以这40个班级中的全部学生(假定正好1000名)作为我们的样本时,抽样单位就是班级了,所以抽样单位(班级)与构成总体的元素(学生)就不是一样的了。

5.抽样框(sample frame)

抽样框又称作抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单。比如,从一所中学的全体学生中直接抽取200名学生作为样本,那么,这所中学全体学生的名单就是这次抽样的抽样框;如果是从这所中学的所有班级中抽取部分班级的学生作为调查的样本,那么,此时的抽样框就不再是全校学生的名单,而是全校所有班级的名单了。因为此时的抽样单位已不再是单个学生,而是学校的单个班级了。

6.参数值(parameter)

参数值也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。在统计中最常见的总体值就是某一变量的平均值。比如,某市待业青年的平均年龄和某厂工人的平均收入,等等,它们分别是关于某市待业青年这一总体在年龄这一变量上的综合描述,以及某厂工人这一总体在收入这一变量上的综合描述。需要说明的是,总体值只有通过对总体中的每一个元素都进行调查或测量才能得到。

7.统计值(statistic)

统计值也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计值。比如,样本的平均值就是通过对样本中的每一个元素进行调查或测量后计算出来的,它是相应的总体平均值的估计量。抽样的目的之一,就是要通过这些样本值去估计和推断各种总体值。由于从一个相同的总体中可以根据不同的抽样设计得到若干个不同的样本,所以,从每一个样本中所得到的估计量都只是总体的许多个可能的估计量中的一个。抽样设计的目标,就是尽可能使所抽取的样本的估计量接近总体的参数值。

注意参数值和统计值的重要区别。参数值是确定不变的、唯一的,并且通常是未知的;统计值则是变化的,即对于同一个总体来说,不同样本所得的统计值是有差别的。同时,对于任意一个特定的样本来说,统计值是已知的或者说是可以通过计算得到的。

8.置信度(Confidence Level)

置信度又称为置信水平,它指的是总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度。比如,置信度为90%,指的是总体参数值落在样本统计值某一区间的概率为90%,或者说,我们有90%的把握认为样本统计值将落在总体参数值周围的某一区间内。

9.置信区间(Confidence Interval)

上面介绍置信度时所说的“某一区间”,就是指置信区间。它是指在一定的置信度下,样本统计值与总体参数值之间的误差范围。置信区间反映的是抽样的精确性程度。置信区间越大,即误差范围越大,抽样的精确性程度就越低;反之,置信区间越小,即误差范围越小,抽样的精确性程度就越高。

二、抽样类型

根据抽取对象的具体方式,我们把抽样分为各种不同的类型。从大的方面看,各种抽样都可以归为概率抽样与非概率抽样两大类。这是两种有着本质区别的抽样类型。概率抽样是依据概率论的基本原理,按照随机原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性;而非概率抽样则主要是依据研究者的主观意愿、判断或是否方便等因素来抽取对象,它不考虑抽样中的等概率原则,因而往往产生较大的误差,难以保证样本的代表性。本章的大部分内容将主要涉及概率抽样的方法,因为它是目前用得最多,也是最有用处的抽样类型。而对于非概率抽样方法的介绍只占很小的篇幅。

在概率抽样与非概率抽样这两大类中,还可细分出若干不同的形式,具体情况见图5-1。

三、抽样的作用

从抽样的定义中不难看出,抽样主要涉及和处理有关总体与部分之间的关系问题。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。实际上,抽样早就在人们的日常认识活动中发挥着这种作用。抽样的基本思想或基本逻辑早就被人们自觉或不自觉地运用着。比如,顾客在买米时,往往先从一大袋米中随手抓一把看看,便知道这批米的质量好不好;医生只要从病人身上抽取很少的一点血液,便可以了解病人全身血液的各种状况。当然,抽样方法更广泛地应用在各种形式的社会科学研究、自然科学研究,以及生产、销售等经济活动中。例如,对社会热点问题进行民意测验、对不同水稻品种的产量进行估计、对各种商品的质量进行检验或评比,都少不了抽样方法的运用和帮助。

img20

图5-1 基本抽样方法分类图

在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。一项社会研究若能对总体中的全部个体都进行了解,则当然是很好的。实际上广大研究人员常常会在时间、经费、人力等方面遇到难题,甚至陷入困境,从而不得不在庞大的总体与有限的时间、经费、人力之间寻求平衡。以现代统计学的概率论为基础的现代抽样理论,以及不断发展不断完善的各种抽样方法,正好适应了社会研究的发展和应用的需要,成为社会研究知识体系中必不可少的一部分内容。可以说,抽样方法是架在研究者十分有限的时间、经费、人力与庞杂、广阔、纷繁、多变的社会现象之间的一座桥梁。有了它的帮助,研究者可以方便地从较小的部分达到很大的整体。

为了综合地说明抽样所具有的神话般的作用,我们来看一个实际的例子。1984年11月,罗纳德·里根59%比41%的优势当选为美国新一任总统。在正式投票选举的前夕,一些政治民意测验机构就已根据他们抽样的结果预言了里根的胜利。表5-1就是美国的一些全国性的民意测验机构在10月底或11月初所作出的预测结果与实际投票结果的比较。

从表5-1中可以看出,尽管各种民意测验的结果并不相同,但是,一方面,他们都正确地预言了谁将获胜;另一方面,他们所预言的结果基本上都是紧紧围绕在实际投票结果的周围。那么,在将近1亿的美国选民中,他们究竟调查了多少人就得到这种结果的呢?他们的调查对象还不到2000人!这就是抽样所具有的力量和效率。

表5-1 1984年美国总统选举预测结果与实际投票结果的比较(%)

img21

资料来源:BABBIE.The Practice of Social Research,1986:137.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈