首页 百科知识 抽样误差和偏差

抽样误差和偏差

时间:2023-06-20 百科知识 版权反馈
【摘要】:三、抽样误差和偏差抽样技术再好,也不能保证样本完全代表总体,也就是说,统计值不可能完全和参数值相等,只是在样本量足够大的情况下两者很接近。研究者无法控制的因抽样机遇而产生的误差,属于抽样误差。配额抽样的缺陷主要是,额度分配难以精确代表各集合之间的实际比例,特别是当前的动态信息难以及时收集。总的说来,非概率抽样方法较之概率抽样法可靠性要差,然而比较容易应用,耗费也较小。

三、抽样误差和偏差

抽样技术再好,也不能保证样本完全代表总体,也就是说,统计值不可能完全和参数值相等,只是在样本量足够大的情况下两者很接近。研究者无法控制的因抽样机遇而产生的误差,属于抽样误差(sampling error)。至于抽样偏差(sampling bias),它并非是由于抽样机遇的原因导致的随机误差,而是研究者的失误造成的系统误差。美国1936年总统竞选预测说明这种情况。前述Literary Digest未能预测到罗斯福将当选总统,所设计的调查样本数很大,有1000万,然而样本选择出了偏差。Literary Digest根据汽车注册和电话簿名单抽样,1936年正值经济萧条,有相当数量的选民并没有自购汽车或安装电话,这部分人口的投票状态被忽视了,这是抽样偏差。

抽样偏差主要来自非概率抽样技术。由于研究人员怕费时和花钱,往往主观随意抽样。管理研究中也有采用主观抽样的情况,尽管有偏差,但使用简便。主观抽样的方式有以下三种:

1.简便抽样

研究者将自己所能遇到的人员、事件作为样本,如“街头拦人”作为调查对象,这在电视节目上常常看到。到企业参观,向所遇到的职工提问了解情况,这都属于简便抽样(convenience sampling)。这种抽样调查可提供信息,但很难据此得出一般适用的结论。譬如,研究人员想弄清这样一个问题,银行营业所工作人员如果每上班1小时后休息5分钟是否能减少差错,便在就近找了两个营业所比较,一个安排短暂休息,一个连续工作,一个月以后,短暂休息的营业所差错减少,那末,是否能得出结论,短暂休息对减少营业所人员操作差错有好处?并不能。因为此样本并非从总体中选择出来,对该营业所有效,并没有足够理由推广到其他营业所。

2.判断抽样

判断抽样(judgment sampling)是研究者根据自己的知识结构和研究目的而主观断定样本的过程。这种方法在探索性研究初期很适合,在未完全辨识清楚研究对象的总体构成前就可进行研究,发现问题。比如,研究企业亏损原因,可以主观挑选有代表性的企业进行研究,研究结果有助于发现亏损原因,但不能得出普遍亏损原因的结论。有的企业采取本企业员工试用新产品的办法,判断新产品的市场前景。如员工通不过的产品,预计在市场上也不可能成功,这也是判断抽样法的应用。

主观判断实际上背后隐含着某种准则,例如,可根据历史记录来判断抽样。美国总统选举预测往往把几个州作为样本,注意力集中在人口不算多的几个州的预选,原因是这几个州的预选结果历来与最后选举结果接近。也可根据问题的重要性来判断,500个国有大型工业企业的产值占全国国有企业总产值的绝大部分,从这500家企业中选择样本推断国有企业总产值具有充分理由。然而,主观判断抽样总是存在以偏概全的可能。

3.配额抽样

配额抽样(quota sampling)是按计划给各类分总体分配样本数。盖洛普民意测验1936年预测成功和1948年预测失败都是采用配额抽样。配额抽样先要辨识与研究有关的总体多种属性,如企业职工先按工作类别分类,再按年龄、受教育程度等属性分类。这样可分出大学教育以上、男性的工程技术人员等类的最基本集合,然后按算术平均或加权方式对各基本集合分配样本额度。

配额抽样的缺陷主要是,额度分配难以精确代表各集合之间的实际比例,特别是当前的动态信息难以及时收集。1948年,盖洛普错误地预测杜鲁门将落选,其原因就是样本额度分配不当。再者,样本是主观判定的,是否在本集合中有代表性也有疑问。

总的说来,非概率抽样方法较之概率抽样法可靠性要差,然而比较容易应用,耗费也较小。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈