有一项研究发现:甲城的市民智商平均比乙城市民的智商高。于是,有人由此得出一个结论:从甲城和乙城各自随机抽取一个市民,甲城的那位市民的智商会比乙城的那位市民智商高。很显然,这个结论是不对的,它犯了区群谬误。
区群谬误也叫生态谬误、层次谬误,是一种在分析统计资料时经常犯的逻辑错误,指的是仅仅基于群体的统计数据就对其下属的个体性质做出推论,这种谬误假设了群体中的所有个体都具有群体的性质,是典型的以全概偏。
◎区群谬误的来源
区群谬误最先见于美国社会学家威廉·罗宾逊在1950年写的文章。1930年,美国进行了一次人口普查,针对这次普查结果,罗宾逊分析了48个州的识字率以及与新移民人口比例的关系。他发现两者之间的相关系数为0.53,即一个州的新移民比率越高,平均来说这个州的识字率便越高。然而,当他分析个体资料时,却发现移民比率与识字率之间的相关系数为-0.11,即平均来说新移民比本地人的识字率低。
为什么会出现这种看似矛盾的结果呢?罗伯逊通过调查和研究,终于搞清楚了原因:原来,新移民普遍倾向于在识字率较高的州定居。由此,罗宾逊提出在处理群体资料或区群资料时,必须注意到资料对个体的适用性。值得注意的是,罗宾逊并非指任何群体资料对个体性质做出的判断都是错误的,而是说从群体资料推断个体资料时,必须注意群体资料是否会把个体的特殊信息隐藏起来。
罗宾逊指出的问题其实很好理解,即汇总的数据不能直接用来推论人的行为。人们为什么上学,为什么结婚,为什么生育,等等,如果只用汇总的材料进行分析,是无法找出真实原因的。举几个很简单的例子:
一个人从上海来,在你对他不太熟悉的时候,你可能认为他具有上海人的某些特点,比如聪明、勤奋、顾家等,但实际上,虽然这个人受到了上海整体文化和环境的影响,但他也可能有懒惰、小心眼、不顾家等毛病。所以,不能以“上海人具有某种特点”为论据,推出“每个上海人都具有这种特点”。
比如,足球世界杯期间,一位女士问一位男性朋友:“你怎么不看足球啊?”因为她觉得男人都爱看足球,世界杯足球赛正如火如荼地进行,怎么能错过看球的好机会呢?殊不知,她无形之中就犯了区群谬误。实际上,大多数男人确实爱看足球,但有些男人却是特例,偏不爱看足球。相反,很多人认为女性对足球不感兴趣,但偏偏有些女性是铁杆球迷,世界杯期间,每场足球赛必看。
再比如,西藏、贵州等地方整体经济较为落后,人均收入水平低,于是有人就此认定:所有的西藏人、贵州人都穷。殊不知,穷地方也有高收入者,也有富人,只不过富人少一些、穷人多一些而已。
◎正相关VS负相关
有两个班级:甲班和乙班。甲班的学生学习一门功课,平均要花10个小时,考试的平均成绩是90分;乙班的学生学习这门功课,平均要花12个小时,而考试的平均成绩是85分。由此,得出一个结论:虽然甲班的学生比乙班的学生花的学习时间少,但是成绩却比乙班学生好,因此,学习时间和学习成绩是负相关的。这个结论对不对?哪个地方出了问题?
很显然,这个结论是不对的,它的问题就出在:理论假设是在个人层面上,花多少时间学习是个人的事情,而结论却是以班级为单位的,统计数据也是以班级为单位的,这两者之间不吻合,也就造成了区群谬误。所以,从案例中根本得不出学习时间和学习成绩成负相关的结论。
因为在这里,会存在这样一种现象:两个班级学生的基础状况不一样、学习起点不同、智力水平有差异。从整体上来说,基础好、学习起点高、智力较好的学生在学习上花的时间少,学习效果好,成绩提高快。基础较差、学习起点低、智力不太好的学生,在学习上花的时间较多,但学习效果不太好,成绩提高较慢。因此,对个人而言,在学习上所花的时间多少和学习成绩是成正相关的,但是通过计算平均学习时间和平均成绩,在班级的单位上就成负相关了,这就是一个很经典的区群谬误。
◎绕开区群谬误
很多人都说女生的英语学得好,但数学、物理学得不好,这句话在大多数情况下可能正确,但并不代表每个女生的英语都学得好,数学、物理都学不好。因为事实上,有些女生的英语学不好,但数学、物理却学得很好,还有一些女生不但英语学得特别好,数学、物理也学得特别好。所以,绝不能说“有的女生英语学得好,数学、物理学不好”,就以偏概全地推出“所有的女生英语都学得好,数学、物理都学不好”。
要想避免出现类似的区群谬误,最好的办法是在整体性研究群体特性的同时,还要尽量多地研究群体中的个体情况。然后,将两种研究结果同时列出来,从而让人既清晰地看到两个群体之间的差异,又能清晰地认识到两个群体中个体之间的差异,这样的研究结论才是最真实客观的。
另外,要想避免陷入区群谬误的陷阱,还应在整体认识某一群体的基础上,用具体的眼光看待群体中的个体。虽说群体的特性可能适用于个体,但未经调查,切勿盲目地将群体的特性挪到个体上。毕竟,个体可能具有与群体相一致的特性,也可能具有与群体截然不同的特性。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。