二、IAT预测:美国总统大选
IAT是格林沃德等人于1998年研制出来的一种基于计算机程序的、测量个体内隐社会认知的技术。在十多年的发展时间里,IAT就以其多方面的优点,成为内隐社会认知研究领域应用最为广泛的研究工具。
2008年,格林沃德领导的研究小组用这一技术正确预测了美国大选结果。虽然初选结果显示,奥巴马的选民支持率要低4%,但格林沃德等人认为,民意调查事实上反映的是人们的外显态度,填写自陈式问卷的人们错误地高估了种族偏见的影响力,从印象管理的角度篡改了自己的真实态度,而在格林沃德的实验室里,他的研究小组通过IAT测量对美国大选的结果进行预测,发现人们对奥巴马的真实支持率要高3个到4个百分比,而最终的大选结果确实和格林沃德的测量结果保持了一致。格林沃德解释为什么自己能够成功预测大选的结果,是因为在IAT测量中,人们内心的真实态度暴露得一清二楚。
而这次成功的预测,也将IAT测量的影响力从研究界扩展到普通民众,成为当代认知心理学最引人瞩目的技术范式之一。作为一种用计算机程序对人们反应时进行测量的方法,IAT的研究逻辑是,当人们看到与自己内心真实态度相一致的联系,比如老人与智慧,花朵与美好,做其他简单判断时,反应速度会更快,反应时更短;相反,对与人们真实态度不一致的联系,比如军人与柔弱,花朵与丑陋,人们做判断的反应速度会明显慢一拍,反应时也会更长。
大量研究结果证实了格林沃德的研究逻辑,即内隐的真实态度能大大缩短人们反应时。在最初的一项IAT实验中,格林沃德等人在显示器上呈现目标概念——花(郁金香等)或昆虫(蜘蛛等)的名字或图片,以及属性概念——积极的词(爱等)和消极的词(丑等)。要求被试通过按不同的键来对属性概念的词性进行分类。研究前期的准备发现,花与积极的词,昆虫与消极的词,在被试的头脑中有较强的联系。因此,当研究者把花与积极的词安排在一个键上,昆虫与消极的词安排在另一个键上的时候,被试的反应会比较快,因为这样的安排与被试记忆中的联结相一致。当研究者的安排与记忆中的联结不相容的时候,如昆虫与积极的词安排在一起,花与消极的词安排在一起时,被试的反应就会较慢。
图7-4 IAT种族内隐刻板印象实验示意图
同时为了防止顺序效应的干扰,IAT测试会通过电脑程序设计的不同阶段任务,变化这些目标—属性概念组合的出现次序。早期的IAT测验共包含5个任务。2002年,格林沃德对IAT程序进行了标准化改进。
如图7-5所示,改进后的测验共分7个阶段,我们以种族内隐态度为例进行简单的说明:
阶段一:呈现目标图片,比如白人图片和黑人图片,让被试归类并做出一定的反应(看到白人图片击左边绿键F,看到黑人图片击右边红键J)。
图7-5 IAT实验的通常程序
阶段二:呈现属性词,比如愉快和不愉快,并让被试做出反应(看到愉快击左键F,看到不愉快击右键J)。
阶段三:联合呈现靶词和属性词,让被试做出反应(看到白人和愉快时击左键F,看到黑人和不愉快时击右键J)。
阶段四:重复阶段三。
阶段五:让被试对靶子词做相反的判断(也就是说看到白人图片击右键J,看到黑人图片击左键F)。
阶段六:再次联合呈现靶子词和属性词,让被试做出反应(看到黑人和愉快时击左键F,看到白人和不愉快时击右键J)。
阶段七:重复阶段六。计算机会记录下从呈现刺激材料到被试按键反应之间的时间间隔,同时记录被试反应的正误情况。在上述七个阶段中,第四阶段和第七阶段为兼容和不兼容正式测验部分,需进行40次按键反应。其余各阶段分别做20次,是对第四阶段和第七阶段的练习。
在数据处理上,最初的IAT测验主要采取以下的步骤。首先,去掉反应时大于3 000毫秒或小于300毫秒的被试以及错误率超过20%的被试。因为反应时太长意味着被试明显受到干扰,反应时太短意味着被试明显抢答;错误率超过20%意味着被试任意回答。然后,为了使数据有满意的方差稳定性(Stabi1ity of variance),对所有的反应时进行对数转换,以便于作进一步的分析。接着,把不兼容部分的对数转换值与兼容部分的相减,得到的值就是IAT分数。这种数据处理方法在一定程度上受到了研究者们的质疑。格林沃德也承认传统的记分方法缺少有力的理论支撑,为此格林沃德等人于2003年对IAT的记分方法进行了改进,在综合比较了对数转换、中位数、平均数、倒数和D转换几种方法之后,发现纠错式D值(D_biep)的效果最好。为了便于进一步的推广,格林沃德很快将上述数据转换做成了标准化的程序,和IAT程序设计专业软件Inquisit一起,放在IAT专门网站上,供研究者和学生免费下载、改写后使用。
此外,研究者也不断对IAT程序本身进行完善。针对标准IAT程序不擅长测量单一概念的不足,学者提出了若干种IAT测验的变化程序,如WIAT(Wigbo1dus IAT)、GNAT(Go/NO-Go Association Test)和EAST(Extrinsic Affect Simon Task)。其中,WIAT是Wigbo1dus对IAT的一种改进,他在IAT任务中提供一个目标概念和两个属性概念。比如,第一个任务,要求被试看到积极的词和与伊斯兰信仰有关的词(如古兰经)时按左键,看到消极的词时按右键。第二个任务,要求被试看到积极的词时按左键,看到消极的词和与伊斯兰信仰有关的词时按右键。如果被试在第一个任务上做得好,说明对伊斯兰信仰有积极的态度,反之亦然。他发现,WIAT结果与被试的自我汇报正相关。后来其他学者用这种方法研究被试对不同食物的态度,发现WIAT研究结果与被试的行为一致。这说明WIAT在态度和行为预测上都具有相当的信效度。
虽然今天的IAT测量已经发展到相当精细化的技术,但仍旧会存在缺陷与不足。如吴明证2006年在研究中指出,IAT测量特别需要注重样例的选取。当比较的方向相容时,会加强IAT,否则会抵消IAT效应,因此特别需要注意IAT的顺序控制。周广亚2005年还提到IAT实验存在无法对复杂概念进行分析、图片效应不足等缺陷。此外,正如样例表征模型提到的,在实验中也需要区分清楚样例代表的是哪一个层次的概念。二级概念(如黑人教授)与一级概念(黑人)代表的概念不同,激活的表征样例不同时,有可能产生实验误差。因此,在正式实验开始之间,需要对IAT涉及的概念、词语样例、目标图片和实验程序进行明确界定。
但这些缺陷其实和IAT技术没有很好地与传统刻板印象测量相结合有关。如果能够把外显测量与内隐测量有效结合,有可能克服IAT测验过概括化的问题,而且也有助于对刻板印象的结构进行更深入的讨论和分析。
本章下一节将采用IAT方法对独生子女刻板印象的自动化过程进行初步的探索,分析中词语样例的选择基于前期形容词问卷调查的结果,一方面注意区分独生子女家庭—独生子女本人以及独生子—独生女等二级概念的不同,另一方面也注重不同研究技术得到的结论之间的相互支持和印证。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。