医学心理学研究中比较经常采用的心理学研究方法有观察法、调查法、个案研究法、相关研究法和实验研究法等。
一、观察研究法与生理测量
(一)观察法
观察法是一种最基本的研究方法,各种研究都离不开对行为的观察。早在几十年以前,观察法就已经成为发展心理学家的主要研究方法。但在医学心理学文献中,主要依靠观察法搜集资料的研究报告,只是在近30年间才开始出现和增多。
作为一种独立的研究方法,观察法又称自然观察法,指在完全自然的或不加控制的条件下,对被观察者的可观察的行为进行有目的、有计划的观察和记录。这里的“可观察的行为”,指机体的外显行为或反应。例如,身体的姿势与动作、面部表情和言语活动等。通过某些生理、生化测量手段,机体的生理反应也可以成为可观察到的行为。人的思想、认识和情感是不能直接观察到的,可以借助于被研究者的自我观察和自我报告加以了解。医学心理学家实施观察研究的主要目的,是描述临床现象,监测行为变化并评定其临床意义。这种观察是在行为发生的当时、当地进行的,因此它(自然观察法)不同于晤谈法(interview)和问卷法。晤谈与问卷调查法主要依赖于被研究者对发生于它时、它地的与临床有关的行为的言语描述。
依研究者是否参与被观察者的活动,观察法可分为“参与性观察”和“非参与性观察”(participant observation and nonparticipant observation)。前者是指研究者或观察者直接参与,但不干预被观察者的活动。在后者,观察者作为一个局外人观察、记录被观察者的行动。不管在何种条件下,观察者都必须注意防止被观察者觉察到自己是被观察的对象,否则必将会影响他们的行为,导致错误或无效的观察。
观察能否得到可靠的资料,也取决于是否有适当的观察记录方案。在观察记录方案的选择与设计中,需要考虑下列因素。
第一,行为对观察者的可接近性。有些行为是易于看到的,如点燃一支香烟;有些是难以接近的,如家庭治疗期间两个家庭成员之间的窃窃私语。在一般情况下,如果这两种行为对研究者具同等意义,自然应当尽可能选前者作为观察记录的内容。
第二,有关行为发生的频度。低频度的行为在有限的观察时间内不易见到,而高频的行为易于见到,但可能会使观察者应接不暇。此时较可取的方法是“时间采样法”,即对同一有关行为作多次观察,每一次只作短时间的观察和记录。
第三,有关行为的关键的反应属性。任何行为都包含发生频度、持续时间和类型等属性,这些属性的相对意义或重要性随行为和欲研究的问题而不同。因此,要求事先确定所要观察的行为属性。对某些行为,频度是最重要的属性;而对另一些行为,潜伏期和持续时间可能比发生频度更为重要。
第四,搜集资料的目的。观察资料可用于描述的目的,也可能被用来确定函数关系,还可能被用来估价治疗和预防计划。如果是为了对一个或一组人的行为作一般性的描述,那么只注意其日常行为可能就足够了,而不必记录和分析其所有的反应。如果搜集资料的目的是要设计或估价一个治疗或干预计划,那么就必须对一种或几种靶行为细心地观察和分析。如果主要目的是确定行为的某些特点同环境中的决定因素间的函数关系,那么就需要反映有关前因和后果的多变量系统,为此,所采用的观察方案必须能足够敏锐地反映由环境变化所造成的行为表现上的差别。
第五,所需资料的广度。这里的广度包括所要评定的行为类型数目、所要观察的人数等。如果欲在一指定的时间间隔内简单地记录某种行为是否发生,那么简便的方法就是短时的时间抽样。
第六,研究者可以利用的人力、金钱和物力。为了搜集到更广泛、更可靠的资料,最好由几名观察者同时对同一样本的同一类行为进行观察,而后根据其一致性加以取舍与分析,以避免主观性错误和遗漏。如有资料贮存和加工的技术性支持,如录音、录像设备,则不仅可永久性地保存资料,而且也可反复观察,从中提取大量的有用资料。
观察法在个案研究、心理病理学研究中都有广泛的应用。采用观察法进行研究时,观察者应训练有素,善于根据观察的目的和要求抓住稍纵即逝的关键行为,且不致使观察结果受个人偏好、期待等主观因素的影响。
观察法的优点有:用途广,使用方便。此外,由于是在完全自然的条件下进行研究,所以由观察研究中可以得到许多基本的、较真实的资料。观察研究作为系统研究的第一步,可为以后的研究指出方向。
观察法的不足之处在于:其一,它不适于用来评定临床研究者常常更为感兴趣的病人内隐的认识评价、态度、思考和情感活动,如失望、焦虑和抑郁等;其二,某些行为的观察是不现实的、不可能的或不道德的,例如那些只在没有他人时发生的反应或行为(如手淫)以及怕为人知的行为(如低声的威胁和性行为);其三,观察到的行为可能是多种因素作用的结果,并常带有主观性和偶然性。因此,观察法一般难以准确地确定变量间的函数关系,尤其难以考察变量间因果关系的假设。最后,由于观察者不对影响行为的变量加以操纵和控制,故需要花费较长时间才能对所感兴趣的低频行为现象积累足够多次的观察,这在人力和时间上都是不经济的。
(二)生理测量
人体内伴随着情绪应激而发生的生理生化变化,虽然不能被直接观察到,但利用现代心理生理学手段和生物化学分析技术,可将这些变化变成“可观察的行为”。例如,目前手术中应用的先进的麻醉机可即刻显示出病人的心电、心率、血压、呼吸频率和血氧饱和度等多项生理指标的动态变化。就连心理治疗中所用的许多便携式生物反馈仪,也能让病人观察到自己有关生理指标的动态变化。这些情况说明,随着现代生物技术和生物工程学的发展,观察已不限于人和动物的外显行为,人体内的生理生化变化也可成为观察的内容。这便可为观察研究提供许多非常有价值的资料。这对于医学心理学研究格外重要。
将生理测量作为一种研究手段,是基于下述基本概念和假设。
1.刺激-反应的特异性 指特定的刺激会在大多数人身上引起同样型式或同样层次的生理反应。例如,将手浸入冰水中,几乎所有人的血压和心率都会升高。不同个体之间在这一“冷压试验”中的差别不大。少数人可能在个别方面表现出其独特性,这种独特性有时可能有其临床意义。例如,一组研究者在对250名受试者进行的长达23年的追踪研究中发现,手浸入冰水中后舒张压升高的人,发生冠心病的危险性显著升高。
2.行为型式-生理反应的特异性 指特定的行为型式会导致个体遇到刺激时产生某些普遍性的生理反应,即行为型式同生理反应之间有特异关系。例如,对新异刺激的定向反射,可在几乎所有个体身上引起以外周血流减少、脑血流增多为特点的普遍性的生理反应;对有害刺激的防御反应则表现为脑与外周血管收缩;“或战或逃反应”(fight or flight response)导致同交感-肾上腺髓质轴活动增强有关的十分广泛的生理变化(又称作“应急反应”,emergency reaction);而A型行为型式则可能导致同冠心病的形成和发展有关的生理变化。
3.症状的特异性 指个别反应的群体特异性。例如,高血压病人对所有刺激都倾向于作出血压进一步升高的反应,而类风湿关节炎患者则在受累关节附近的肌肉内显示较多的反应,消化性溃疡病人多以过多的胃酸作为他们的具代表性的特异反应。这种特异性可被用来解释为什么同样的环境压力或应激可在不同的个体身上引发出不同的心理生理障碍或疾病。
4.一般的激活或唤起水平 “激活”广义上指机体的一般状态,从深度的睡眠状态到另一个极端—极端的警觉。人的大脑功能状态、身体活动或外显行为以及自主神经紧张度等,都可反映激活水平。例如,在轻度原发性高血压病人中可以观察到,血压升高与交感神经系统的过度活动有直接关系,后者是此组病人的关键特征。一般的激活或唤起水平会影响人对刺激物的生理反应的强度,这提示:在关于生理反应水平和个体差异的研究中,一定要考虑到受试者原先的基线水平。
生理测量既可用于观察研究,又可广泛地用于医学心理学的实验研究中。生理测量的主要优点是:①测量装置可以自动观察、记录,不需实验者参与,因此是客观的、不受实验者偏向或期望影响的;②只要保证测量条件,生理仪器可以稳定地工作,所获数据可准确反映受测者体内的变化情况;③生理仪器可以持续监视,资料可再现,对变化趋势便于作数量化分析,如计算机叠加分析;④便于观察、记录同时发生的许多现象或事件,如环境条件的变化、生理变化和不断进行的活动,生理变化又可包括皮肤电、肌电、脑电、心电、眼动、血压和呼吸等。生理、生化测量在生理和心理的基本关系的研究中,以及在某些临床问题(如生理反应的随意控制、心理因素的致病机制)的研究中,都有巨大的应用价值。此外,心理生理学测量手段对于描述和区分意识的状态[如睡眠、梦、催眠、静默(meditation)]、特征和情绪性(emotionality),对于评定药物对人行为和生理反应的影响等,也都有应用潜力。
二、调查法与测验法
通过直接观察和借助于生理测量的间接观察,我们可以了解研究对象(人和动物)的外显行为和体内的生理变化。然而,医学心理学研究者和临床工作者更希望了解研究对象的内心体验或主观感受。这些发生于脑内的心理活动不可能被客观观察到,但可通过被研究者的自我观察或内省搜集资料获得。搜集内省或自我报告资料常用的方法是调查法和测量法。在本节内先简要介绍这两种研究方法,而后讨论自我报告评定法的一些方法学问题。
(一)调查法
调查法是借助于各种问卷、调查表和晤谈等了解人们的心理(如态度、意见、感受、行为方式、人格倾向)的一种研究方法。
调查法基本上是一种以研究对象的内省或自我报告为依据的间接搜集资料的方法,这一点使它不同于自然观察法。自然观察是以研究者对研究对象当时、当地发生的外显行为的直接观察为主要基础的。与自然观察法的一个类似之处是,调查是在自然进程中进行的,研究者不对研究对象和内容进行控制或操纵。后一点又有别于实验法,因此调查研究不能用来检验变量间的关系的性质。调查法的优点是使用方便,基本不受时间、空间限制,可在短期内获得大量资料,适用范围广泛。不足之处在于,调查所得到的自我报告资料只代表着被调查者愿意公开的部分,研究者虽然可以采取一些措施检验受调查者回答的诚实程度(如用两种方式询问同一个问题),但并不能保证他们真实地回答问题,从而可能会损害研究结果的真实性。
1.按取样特点分类
(1)普查:指对某一范围内所有的被研究对象无一遗漏地进行调查。例如,某医学院欲了解2006级入学新生心理障碍的患病率,便需对该校全体2006级新生进行调查。
(2)抽样调查:指从欲研究的总体中抽取一具有代表性的样本进行调查。例如,某研究者欲了解我国65岁以上老年人生活满意度,他或她不可能也不必要对全国的老年人进行普遍调查,只要按照一定的标准,从全国选出有代表性的样本进行调查,便可推断出总体的情况。抽样调查研究的成败,主要取决于样本的代表性。为了避免抽样偏差(sampling bias),宜采用随机抽样或分层抽样的方法。
(3)典型调查:指对某一范围内的少数典型对象进行调查。例如,对某校几名“三好”学生心理特征的调查,通过解剖“麻雀”,描述可能同他们成才有关的心理特征。“典型的”不一定是“有代表性的”,这几名学生可能不能代表所有“三好”学生,更不能代表全体学生。因此,典型调查一般不宜提出概括性的推论。
2.按获取资料的方式分类 可将调查分为问卷调查、晤谈调查和电话调查等。
(1)问卷调查:问卷调查指利用问卷来搜集资料的调查方法。问卷(questionnaire)是涉及某个主题的一系列书面问题,有些问卷可视为采用书面问答形式的一种纸笔测验。各种人格问卷或人格调查表,便是临床心理学家们经常使用的这类纸笔测验。例如,Hathaway 和Mckinley的“明尼苏达多项人格调查表”(MMPI)、Cattell的“16种人格因素”(16PF)、Eyssenck的“艾森克人格问卷”(EPQ)、Gough的“加利福尼亚心理调查表”(CPI)等,以及我国心理学者张伯源编制的“A型性格问卷”等,都属此类。此外,还有用于生活应激状况调查的各类生活事件量表,这些生活事件量表虽不称作“问卷”或“调查表”,但也是医学心理学家们经常使用的调查工具。类似地,许多评定量表也被用于调查研究中。采用这些心理测量工具的调查,同后边将要介绍的测验法已无严格的界限。
上述诸种心理测量工具既可用于调查研究,也可用于其他研究。问卷调查主要依靠受调查者的自我报告搜集资料,问卷编制的科学性、调查人员的客观性和被调查者回答的真实程度,在很大程度上决定了研究的信度与效度。
问卷调查开始前,研究者首先应依据调查目的选择或编制问卷和调查表,必要时还需要进行信度与效度检验。此外,还要训练调查人员,确定调查对象的选择原则与方法,以及统计分析资料的方法、步骤等。之后,便可依据事先规定的程序实施调查、资料分析和调查报告的撰写等工作。
(2)晤谈调查:晤谈调查是指通过调查者同被调查者面对面的谈话方式而进行的调查。例如,为了了解手术病人术前的心理反应,可以于术前会见病人,通过交谈了解病人的焦虑水平、应对方式和对手术的期待。这种面对面的调查,除了可收集到病人的自我报告资料外,还可以对病人的外显行为进行直接观察,从而可以弥补和验证病人的自我报告资料。会见或会谈法的缺点是需要研究者投入较多的人力和时间,有些被调查者可能不习惯于这种面对面的接触,从而反而搜集不到真实的资料。
晤谈(interviewing)是人与人之间的一种基本的沟通和联系的过程,是倾听与被倾听、观看与被观看、了解与被了解、发现与被发现的双向过程。晤谈应以信任和期望为基础,以保密为原则。晤谈既涉及复杂的技术,又是一门艺术,晤谈技能应当成为医学心理学工作者(特别是心理咨询师和心理治疗师)必须掌握的基本功。
晤谈按其目的,可分为诊断性晤谈、治疗性晤谈和以调查研究为目的的晤谈。按照其组织方式,晤谈又可分为结构式晤谈和非结构式晤谈。
结构式晤谈(structured interview)用同样的措辞和同样的顺序向每个被调查者询问同样的问题,调查者用统一的方法统计处理被调查者的回答。这种晤谈往往还辅以标准化的刺激情境,由调查者观察被调查者的反应,并按事先制定的标准分别给这些反应打分。例如,国外同行评定A型行为时便常采用此法(如詹金斯活动调查表,JAS),其准确性超过自我报告评定法。
结构式晤谈资料便于统计分析和数量化,从而也便于交流和比较,调查人员的主观影响相对较小,所得资料较客观。但它要求调查者完全按事先确定的计划进行交谈,过于主动询问,这会使调查变得死板、没有灵活性,使受调查者感到不自在,从而往往只能获得受调查者的被动、简单回答,难以取得深入的资料。
非结构式晤谈:指交谈双方以自然的方式进行交谈,它没有固定的问题和程序,调查者可以依据调查目的和受调查者的回答情况灵活地提问。这种晤谈可使受调查者不受拘束,不存戒心,从而可获得较为真实和深层的资料。非结构式晤谈的不足之处是有时不易把握重点和方向,顾此失彼;花费时间多;易受调查者主观因素(如兴趣、态度、偏见等)的影响;所得资料不便作数量化的分析和交流比较。
(3)电话与信函调查:电话和邮寄信函这两种调查方式的优点是不受地理位置和距离的限制,进行较大规模的调查研究。电话询问还可以从受调查者回答时的声调、语气和延迟等方面,获得一些额外的资料。通过邮寄问卷而进行调查,是一种颇为经济的调查方式,其缺点是不能保证受调查者按期寄回对问卷的回答,回收率低,会降低调查结果的代表性。
(二)测验法
测验法是利用标准化心理测验来测量和评定个体的能力、态度、性格、成就和心理(情绪)状态等心理特征的一种研究与诊断方法。它要求向受测者呈现某种一致的情境或问题,以搜集个体的自我报告或回答,而后按统一的标准确定受测者特定属性的数值或水平,并将它们同个体间的有关差别联系起来。
心理测验是在实验心理学基础上形成并发展起来的一种测量工具。标准化的心理测验有较高的信度与效度,并且经数次修订和数十年实际应用的考验,因此已成为医学心理学工作者手中最常用的研究手段。本书第九篇专门介绍一些常用的心理测验,包括我们在“问卷调查”中所提到的一些人格问卷和调查表。可见,心理测验也可用于调查研究中。
调查法和测验法,由于主要依靠被研究者的自我观察(内省)和自我报告,故又可合称为“自我报告(自陈)评定法”。下面专门讨论这两种方法共同的方法学问题。
(三)自我报告评定法的一些方法学问题
自我报告或自我观察是一种古老的心理学研究方法,其应用的历史据说可以追溯到苏格拉底(Socrates,公元前469—399)时代。心理学家冯特(Wundt,1832—1920)主张通过精确的实验以控制自我观察(内省)的条件,这就是所谓“实验内省法”。
医学心理学的自我报告评定研究法是以标准化的问卷或量表为基础的,它虽然不像实验法那样对变量加以操纵与控制,但也不像观察法那样消极地等待着被观察现象的出现,而是借助于晤谈、问卷和量表为研究者提供了一个集中地搜集、考察被研究者有关行为资料的机会。这在时间上、人力上无疑是比较经济的。此外,这种方法还可用于相关研究中,通过与其他变量的相关分析,可以较准确地、数量化地考察变量间的函数关系。
然而,也必须认识到,自我报告资料只代表着被研究者愿意公开的东西,不可避免地会受到其动机、愿望和防御机制的影响。因此,自我报告资料只是行为评定的一个方面的依据。科学研究不能唯一地基于自我报告,还需要得到其他行为评定方法所搜集到的资料的证实。
医学心理学家已经编制了成千上万种问卷、调查表和量表用来搜集自我报告资料,但许多人忽略了对这些工具的心理测量学考察,以致许多心理测量工具的信度与效度水平不能得到证实,造成十分混乱的局面。近20年来,医学(临床)心理学家们已开始重视这个问题,许多心理学家日益倾向于接受各种行为评定技术,拒绝采用除了Wechsler的智力量表、Halstead Reitan的神经心理学成套测验和少数人格调查表(或问卷,如MMPI)以外的传统的心理测验。此外,他们也常常采用问卷来帮助确定同各种疾病有关的具体的靶行为,确定靶行为同发生于其前后的控制刺激间的关系。较常用的有Holmes和Rahe(1967)的“社会再适应评定量表”、Spielberger等(1970)的“状态性-特质性焦虑调查表”、Zung(1965)的“抑郁量表”、Duncan等(1978)的“北卡莱罗那大学疼痛问卷”,以及A型行为量表。
下面集中地讨论自我报告评定中的一些方法学问题,包括工具的问题、实施的问题、解释的问题和证实的问题。
1.工具的问题 利用自我报告调查表的研究者希望能依所得资料评定和预见人们的行为。能否做到这一点,在很大程度上取决于问卷或测验量表能否完整地包含受测者的主要情况和受测者是否真实地回答。研究表明,自我报告调查表、问卷和量表,包括广为流行的MMPI在内,没有采取任何完善规定的程序以保证反应方式和情境的适当采样,也没有为各种测量工具系统地选择项目以代表各自预测内容的完整范围。也就是说,不能完整地概括受测者的有关情况。此外,许多问卷和调查表的信度和效度水平很低,或者没有提供信度与效度资料。Norman(1972)认为,“从严格的诊断学观点看,MMPI是个大杂烩;它原来的临床指标是时代的错误,它的基本临床量表是无效的、多余的,基本上是与它现在的目的无关的;它的测验方式是不灵活的……”其他心理学家,包括MMPI的编制者在内,也都对MMPI提出批评和感到不满意。Loevinger(1972)提出,“如果诊断是目的,为什么要设计一系列定量的量表?如果一系列的定量量表是目的,为什么要用一组诊断学名词作为记分的基础?”MMPI尚且受到如此严厉的批评,对其他的调查表、问卷和量表的批评就更多了。这说明我们必须慎重地看待自我报告调查所得到的资料。
另一方面,自我报告调查表和问卷也无法保证受测者真实地回答问题。例如,期望一个自愿当推销员的人对“我怕见生人”这样的项目回答“是”,这是不现实的。虽然许多调查表包含了“测谎”“效度”或“校正”量表,但都不能使受测者泄露那些不愿让人知道的东西。
2.实施的问题 这里所涉及的问题包括受试者的选择、测量工具的选择以及测量程序等。
受试者的选择自然应当根据所要研究的问题而定。如果欲描述或推断总体的特征,那么就应当从该总体中随机选取一组有代表性的人加以调查。有时候也可采取“极端组法”,即根据某一心理特点加以选择,只选那些得极高分或极低分的人。极端组法最常用于关于人格与心理治疗相互作用的研究中。受试者选择中的另一个问题是选多少人的问题。样本太小,可能没有代表性;样本太大,又浪费人力、物力。这个问题可以通过分析研究具体对象、类型、要求和条件等确定。
当要对某种心理特质进行测量时,可能有多种量表可供使用,这就涉及到测量工具的选择问题。例如,假如一位研究者要测量“乐群性”(sociability),那么他至少可以选择Gough的“加利福尼亚人格调查表”(CPI)的乐群性量表、Cattell的“十六种人格因素问卷”(16PF)的第一因素—乐群性量表和MMPI的社会内向量表。选择的基本根据是它们各自的信度和效度水平,应尽量选用信度和效度水平较高的工具。还有一个问题是单独抽出一个有关的量表,还是将整个调查表都交给受测者?单用显然较省时、省力。然而一些调查表明,单用MMPI中的一个量表和将550个项目全交给受测者施测时,在这个量表上的记分是有较大差别的。
3.解释的问题 如何解释自我报告调查所得到的结果?一些研究者于调查前没有明确的假设,调查设计不合理,以致可能将解释当作一门艺术,将“井蛙之见”任意扩展。
据美国的一项研究,在1939—1960年间,美国曾有4项研究专门探讨了白人和黑人在MMPI测量中得分的差别。这4个研究得到了一致的结果:在Sc 和 Ma两个量表上,黑人的平均得分都显著高于白人。一些研究者将这一研究结果解释为,黑人行为古怪、躁动、外化,有精神分裂的倾向。然而,最近40年来的进一步研究表明,上述解释是错误的。因为那种解释忽略了这两个不同种族在社会、文化、经济、教育,乃至宗教和信仰上的差别的影响。
又如,按照权威的解释,MMPI的Ma量表本来是用来识别精神病人心境高涨,言语、行动快、不稳定,观念飘忽和短时抑郁症状的。不管是病人,还是正常人,Ma分升高便意味着精力旺盛、健谈、想像力丰富、有攻击(进取)性和兴趣广泛。可是,在对具体人作出解释时,如果忽略其年龄、种族和教育程度等因素对Ma分的影响,就会出错误。例如,年轻人和受教育较多的人得分便较高。因此,我们必须将测量结果视作多种因素相互作用的结果,充分考虑到各种替代性的解释,才不致得出错误的推论。
4.证实的问题 不少研究往往在得到结果、写出报告后即告结束。然而从方法学的角度看,这远远不够。调查结果可靠吗?所得结论恰当吗?要回答这些问题,必须通过重复的研究加以证实。重复的调查可能支持原调查的结果,也可能发现其错误。无论是肯定的结果,还是否定的结果,都是有意义的。肯定的结果有助于证实自我报告的信度,并为其效度的研究奠定基础;否定的结果则可为问卷、调查表和测验的修订,以及调查设计的完善化提供资料和依据。由于这类调查工作往往需要大量受试者,工作量大、花费时间多,因此证实的问题往往被人们忽略了。在自我报告调查领域内,国外有不少人热衷于编制新的问卷、调查表和量表,而不注意通过重复的调查研究来证实它们的信度和效度。这种不良倾向已经带来了很不利的影响,因此应引起我们的警惕。
三、个案研究法
在临床工作中,常常要求确定,进而解除病人的具体的心理问题。可是,对于同一心理社会性刺激,不同的人可以有很不同的心理反应。即使产生同样的心理问题,不同病人也可有不同的根源、表现形式、应对或防御方式。因此需要采用不尽相同的方法或措施予以解除,并从不尽相同的角度对干预效果予以评定。这些问题,可以采用个案研究法进行研究。
对某现象的一个特例进行广泛深入的研究,这种研究法称作个案研究法(case study method)。
个案研究的对象可以是一个个体,也可以是一个家庭、班组、学校和社区,甚至可以是一个事件或情境。个案研究是相对于样本研究而言的,个案研究同样本研究的区别是:①样本研究的研究对象必须有代表性,是可选择的;而个案研究不强调代表性,研究对象是无选择的。②就研究的时间特点而言,样本研究可以是横断的,也可以是纵向研究;而个案研究多为纵向的、前瞻性研究。③样本研究试图由样本结果推断或概括出总体特征或一般规律,是一个从个别到一般的过程;而个案研究则着重于对研究对象本身的分析,并进行科学的抽象。
在医学心理学领域内,个案法主要被用来了解和帮助有心理问题的来访者和患有心理障碍的病人。为此,可调查他们各自的病史和生活史,包括童年、家庭和心理社会发展经历,婚恋、工作和近期的生活变故,以及性格特点与应付方式等。还要了解他们各自的症状、体征和对个人疾患的认识等。在此基础上,分别为每一个案作出诊断,设计治疗方案和进行治疗,并对治疗效果进行评估。如果能积累足够多的个案研究资料,且每个个案资料都是充分可靠的,那么也可在此基础上进行适当的概括,总结出经验来。
此外,医学心理学家和医学家也可从个案研究中获得假设,以便作进一步的研究。许多新发现的疾病的诊断标准与治疗方法,往往是先从个案研究开始探索,由个案研究获得初步意见后,再通过其他研究方法予以验证、补充或修改。传统的个案研究法以个案史的回顾性调查为主,但实际上,个案法也可用于前瞻性研究中,这种应用目前已经成为个案研究的主流。研究者可以按事先拟定的计划,对某一个体或一组个案长期追踪观察,定期地进行测量、记录,而后将这些测量结果同其未来的身心健康状况联系起来。这种前瞻性的个案研究,可用来观察疾病的发展变化过程。例如,行为主义心理学家华生(Watson, J.B.)通过对一个11个月大的小男孩的个案研究,推测恐惧症的习得过程。在个案研究中也可采用实验法。个案实验法是个案史式的个案研究法的发展,它具有实验法的严谨性质,常用于对治疗效果的个体化测量与评价的研究(参见本书第56章)。为了得到多方面的资料以资鉴别,在个案研究中应采取多种方法搜集资料。除了自然观察外、调查法和测验法,甚至不太复杂的实验法,都可应用。自然,客观性与无偏向性对个案研究是至关重要的。
个案研究者往往希望通过研究一个个案,从中推出有关现象的一般性原则。然而,个案研究同观察研究类似,一般并不具有这种功能。对某一病人有效的心理治疗方法,不一定对患有同一心理障碍的所有病人都有效。因此,切忌仅凭个案研究而不适当地推断因果关系或提出概括性的推论。
四、相关研究法
相关研究法(correlational study method)是考察两个变量是否有联系(共变关系)的一种研究方法。相关研究在医学心理学研究中占有相当大的比例,值得给予较充分的讨论。
从确定变量间关系的效能看,相关研究法介于观察法与实验法之间。相关研究法与实验法的不同之处在于,前者所观察的是两个自然发生的变量间的关系;而在实验法中,研究者系统地变化其中的一个变量,控制所有其他因素,而后观察这种变化对其他变量的影响。例如,对脑与行为关系感兴趣的研究者,可能以脑外伤病人为对象进行研究,发现某一脑区受损同某种行为变异有联系。这种研究属相关研究。因为在这里,脑损伤和行为变异都是“自然发生的”,而不是研究者“操纵的”。如果研究者换一种方法,有计划地毁损动物脑的某一部位,以观察动物行为的变化,那么他现在所用的研究方法便是实验法了。相关研究的结果通常采用相关统计法来分析。相关研究至少可获得两列变量值,它们之间的相关系数,便是对这两个变量间相关关系的测量。相关系数r的数值范围在–1~+1之间。若–1<r<0,为负相关,意味着两列变量值的变化方向相反;如果0<r<1,为正相关,意味着两列变量的变动方向相同;若r=0,为零相关,意味着两个变量完全没有关系。r=1或r=–1,则为完全相关。r的绝对值越是接近1,则由一个变量值预测另一个变量值的准确性便越高;反之,预测的准确性越低。
2个变量间有相关关系,意味着当其中一个变量的值改变时,另一个变量的值也发生某种变化,但这不意味着一个“引起”另一个。也就是说,相关关系不等于因果关系。相关关系只表示两个变量一起变化,即共变关系,至于造成变化的原因,相关研究一般不能回答。因为两个变量也可能只是伴生的,它们的变化可能都是第三个未知变量所致。例如,调查发现,某地区中暑病人的比例同柏油路面的柔软程度呈正的相关关系:路面越软,中暑的人越多。在这种情况下,我们自然不会认为这两者之间有因果关系。因为它们都与第三个因素—气温过高有关。气温过高既造成路面变软,又导致中暑人数的增多。这种相关所代表的是变量间的伪关系(spurious relationship)。
此外,还有一种情况是,由一个中介变量导致两个变量间的相关,即变量X导致变量Z(中介变量),变量Z又导致变量Y,从而使得X同Y相关,而实际上X同Y间没有直接关系。
即使假定两个变量间有因果关系,仅凭相关研究有时也难以确定何者为因,何者为果。例如,一项研究考察了对各种犯罪的刑罚的严重程度同相应犯罪的发生率之间的关系。结果发现,刑罚越重,相应犯罪越少见。由此人们得出结论,严厉的刑罚,包括死刑,可以减少犯罪。这个相关研究不适当地得出因果关系的推论。之所以不适当,是因为对这一研究结果还可以做其他解释。例如,也可以将两者间的关系颠倒一下:以犯罪稀少为因,以严惩为果—正是某种犯罪罕见,才引起严惩。社会心理学研究发现,如果在一个地区某种犯罪罕见,法官和陪审团会将它看得特别严重,从而会给罪犯格外严厉的惩罚。这一研究似乎支持了“因果颠倒”的设想。
相关研究和实验研究是相辅相成的两类重要研究,通过对一系列变量的测量,相关研究可考察这些变量之间的相互关联的方向及程度,并可从一个或几个已知变量预测另一变量。相关研究虽然不能直接得出因果推论,但研究者可将所得的相关模式与已有的因果模式相比较,从中获得有价值的参考信息。此外,相关研究不要求对变量实施控制或操纵,允许研究者在更大范围内确定研究的变量或变量水平,也不要求随机分派被研究者。这些优点都使相关研究法成为很有价值的研究方法。现在,已经探索出一些方法,允许研究者小心地由相关研究中作出因果关系的推论,如用于纵向相关研究的“交叉延迟法”、偏相关技术,以及变量特性分析等。
五、实验研究法
在严格控制的条件下,实验者系统地操纵或改变一个或几个变量(称“自变量”),观察、测量和记录其他变量(称“因变量”)的伴随变化,以考察它们之间的关系。这种研究方法,称作实验研究法。
实验研究法是科学研究中应用最广,最适合用来检验变量之间因果关系的一种研究方法。
(一)实验研究的程序
实验研究的程序包括提出问题和假设,确定操纵策略和控制方法,实施实验,对结果进行整理与统计分析,以及提出推论等。这里只讨论其中的几个关键的问题。
1.提出假设 假设是对行为的试验性的解释,它试图回答“如何”和“为什么”这样的问题。假设是发现的结果,而发现是一种创造过程。从科学的角度看,所提出的假设必须有理论或实践(包括已有研究)依据,并且是可以检验的,否则是无用的。
2.给出操作定义 必须为假设中所包含的概念确定操作定义,即用可观察、可测量的“操作”来加以限定。例如,依据抑郁量表的得分来操作地定义抑郁:得分很低,意味着无抑郁;得分很高,意味着严重抑郁。如此,便可以保证研究者们能够同样地理解抑郁的含义,并能够进行学术交流和讨论。
3.确定控制方法
(1)确定自变量、因变量和控制技术:自变量(independent variable)是由实验者操纵以测量其影响的变量或因素;因变量(dependent variable)是被假定会受到自变量的操纵的影响的因素,是实验者要测量的东西(通常是受试者行为上的某种变化)。
在实验研究中,通常采用3种控制技术:操纵、保持条件恒定和平衡。
(2)消除期待效应:在心理实验中,实验者和受试者都可能期待实验获得某种结果,这种期待有可能相应地影响他们的行为,从而便有可能使实验结果向着所期待的方向变化。这种现象被称作“期待效应”,是必须尽可能设法减少和消除的。
控制期待效应,主要有两种方法。一种是设安慰剂对照组,这种控制方法可以用来估价药物和各种心理疗法的治疗后果(包括有效性和不良反应等)。在药物疗效的评价研究中,对照组接受的“安慰剂”是没有药物活性的糖丸;而在心理疗法的疗效评价中,对照组所能接受的可能只是实验者的注意(注意-安慰剂对照组)。控制期待效应的另一种常用的方法是采用双盲(double-blind)法,使观测者和受试者都不知道受试者受到什么处置。心理治疗研究难以实施完全的双盲控制,应当由“盲目的”观测者来观察、测量和记录病人治疗前后的有关变化。
4.统计推理 实验研究的一个重要目的是基于对具体样本的研究提出关于总体的一般性的推论,这个目的要靠统计推理来实现。统计推理从接受一个虚无假设开始,即假设自变量没有影响,而后采用概率论来确定:假如虚无假设是正确的,获得本实验结果的可能性。如果这个可能性小于5%,则拒绝虚无假设,断定自变量有显著影响。如果研究结果不能证实假设,研究者便可能对假设所依据的理论加以修正,从而形成新的假设和进行新的研究。
在使用统计推理时,要避免误用,要注意使用它的前提条件。此外,统计显著性不一定有临床意义,这一点在前面已经说明。
(二)实验设计
医学心理学的实验研究设计,可以分成三大类:前实验设计(preexperimental designs)、准实验设计(quasi-experimental designs)和真实验设计(true experimental designs)。就因果关系推论的效度而言,准实验研究高于前实验研究,而真实验研究又高于准实验研究。
1.前实验设计 在医学心理学研究中,最广泛采用的前实验设计是不设对照组(控制组)的“前测-操纵-后测”(pretest-manipulation-posttest)式的设计。在这里,只有一组受试者,他们在接受某种操纵(例如某种心理治疗)之前和之后各做一次测试。如果发现两次测试的结果有显著的差别,人们便可能会将这种差别归因于实验操纵的影响(例如作出该心理疗法有效的推论)。然而,这种因果关系推理的效度要受到下列因素的威胁:受试者的测试经验、再测验所造成的改进、测验动机、受试者的流失、向上的统计回归(例如病情的自然恢复)、受试者的选择与处理间的相互作用,以及其他没有得到控制的因素。
目前,在心理治疗、药物治疗和心理病理学的研究中偶尔还可以见到前实验设计。前实验研究实际上不能算作真正的实验研究,也不能用来检验变量间是否存在着因果关系。这类研究的价值是十分有限的。
2.准实验设计 准实验设计是指那些未能满足真实验设计的严格要求的操控设计。这类设计容许提出某些因果关系的推理,但是其效度较真实验设计要低。典型的准实验设计包含对照组,但对照组与实验组在某些有关的方面不完全相当或匹配。之所以不相当或不匹配,往往是由于实验组可以接受的受试者有限。其结果是,实验操纵会同受试者的某些属性相混淆。
在医学心理学的临床研究中,最经常见到的准实验设计是给予在一个或几个方面不同的两组(或几组)受试者同一实验操纵,而后比较其影响。例如,随机选取两组受试者,一组为患有某种心理障碍的病人,另一组由没有心理障碍的人组成。然而,这么做并不能保证这两个样本除了病理情况以外其他方面都是相当的。而且,实验操纵可能与在每一总体中的受试者的选择相互作用,引起样本内、样本间的混淆。其结果是,会严重损害关于病理情况对实验操纵影响的各种推理的效度或真实性。
医学心理学常用的准实验设计有:不相当的独立组设计、匹配组设计和时间序列设计(time series designs)。
3.真实验设计 真实验设计不仅要求设立对照组,而且要求对照组同实验组相当或具有完全的可比性。也就是说,除了被作为自变量而加以操纵的因素以外,在所有同因变量有关的方面,实验组和对照组都相当。这一点被看作是真实验研究的绝对必要条件。由于两组相当,所以可以有把握地将两组间在因变量测量中得到的不同结果归因于实验操纵。在所有各类研究中,真实验研究是最能有效地检验变量间的因果关系的一类研究。
判断一个实验设计是真实验设计还是准实验设计,主要看受试者是如何选择和分派的。因为选择和分派的方法在很大程度上决定了实验组和对照组的相当程度。大多数可以接受的真实验设计方法,要求随机地选择和分派受试者。对于随机化来说,没有完全适当的取代办法。然而,由于伦理上的考虑和受试者的限制,以及其他原因,有时难以做到随机化。自然,随机化仅仅是对大多数真实验的基本要求,而不是唯一的要求。在某些情况下,即使完美的随机化也不能抵消由于实验操纵而引入的混淆因素的影响。
医学心理学研究中较常采用的真实验设计有独立组设计、随机化的区组设计和平衡的重复测量设计。
尽管从检验变量间的因果关系的效度上看,真实验研究最为有利。但在许多情景下,随机分派是不可能的。何况,临床研究所关注的往往是病人的现有的属性,如当前的疾病体征和症状。因此,在医学心理学的临床实验研究中,还是以准实验设计为主。
(三)模拟实验与动物模型
1.模拟实验 通过设计一个类似于真实生活的实验情境以考察心理病理如何发生和消除,这种研究策略称作模拟实验研究。
例如,行为心理学的创立者之一华生所作的“小艾伯特实验”,便是一个个案模拟实验研究,是在实验室条件下在人类受试者身上诱发心理病理的第一次尝试。该实验证明,自然发生的恐惧症可以通过应答式条件作用的过程习得,也可以通过“废学”机制消除之。Hiroto和 Seligman(1975)利用大学生所做的一个模拟实验表明,“无助”(helplessness)可以经由模拟实验而获得。由此,人们已经提出了一个关于抑郁症的“习得性无助理论”。
模拟实验具有高的内效度,从而允许识别变量间是否有因果关系。此外,研究者可以在人工模拟的实验情境中检验那些不能用病人来操纵的变量。模拟实验的局限性在于,在伦理允许的范围内,在模拟实验中能够诱发出来的心理变化的类别有限,同实际的精神障碍可能不具有类似性或可比性。
2.动物模型 利用动物模拟实验来研究心理病理现象具有下列优点:第一,研究者不仅可以更加直接地模拟自然发生的严重事件,而且可以对动物受试的发育史和遗传因素获得几乎完全的控制,从而便可以尽可能地排除对于动物行为变化的多种解释。第二,有些不允许在人类受试者身上进行的操作,可以在动物身上做。第三,由于许多实验动物比人发育更快、生命更短,因此有利于在较短的时间内评估病理变化的长期后果和治疗的长远效果。目前,心理病理学家已经建立了关于药物依赖和焦虑症等心理障碍的动物模型。
动物模拟研究需要注意的一个问题是,不能简单地由动物研究的结果推想人的情况。此外,不可能将人类所有的心理病理变化都在动物身上诱发出来,更何况动物实验也会引起伦理问题。
(四)单一个案实验研究
单一个案实验(single-case experiment)是以单一受试者为对象的实验研究。实验的一般程序包括观察阶段(基线阶段)以及干预和估价阶段。在基线阶段,实验者的主要工作是观测和记录受试者在干预前的行为基线,以便对受试者的问题行为的严重程度作出评估。在干预和估价阶段,实验者引入某种处理或治疗,并对其影响进行评估。单一个案实验最常被行为治疗家用来估价行为治疗的后果(有效性和不良结果)。
单一个案实验有两种常用的设计:ABAB设计和多基线设计。
1.ABAB设计 在ABAB设计中,实验的次序是:基线阶段(A)→治疗阶段(B)→基线阶段(A)→治疗阶段(B)。如果在第一个治疗阶段受试者的问题行为较基线阶段有了改善后,在第二个基线阶段又回复到治疗前的基线水平,最后,在第二个治疗阶段问题行为又有了明显的改善,那么便可以推断:这种治疗造成了受试者行为的改善。
2.多基线设计 多基线设计(multiple-baseline design)的特点是同样的处理或治疗被相继指向几个目标。例如几个人,同一个受试者的几种行为,或者同一种行为在几种情境的变式。当这种设计被用于几个(例如3个)受试者的时候,几个受试者要同时进入基线阶段,实验者要依次为每一个受试者确定有关行为的基线值,并依次对第一个、第二个、第三个受试者进行治疗。如果在治疗引入后,受试者的有关行为立即有明显改善,便可以认为是治疗性干预所致。
(梁宝勇)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。