研究方案设计是整个研究工作的计划和安排,是科学研究中的关键环节。它是否科学、合理,不仅直接影响到研究的进程,而且还影响到结论的可靠性和科学性。研究方案设计要明确研究目的、对象(总体)和单位、项目、方法、时间和组织实施计划等。
一、研究的种类
科学研究是对观察到的现象可能存在的某种联系提出假设,并进行系统的、受控的、实证性的、批判性的调查研究。按研究对象的范围可分为:全面研究和非全面研究(重点研究、典型研究、抽样研究)。传媒心理学研究一般是非全面研究,质化研究为典型研究,定量研究大多为抽样研究。
典型研究是从研究总体中有意识地挑选出少数具有代表性(好或坏、先进或落后)的对象进行研究,以达到了解总体的特征和本质的方法。典型研究要搜集大量的第一手资料,搞清所研究典型各方面的情况,作系统、细致的解剖,从中得出有启发性的结论。典型研究的优点是:鲜明的目的性和应用性,有利于假设的提出;节省人力、物力。缺点是:无法用概率原理去推断总体的数值及其可靠程度;典型的选择十分不易;研究者的主观作用和被试的迎合性都会对典型研究产生不利的影响。
抽样研究是在总体单位中按照随机原则抽取一定数量的样本进行研究,根据样本结果推断总体。若不按随机原则抽取,抽取的数量不够多,就不能推断总体。在下面介绍的方法中,只有概率抽样才能推断总体,非概率抽样不能推断总体。
二、概率抽样研究
(一)抽样研究的基本原则
抽样方案设计的基本原则是:首先,保证随机性原则的实现,即总体中的每个单位有同等的中选机会,或中选的概率已知。这种同等的中选机会或已知的概率不能人为破坏。其次,保证实现最大抽样效果的原则,即用最小的费用取得足够准确的数据。
(二)常见的概率抽样方法
比较常见的概率抽样有以下五种方法。复杂的研究一般使用多阶段抽样,不同阶段又可用不同的抽样方法。
1.简单随机抽样(SRS:simple random sampling)
又叫纯随机抽样,对总体不作任何处理,是最简单、最基本的方法。它要求每个单位都有同等被抽中的机会。
直接抽选:如果总体规模不大,可以将总体中的每个单位都写在纸上,放在箱子里,伸手随机摸取。现在电视台的有奖知识竞赛就采取这种方法。
随机数码:Excel中函数rand(),产生0—1之间的平均分布随机数;产生的随机数不重复。Randbetween(bottom,top),产生top—bottom之间随机整数;产生的随机数可能重复。
2.分层抽样(stratified sampling)
又叫类型抽样、分类抽样。先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本。主要目的是减少抽样误差,提高抽样调查的精确度,通过分类使组间变化大,组内变化小。这里的关键是分层指标的选取。分层指标的选择应考虑:(1)分层指标应同研究的主要目标密切相关,指标个数尽量少。(2)分层应满足同一层的元素具有较好的同质性,不同层的元素具有明显的异质性。(3)对总体的分层和层内抽样都易于操作和管理。
3.机械抽样
又称为系统抽样法(systematic sampling)或等距抽样法。对研究的总体单位按一定顺序排列,每隔一定的间隔抽取一个样本。这种方法适合于大规模调查,比较简单快捷,在实施中不需要严格的抽样框(准确的地址、名单等),只要有一个抽样单元的顺序即可。步骤是将全部个案排队,每隔一定间隔抽取一个或若干个样本。
4.整群抽样法(cluster sampling)
又称集体抽样法。将总体分为若干群,抽取几个群作为样本,对选中群的所有单位进行全面研究的抽样方法。其特点是组织方便,节约经费,但精确度低。应用条件是群间差异小,群内差异大。
5.多段抽样法(multi-stage sampling)
一般分两三个阶段,最多分四个阶段,每段作随机抽样。这是受众调查中最常用的方法,在不同的阶段结合采用上述抽样法,但因经过多个阶段才能最后抽出样本,抽样误差会大一些。
(三)样本的大小
一项研究需要抽取多少样本,是抽样研究面临的重要问题。许多人认为,样本越多越好。但科学研究却表明,当样本增大到一定规模以后,更多的样本对提高研究准确性的作用不显著;同时,当样本太大时,除耗费人、财、物等资源外,容易增加统计决策错误的可能性,因此研究者不主张运用过大的样本。
样本量的大小取决于许多因素,其中重要的有三种因素。首先是研究的准确性,要求的准确性高,样本量就大。其次是总体的差异性,总体之间各个单位差异大,不仅样本量要大,跟抽样的具体方法也很有关系。如群间差异大,整群抽样就不宜采用。
样本量的多少由可靠程度和精确度要求、总体标志的变异程度、抽样的方法、人力和财力决定。样本量的计算可参阅抽样调查的有关书籍。
三、非概率抽样研究
非概率抽样不能对总体进行估计和推断。常用方法有:
方便抽样:从便利的角度抽取样本,如在报刊、杂志、网络上刊登调查问卷,由读者、网民自愿填写后反馈给研究者;访问售报亭买报的读者;利用读者、听众来信获取受众名单抽取样本等。
判断抽样:根据研究者个人经验和判断抽取样本。在多级抽样的第一级抽样中使用较多。如在研究新媒体(网络、手机等)的游戏功能时,研究者可根据自己的经验选择几所高校、研究单位、合资公司和政府部门,从每个机构中抽取调查对象。
配额抽样:根据经验按类分配样本数。1998年,英国电影学会实施了一项题为《电视生活中的一天》的调查研究。在该研究中,通过新闻和电视广告、海报和传单征集的22000名英国观众,写下了某一天(11月1日)观看电视的日记(方便抽样)。3年后,英国电影学会以原来被试的一部分作为样本,进行一项为期5年的受众跟踪研究,在其间被试要完成一些“问卷日记”。岗特莱特与希尔(Gauntlett&Hill,1999)在对数据的分析中,描述了跟踪研究的这些样本是如何决定的。首先,征集的被试包括各个不同年龄组,以使样本能够反映英国人口的年龄分布。其次,在同样的基础上选用来自不同家庭类型的被试(确保单人家庭、两个成人/两个孩子的家庭等都有代表)。第三,男女被试的人数大致相等。
滚雪球抽样:适用于调查对象十分稀少或难于接触的情况。先随机地抽取少量调查对象,调查后,再请他们提供一些类似的研究对象,类推。如接受高档美容的女性,高尔夫球爱好者,同性恋等。
四、变量及其分类
变量是说明现象某种特征的概念。传媒心理学研究中涉及许多变量,有的容易被测量,如性别、年龄等,有的很难被测量,如人格、态度、暴力等。
变量由变量名和变量值组成。变量名就是变量称呼,变量值是变量的具体表现,“性别”是变量名,“男”或“女”就是变量值。测量变量值是最基础也是最重要的研究工作。
变量有许多分类方法。变量按其取值是否连续分为离散变量和连续变量,按其受因素影响的不同分为确定性变量和随机性变量,按其关系分为自变量和因变量。
美国心理学家史蒂文斯(Stevens,1961)按变量值的性质提出的分类,被学者们广为采用。
1.定类变量(nominal scale):又叫定名变量,变量值只表示类别,无顺序和大小的区别。如用1表示“男”,2表示“女”;1表示“国际新闻”,2表示“国内新闻”,……,8表示“广告”。定类变量的分类(即变量值)必须满足两个条件,一个是分类要穷尽,不能遗漏,这可用“其他”类解决;另一个分类要互斥,一个样本只能有一个归属类别。定类变量只能计算次数、比率、众数、品质相关系数,进行卡方检验。
2.定序变量(ordinal scale):变量值表示类别,有顺序的先后。如用1表示“高收入”,2表示“中收入”,3表示“低收入”。可计算次数、比率、众数、中位数、百分位数、等级相关系数、秩次、进行非参数检验,但不能运算(加、减、乘、除)。
在定序变量的测量中,常常会遇到平分现象,或者说具有相同的等级。如有两个样本同为第3名,不能一个排为3,一个排为4,也不能两个都排为3或4。为了保证测量系统的连贯性,两个都排为3.5,计算式为(3+4)/2=3.5。如果是三个个体同为第3名,则三个都排为4,计算式为(3+4+5)/3=4。
3.定距变量(interval scale):变量值表示绝对值的大小,数值和零点不固定,即零点无意义。定距量表可以是5级、4级、7级或100分为满分的量表。如1表示“很不喜欢”,2表示“不太喜欢”,3表示“一般”,4表示“比较喜欢”,5表示“非常喜欢”。定距变量可计算次数和比率、中位数、百分位数、相关系数、平均数、标准差、进行F和t检验。不能计算得分比值(不能计算几何平均数),但可计算得分差值之间的比值。
如样本A、B、C、D、E得分为1、2、3、4、5,也可表示为15、20、25、30、35,两者的关系是y=10+5x。
计算得分比值无意义:不能计算A、B的比值,因为1/2不等于15/20;计算得分差值的比值有意义,可以计算A、B的得分差值同C、E的得分差值的比值,因为(1—2)/(3—5)=(15—20)/(25—35)=1/2。
4.定比变量(ratio scale):变量值表示绝对数值的大小,零点有意义。如收看电视的时间、收入等。收看电视的时间为“0”,不表示被测量者不知道电视或没有电视的知识,只表示被测量者不看电视。定比变量适用于一切统计方法。
五、文献资料的应用
文献资料又称二手资料,指所有不是自己调查得到的资料。文献资料比较容易得到,相对来说成本较低,并能很快地获取。有些文献资料由专业机构发布,例如国家统计局提供人口普查数据,这类数据只能得到二手的。尽管文献数据不可能提供特定研究所需的全部答案,但却十分有用。文献资料可以帮助我们:(1)把握研究的历史和现状;(2)更好地定义问题,明确研究目标;(3)寻找处理问题的途径;(4)构造适当的设计方案(例如帮助确定关键变量,提供有关总体的一些信息);(5)回答一些调查问题,检验某些假设。
应用文献资料数据有许多应注意的问题,从方法论来看,要注意以下问题:
1.技术要求:收集数据所用的方法
文献中收集数据的技术要求或所使用的方法,是考察数据有无可能存在偏差的最重要的准则。一系列的技术要求包括:抽样方法、样本性质和大小、问卷设计和执行、现场调查实施的程序、回收率和回答质量、数据处理和报告的方法过程等。对这些方面的考察可以提供有关数据的可靠性和有效性方面的信息,也有利于帮助我们确定是否可以将这些数据用于解决手中现有的问题。
2.误差:数据的准确性
研究者应当确定文献数据用于当前研究的问题是否足够准确。文献数据误差的来源是多方面的,包括:方法、研究方案设计、抽样、数据收集、分析以及项目报告。而且,由于研究者并没有实际参与文献数据的收集,所以很难评价数据的准确性。评价的方法之一是寻找多方面来源的类似数据,然后通过标准的统计方法来比较。也可以通过到现场去复查的方法来考核。
3.时效性:数据的收集时间
文献中数据可能不是当前的数据,其发表时间远远迟于收集时间。而且即使是最近期的,但对解决目前问题来说可能仍不够新。民意调查(包括市场调查)一般都需要当前的数据,二手数据如果过时了其价值也就消失了。
4.目的性:收集数据的目的
文献中的数据总是按一定的目标或用途来收集的,因此首先要问的基本问题就是“为什么要收集这些数据”。了解到数据收集的目的,就可以知道在什么情况下这些数据可能相关或有用。根据某一种具体目标收集的数据不一定适用于另外一种场合。例如为了了解各种品牌市场占有率而收集的数据,就不一定适用于分析消费者怎样选择品牌的研究。
另外,要考察数据来源或调研机构的信誉、名声和是否值得信赖,这可以通过询问曾经利用过该数据来源的机构或人们来进行。对于为了进行促销、为了特殊利益关系或为了进行宣传而出版发表的数据要抱怀疑的态度。同样地,企图隐瞒数据收集方法和过程细节的文献数据也是令人怀疑的。
5.性质、内容:数据的内容
考察文献中数据的性质或内容时应特别注意关键变量的定义、测量的单位、使用的分类,以及相互关系的研究方法等。如果关键变量没有定义,或者与研究者的定义不一致,那么数据的利用价值就受到限制。例如,假定现有关于消费者对电视节目偏好方面的文献数据,要利用这些数据,重要的是必须知道对电视节目的偏好是如何定义的。是按照看得最多的节目来定义?还是按最需要的、最欣赏的、最有帮助的(提供最多信息)、或是对当地提供最好服务的节目来定义的?
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。