CSM收听率调查的流程与方法
收听率调查是对听众实时收听行为的调查统计。收听率是一个百分比指标,分子是在特定时段(例如7∶00-7∶15)内收听了广播(或某频率)的听众数,分母是被调查的听众数。根据收听率调查数据,可计算一组反映听众收听行为的指标,例如节目收听率、目标听众收听率、占有率(市场份额)、到达率、收听时长、忠实度、重叠率和听众流入/流出等。
根据收听率调查数据可以分析听众收听行为,以调整节目播出编排、强化节目推广、优化广告投放。现在,无论是媒介行业的领导还是普通从业人员,对收听率作用的认识均有了质的飞跃,收听率在节目编排、节目评价和广告投放决策中发挥的作用越来越大。
收听率调查和收听习惯调查不同:收听率调查是对实时收听行为的跟踪记录,是持续性研究;收听习惯调查是对收听行为的回顾式调查,是截面调查,是一次性研究。很多情况下我们往往错误地把收听习惯调查数据当作收听率调查数据来用。在CSM自2002年正式开始向国内广播市场推出收听率调查服务后,这一情况正在发生改变。
收听率调查是一种抽样调查,根据样本调查数据,通过统计推断,可推及某地区(调查总体)的收听率。收听率调查的基本流程包括样本抽取、基础研究、固定样组建立与维护、数据处理等。下面我们详细介绍收听率调查中的这几个流程以及在每个过程中所采用的方法。
一、样本抽取
样本抽取是收听率调查的第一个环节,也是最基础的一个环节。所选样本对于广播听众总体是否具有代表性,对能否保证收听率数据的准确具有十分重要的意义。在收听率调查中,样本抽取过程一般包括确定调查总体、确定样本容量和抽取样本三个具体环节。
(一)调查总体的确定
所谓调查总体,就是指由所有被调查对象所组成的整体。抽样调查的具体目的、指标不同,调查总体也就可能不同。在收听率调查中,调查总体一般被界定为目标区域内所有拥有正在使用的收听设备或者过去3个月有家庭成员收听过广播的家庭中10岁及以上的符合国家统计局常住人口口径的成员。这个界定包括以下三个要素:第一,目标区域。目标区域由所要调查收听率的范围所决定,可以为全国、省、市、县,也可以为某一特定区域。第二,有广播收听行为的家庭人口。由于广播具有非独占性的特点,所以,只要家中有正在使用的收听设备或有人在3个月内有收听广播行为,我们就将其家中成员都确定在总体人口范围内。之所以必须还是家庭人口,主要是因为收听率调查是一种连续性调查,要求被调查者基本保持稳定,家庭人口的稳定性较强。这样,没有收听行为的家庭人口、集体人口及流动人口就被排除在收听调查总体之外了。第三,年龄下限。在收听率调查中,一般要求被调查者必须是10岁及以上,主要是考虑到收听行为相对比较个人化,年龄小的人基本不具备独立收听的能力,同时,由于广播针对儿童的节目少,不能像电视卡通片等那样吸引儿童,儿童收听很少。CSM在2000年开始进行的收听率调查是4岁及以上人口,后来发现4-9岁人口的收听行为非常少,所以,经过研究决定使用10岁作为年龄下限。
确定调查总体除了为收听率调查提供一个样本抽取范围之外,对于正确解读收听数据也具有十分重要的意义。例如某天北京市某一节目的收听率为20%,这个数字表明在北京市进行收听调查的区域内,所有10岁及以上的家中有收听正在使用的收听设备或过去3个月内有人听过广播的家庭人口中,有20%的人收听了该节目,而不是说在北京市所有区县所有人口中有20%的人收听了该节目。
(二)样本量的确定
1.确定样本量时一般应考虑的因素
从抽样理论上来讲,在确定样本容量时主要考虑以下几个因素:
第一,调查总体中各单位的差异程度。如果调查总体中各个单位的差异程度越大,为保证达到一定的抽样精度,所需要调查的样本容量也应该越大;反之,如果调查总体中各单位的差异程度越小,为达到一定的抽样精度所需调查的样本数量就越小。
第二,允许误差。如果在一次抽样调查中的允许误差越小,即以样本标志值对总体标准值进行推断时的精度越高,则所需调查的样本容量就应该越大;反之,如果调查的允许误差越大,则所需调查的样本数量就越少。
第三,抽样方法。抽样方法不同,其效率也不同。如分层抽样、系统抽样比简单随机抽样的效率更高,因而在其他条件不变的条件下,为达到同样的抽样精度,分层抽样、系统抽样所需调查的样本量就要小于简单随机抽样的样本量。
第四,经费、人力和时间等。在抽样调查中所需要投入的经费、人力及时间随着样本数量的增加而提高,因而针对某一项抽样调查所能投入的费用、人力和时间就成了决定样本数量时必须考虑的一个重要因素。
在实际工作中,针对某一个特定总体进行抽样调查样本容量设计时,调查总体已确定,因而调查总体中各单位的差异程度也已确定,同时抽样方法也会确定。这样,在上述确定样本容量时一般要考虑的四个因素中,只有允许误差和经费、人力、时间因素未定,而这两个因素之间是一种此消彼涨的关系,即允许误差越小,所需调查的样本数量越大,成本也就越高;允许误差越大,所需调查的样本数量越小,成本也就越低。在抽样调查的实践中,样本量的大小实际上是抽样精度(抽样误差)与成本之间相平衡的结果。
2.收听率调查中样本容量的计算
根据调查推断指标的不同,抽样调查可以分为两类:一类是平均数抽样调查,另一类是成数(比率)抽样调查。平均数抽样调查是指抽样调查的推断指标为平均数,如从一个城市中抽取一定数量的样本户来调查人均收入水平;成数(比率)抽样调查是指抽样调查的推断指标是成数(比例),如从一个城市中抽取一定数量的样本户来调查有多大比例的人炒股。
平均数抽样调查和成数(比例)抽样调查样本容量的计算公式是不一样的。收听率调查是一种成数(比率)调查,样本量的计算公式为:
n=t2P(1-P)/M2
其中:n为样本量, P为收听率, M为允许误差, t为概率度。
在收听率调查样本容量的计算中,收听率P一般取50%,这是因为此时P(1-P)在所有可能的收听水平中达到最大;置信水平一般取95%,此时对应的概率度t为1.96,这样在上述公式中,样本量n的多少就取决于允许误差M的大小。表1和图1揭示了样本量n与允许误差M之间的变动关系。
表1 不同允许误差水平所需的样本量 (置信水平95%,收听率P=50%)
图1 样本量与允许误差的关系
由表1和图1可以看出:随着允许误差的降低,所需样本数量增大,但是样本数量的增加与允许误差的降低二者之间的关系并不是简单的线性关系。当允许误差较大时,随着允许误差的降低,所需样本量增加,但增加幅度不大;当允许误差较小时,随着允许误差的降低,所需样本量大幅上升。如将收听调查的允许误差由4%降为3%,所需样本量由600人增加到1067人;但如果将允许误差由3%降为2%,所需样本量则由1067人增加到2401人(增加了1倍多);如果将允许误差由2%降为1%,所需样本量由2401人增加为9604人(增加了3倍)。上述样本量与允许误差的变动关系说明,当允许误差降低到3%时,再降低允许误差,所需要的样本量成倍增加。样本量的成倍增加就意味着调查所需成本的大幅增加,换言之,样本量和成本的大幅增加所能带来的抽样误差的降低非常有限,这时再增加样本量是不经济的。权衡抽样误差(精度)和成本之间的关系,在收听率调查中,一个比较合理的样本规模是1067 人,按现在3.5左右的户规模计算,即300户。根据上述理论分析并参考收听率调查的国际经验, CSM媒介研究在城市收听调查网中的样本规模一般为300户。
(三)样本抽取方法
CSM城市收听调查网的调查总体是非农人口比例在45%及以上的市辖区中10岁及以上的广播家庭人口。目标区域的确定之所以以非农人口比例为依据,主要是因为目前我国实行的是“市领导县”的行政管理体制,即在一个城市中,除了市辖区之外还包括部分县,由于城市收听调查网主要是调查城市居民的收听行为,所以必须利用非农人口比例来将调查的目标区域限定在城区。
CSM在收听调查网建立前以及建立后的每年都要进行一次大样本量的基础研究(我们通常称为基础研究),因而城市网的抽样包括基础研究的抽样和固定样组的抽样。收听率调查中样本的抽取分为基础研究样本的抽取和固定样组样本的抽取,其理论依据就是抽样理论中的二相抽样(或称为二重抽样)。所谓二相抽样,是指先从总体中抽取一个大样本(一相样本),对其进行某些指标的调查,而后根据调查得到的信息再从这个大样本中抽取用于进行经常调查的样本(二相样本)。我们通过一个例子来说明在收听率调查中为什么要以二相抽样为理论依据。假定某个城市有10万户居民,我们现在要抽取300户进行收听率调查,那么如何抽取样本,才能保证这300户居民对整个城市的10万户居民具有代表性?很显然,如果抽取这300户样本时已经考虑了10万户居民中每一户关于对收听行为有重要影响作用的指标,如家庭收听设备拥有情况、家庭规模、家庭成员的性别、年龄、文化程度等,那么这300户样本对总体肯定具有较好的代表性。但问题是这10万户居民中每户居民的上述指标谁也不知道,这样就产生了一个抽样需求与信息短缺的矛盾。二相抽样为解决这个矛盾提供了一个可行的办法,即先从这10万户居民中抽取一个大样本(比如1008户),调查每户有关对收听行为有重要影响作用的指标,而后在考虑这些指标的情况下,从1008户中再抽取300户作为固定样本进行连续的收听率调查。由于这300户是在考虑了对收听行为有重要影响作用因素的基础上抽取出来的,因而其对总体具有较好的代表性。在上述例子中,从总体中抽取1008户并进行调查,就是CSM进行的基础研究,而从基础研究样本中抽取出来的样本就是固定样组。对应于二相抽样,基础研究样本就相当于一相样本,而固定样组就相当于二相样本。
除了为固定样组的抽取提供一个抽样框外,基础研究还具有另外一个十分重要的作用,就是为固定样本的轮换和控制提供依据。同其他大规模、连续性调查一样,收听率调查中同样也要进行样本轮换。样本轮换主要是为了解决样本老化所造成的代表性降低和由于被访者厌倦造成的数据质量降低这两个问题。在样本轮换过程中,退出固定样组的样本户一般根据已参加调查的时间确定,即挑选那些被调查时间最长的样本户先退出,而进入固定样组的样本户就不是随便选取的了,必须挑选那些能够保证固定样组的配额指标结构与总体指标结构相一致的户进入固定样组,这样才能保证固定样本组对总体的代表性。这些配额指标的具体数值就来源于基础研究结果。
1.基础研究样本的抽取方法
CSM城市收听调查网基础研究样本抽取所采用的方法是“二阶段、概率与规模成比例(PPS)、整群抽样”,也就是由二阶段抽样、概率与规模成比例抽样和整群抽样组合而成的一个混合抽样。
二阶段抽样,是指整个抽样过程不是由一个阶段完成的,而是分为两个阶段完成。例如,要在一个拥有10万户居民家庭的城市中抽取300户进行收听调查,我们可以编制一个10万户居民家庭的抽样框,从中抽取300户,这个抽样过程是在一个阶段中完成的,我们称其为一阶段抽样。在实际工作中,要编制一个拥有10万户居民家庭的抽样框,一是工作量太大,二是没有必要。为了便于实际操作,我们可以将上述抽样过程分为两个阶段,即第一阶段从这个城市中所有的居家村委会(假定该城市共有3000个居家村委会)抽取30个居家村委会,第二阶段在每个抽中的居家村委会中再分别抽取10户。这样,总样本量仍为300户,但与一阶段抽样相比,将整个抽样过程分为两个阶段后,抽样工作可以大大简化。
概率与规模成比例抽样(Sampling with probability proportional to size),即PPS抽样,是效率较高且应用非常广泛的一种抽样方式。下面我们以城市抽取居家村委会为例来说明PPS抽样的具体过程:
第一步:编制抽样框。从民政局、统计局或其他单位查抄全市调查总体范围内居家村委会名单及户数,所有区、街道及居家村委会按自然标志排列,形成抽样框,见表2。
第二步:计算抽样间距K。抽样间距K=全市调查总体范围内居家村委会总户数/拟抽选居家村委会数。在本例中,某市居民累计总户数=33570,拟抽选居家村委会数=10,则:k=33570/10=3357。
第三步:确定起点。在0-3357之间选取一随机数,如随机数为3212。
第四步:抽取居家村委会。在表2中“累计户数”一栏找到第一个大于等于3212的累计户数,对应的居家村委会即是第一个被抽中居家村委会。
而后计算3212+ K, 3212+ 2K, 3212+ 3K,…, 3212+ 9K,分别在“累计户数”一栏找到第一个大于等于上述数值的累计户数,则对应于这些累计数的居家村委会即是被抽中居家村委会。
表2 某市利用PPS抽样抽取居家村委会示例表 (全市共有3个区、53个居家村委会)
续表
整群抽样,是指先将总体分为若干个群体,而后从中抽取部分群体并对抽中群体内所有个体都进行调查的方法。例如,在某个居家村委会中要抽取100人进行某项调查,我们可以先从这个居家村委会的全部家庭户中抽取30户(将每户看成是一个群体),对这30户中的所有人员都进行调查,这30户的总人数基本上为100人。
整群抽样的一个最大优点就是便于实际操作。有些人认为,收听行为是个人行为,所以在调查抽样时不应该先抽家庭,而应该直接抽个人,这样抽样效果会更好一些。这种说法有一定道理,但从实际操作角度来讲,采用整群抽样的方式较好。因为调查执行的直接成本样本户礼金、访问员劳务费是按照户计算的,即使一户只有一个人合作,成本也与整户合作基本一致。也就是说,如果改变成选人的方式,要么样本量变成1/3,要么成本变成原来的3倍左右。另外,从统计学上来看,只需抽样将户掌握了,人自然就符合实际情况,这个在统计学上没有本质的区别。因此,国际上通行的方式也是先选户而不是直接选人。
CSM城市收听调查网基础研究样本的抽取方法为“二阶段、PPS、整群抽样”,具体为:
第一阶段:由城市抽居家村委,用PPS抽样方法抽取a=72个居家村委会;
第二阶段:由居家村委会抽样本户,在每个抽中居家村委会中,用随机等距抽样方法抽取b=14户家庭户,对于抽中家庭户中的所有常住人口都进行调查。
样本量为:a×b=72×14=1008户
2.固定样组的抽样方法
CSM城市收听调查网固定样组的规模在目前所进行的城市均为300户(在部分小城市,根据客户需要,也可以为200户或100户),为操作方便,一般规定每个居家村委会抽取5户,这样在大城市中, 300户就分布在60个居家村委中。固定样组的抽取包含两个环节:第一是抽取固定样组,第二是抽取样本户。
抽取居家村委会:对于300户站来说,就是在基础研究样本的72个居家村委会名单中随机选取60个作为固定样组居家村委会;
抽取样本户:在基础研究样本户中,去掉非固定样组居家村委所包含的样本户后,按对收听行为具有重要影响作用的指标(家庭户规模、收听设备台数、地区、日用品主要采购者的年龄及家庭户收入)排序形成抽样框,然后随机等距抽取300户家庭户形成固定样组。
二、基础研究
基础研究的目的在于了解该市场听众对广播的一般性收听行为,以及对收听行为有影响的设备占有、频率接收、媒介竞争、个人和家庭结构等重要变量。基础调查的抽样总体是所调查区域内的总人口。通过基础调查可以得出符合收听率调查总体要求的人口数据,为固定样组的建立和样本轮换提供依据,保证固定样组样本分布按照所调查城市有在使用的收听设备或过去3个月内有家庭成员收听过广播的家庭的常住人口比例进行分布。
(一)基础研究的内容
基于影响收听行为因素的角度考虑, CSM基础研究的内容主要包括视听设备拥有情况、日常收听习惯、家庭户规模及结构、个人情况、家庭收入、家庭主要耐用消费品情况、语言及生活习惯等几个方面。
(二)基础研究的现场执行与质量控制
对于保证调查质量而言,现场的执行是一个非常重要的环节。随着人们生活水平的提高、时间观念的增强以及对隐私更加注重等,访问现场执行工作的压力和难度逐渐增加,在这种状况下,如何保证高质量的现场执行成了各个市场研究公司面临的重要问题。CSM依据欧洲民意与市场研究协会(ESOMAR)和国际上的其他相关标准,在基础研究现场执行的前、中、后期均制定了严密的质量控制体系,以尽可能降低执行误差。
基础研究现场访问的执行是一个系统工程,只有所有访问员严格按照统一的流程进行访问,数据才是可信的,所以,严密的操作流程是基础研究现场执行质量的根本保证。CSM基础研究的现场执行在遵循欧洲民意与市场研究协会有关标准的基础上,按更高的要求确定执行流程(图2),并由通过了ISO9002质量体系认证的作业指导书来指导实际操作。
图2 CSM基础研究现场执行操作流程
1.面试挑选访问员
让应聘者在指定时间到CSM公司指定地点参加面试,面试工作由督导来主持。首先,访问员需要填写基本情况登记表,以便面试督导了解其基本情况,并方便对访问员进行评估和以后联系。面试主要了解访问员的基本交流和沟通能力、通过言谈举止体现出来的基本道德水准、衣着打扮等外形条件是否让人觉得可以信任以及参加应聘的动机等等。符合基本要求的访问员在指定时间参加公司安排的基础培训。
2.基础培训
基础研究现场执行的响应率高低,会影响执行结果对该媒介研究地区的整体情况的代表性。响应率越低,误差可能越大。根据CSM经验,对访问员扎实的培训可以有效地降低拒访率而提高响应率,其中基础培训的作用很大。因此CSM将访问员的基础培训作为培训工作的重点。
基础培训是对访问员进行关于基础研究调查的基本知识和技巧的培训。通过基础培训,让访问员了解基础研究调查、公司情况、公司管理理念及文化、访问员管理制度、访问工作的意义及难度、访问及记录等知识和技巧、卡片/入户地址表等访问资料的使用方法等。
在基础培训后对访问员进行考核,通过口头及书面的方式了解每一位参加基础培训的人对基础培训知识的掌握情况。通过讲解专门的基础培训问卷或其他项目的问卷并进行试访,督导逐一陪同访问员入户,重点考察访问员对基础培训知识及技巧等的掌握情况,并淘汰不合格的访问员。
3.项目培训
项目培训是对某一特定项目的培训。CSM规定,接受项目培训的所有访问员必须是经过基础培训筛选后合格的访问员,项目培训包括项目及问卷讲解、模拟、试访三大环节。
(1)项目及问卷讲解
介绍基础研究的基本背景、时间要求、问卷大概情况、费用标准等,对愿意参加的访问员进行详细问卷培训,逐一讲解问卷中每一道题目询问及记录的方法。
(2)模拟访问
模拟访问是在办公室由督导充当被访者对即将进行的访问的一种模拟,重点在于告诉访问员在访问中出现各种常见疑难问题时该如何解决。由基础研究督导充当被访者,使访问员了解在访问中如何使用问卷。督导应根据问卷设计访问中可能出现的各种情况、问题,要访问员予以解决,使每个访问员实际操作一遍。模拟访问中,督导可随时打断访问,对当时出现的问题予以纠正并讲解。模拟结束后进行小结,汇总模拟中出现的各类情况,再次向访问员统一讲解。在此环节也要淘汰不合格的访问员。
(3)试访
试访是对访问的实战演习,借以使访问员对问卷及项目有更深的理解并收集可能出现的来自被访者的其他问题。试访地点应避开正式访问包含的居家村委会,访问员的亲友应排除在被访者之列。每个访问员试访1-2户,不可多个访问员同访1户。试访需要安排参与项目的督导对访问员进行陪访。试访后由负责人集中审核每本试访问卷并进行试访小结,对出现的问题及时纠正,以引起所有访问员的注意,避免类似问题的发生。在此环节再次淘汰不合格的访问员。
4.发放相关资料、正式访问
给合格的访问员发放相关访问资料要求其按照项目要求进行访问。应先派2-3份问卷,访问员完成后应尽快交回办事处。由办事处督导查阅无误后,访问员方可再次领取多份问卷、礼品按地址进行入户访问工作。不允许访问员问卷完成后一次性交回问卷,以避免由于问卷大量下发而导致访问员大量出现同类型错误。应严格按照督导规定时间交卷,如果不能按时交卷则应与督导联系(第一批问卷最好能统一规定时间交回,督导针对出现的问题进行串讲,以避免其他人出现类似问题)。
5.项目质量控制
除了在上述环节随时严格控制质量以外,一般在基础研究现场执行还另外有陪访、问卷审核、问卷复核、手工统计等主要质量控制手段。
(1)陪访
陪访就是项目督导陪同访问员入户进行访问。陪访的目的主要在于发现访问员的访问质量是否有问题,被访者对问题的特殊反应,项目问卷设置是否有不符合当地情况需要予以特殊处理等。
(2)问卷审核
访问员将访问成功的问卷及时交给督导,由督导进行100%问卷一审和100%二审检查,并在问卷上做标记。一审和二审应该由不同督导进行,以防止由于惯性思维导致部分问题没有被发现。督导逐项检查入户接触记录表的填写和使用情况,检查是否完全按督导指定的地址顺序进行的访问、问卷是否出现逻辑错误、问卷填写是否整洁/清晰/完整等)。如有错漏或逻辑上矛盾的问卷,可请访问员再次入户或电话访问填写完整。
(3)问卷复核
●问卷复核目的:发现访问员在基础研究访问过程中出现的不符合要求的地方和问题,及时处理,提高问卷访问质量。问卷复核的主要效果还体现在前期威慑上,即对收回的问卷尽早复核、严肃处理并通告全体访问员,达到预防效果,以免工作永远处于被动局面;
●问卷复核方式:问卷复核主要采取入户复核和电话复核相结合的方式;
●问卷复核比例:复核比例需要大于总样本量的30%,其中入户复核比例大于15%。
(4)手工统计
手工统计的目的在于对回收问卷的重要指标及时进行手工统计,了解指标数据情况及趋势,发现执行问题,及时对现场执行存在的问题进行调控。一般需要统计收听设备数量、被访者年龄、性别、职业等。一般统计前期回收的40%问卷。
(三)基础研究的数据处理及报告
基础研究现场执行结束后,需要将合格的问卷提交公司数据处理人员进行数据处理并完成基础研究数据报告。数据处理过程包含编码、录入、数据清理和运行数据完成报告四个环节。CSM基础研究数据处理所有环节的操作要求都符合欧洲民意与市场研究协会的相关标准并通过了ISO9002质量体系的认证。
三、固定样组的建立与维护
在收听率调查中,固定样组就是用于进行连续收听调查的样本户,固定样组的建立与维护是收听率调查中最重要的环节之一。国际上常用的收听率调查方式主要为日记卡和测量仪两种方式。目前,由于经济等条件的限制,在中国内地用测量仪进行收听率调查的时机还不成熟。本部分内容主要介绍CSM用日记卡方式进行收听率调查的固定样组的建立与维护。
(一)收听率固定样组的类型
固定样组可按数据调查周期、采集方式、样本推及总体和样本规模等不同分类标准分为不同的类型, CSM目前拥有的收听率调查固定样组主要按照调查周期进行分类。
CSM目前拥有三种不同调查周期的固定样组:(1)全年365天连续调查;(2)每年3波、每波4周的收听率扫描,调查起始时间:3月最后一个周日、7月第一个周日、10月中后一个周日;(3)每年4波、每波3周的收听率扫描,调查起始时间:2月、5月、8月最后一个周日、11月第一个周日。
(二)收听率日记卡固定样组的建立
日记卡固定样组建立的主要环节包括制定工作计划、人口和频率资料的收集、抽样及访问、访问员及样本户培训、质量复核、数据监测等。
1.制定工作计划
同完成其他任何项目一样,日记卡固定样组的建立需要有明确的任务要求,并在此基础上对所有资源进行详尽的考虑和统筹。一般来说,日记卡固定样组的建立任务要求应包括以下几个方面:
●固定样组建立完成的时间或正式提供收听率数据的时间;
●固定样组的规模、性质、抽样方法;
●固定样组建立的主要步骤及相应的时间和方法要求。
在明确上述任务要求的前提下,对建立固定样组所需要的人力、财力、设备等进行统一规划,制定固定样组建立的详细工作计划。详细的工作计划对完成整个固定样组的建立具有非常重要的意义。
2.人口和频率资料的收集
事实上,人口和频率资料的收集工作应当在为建立固定样组而进行的基础研究开始之前就进行,否则基础研究的工作将无法开展。因为前面“基础研究”论述的主要是基础研究的内容与执行,故将人口和频率资料的收集工作放在这里论述。
人口资料作为进行收听调查样本抽取的基本资料,应当来自于样本地区最新的正式的统计出版物,如当年的统计年鉴等;也可以从被行业认可的权威机构获得,如样本地区的各级统计局、民政局、公安局以及街道办事处、居家村委会等。所需收集的资料内容根据抽样方法的不同而有不同的要求。例如按CSM实行的PPS抽样方法,对于城市调查网而言所需收集的人口资料应包括样本地区全部社区/居家村委会名称以及每个社区、居家村委会所包含的家庭户数(或人口数),人口资料收集要求必须完备,否则将会导致PPS抽样方法可靠性的下降。
频率资料是收听率调查的重要资料,收集渠道为样本地区的广播电台或其他广播电视管理部门,收集的频率应当包括当地可以收听到的全部频率,具体包括频率名称、频率类型/主要内容、播出频率、播出时间。当然,在真正开始收听率调查时,并不是所有的频率都会被列入被调查之列。事实上,只有所在城市市级以上广播电台的频率才会在日记卡中的频率提示卡上出现,而更低一层的那些非主要频率则通常被记入“其他”类不再细分,境外频率由于属于政策限制范围内的频率,因而通常也被记入“其他”类。
3.抽样及访问
关于收听率固定样组的抽取方法,前面已有论述。这里需要强调的是,在实际工作中,按照前面所说的方法随机抽取三套样本地址,每套样本地址的户数均与固定样组规模相当,剩余地址作为备选地址。在实际入户访问时,首先选择第一套地址使用,当遇到不愿合作的家庭户时,则利用第二套样本地址中相同序号的地址进行替换,如果该样本户也不愿意合作,则利用第三套样本的同号地址进行替换,如果在三套地址使用完毕后仍无法取得样户,则在备选地址中任选一户。固定样组中80%的样本户按此种方法完成,其余20%的样本户采用配额抽样完成,即以配额指标的基础研究结果为目标,在所有未接触的地址中选择样本户,以使固定样组的配额指标结构与基础调查结构一致。如果上述地址不足,则用所抽中居家村委会的居民地址作为抽样框,随机抽取地址补充访问,直至完成调查要求。
CSM在城市收听率日记卡固定样组中的配额指标有以下六个:性别、年龄、家庭户规模、日用消费品主要购买者年龄、正在使用的收听设备台数、家庭月总收入。
对于所有符合要求且愿意与我们合作的被调查户,我们都需要做一份《样本户基本资料问卷》了解其家庭及人员的基本情况,包括:人员年龄、性别、职业、教育水平、收入、民族、语言、收听设备情况等等内容。
4.访问员及样本户培训
除抽样及访问外,固定样组的建立在前期工作中的另一个非常重要的任务是对访问员及样本户进行收听率调查记录的培训。访问员及样本户前期培训的质量将直接决定固定样组所提供数据的质量。
图3 CSM收听率日记卡样例
(1)访问员填涂培训
访问员的培训流程与基础研究一致,必须严格按照基础培训、项目培训、模拟、试访的流程进行。日记卡样本户培训的执行者是访问员,因此,对访问员的日记卡填涂的培训和考核尤为重要。固定样组建立时的访问员肩负着与基础研究访问员不同的责任,他们除了要熟悉问卷外,更需要牢固掌握日记卡的填写方式和要求,以便对样本户进行准确的培训。考核达到要求的访问员方可上岗工作。对样本户填涂培训的要求包括:第一,对每一位家庭成员逐一培训,要求至少保证其中一名家庭成员完全掌握填涂规则;第三,要举例并结合提供给样本户的频率提示卡进行讲解;第四,当场要求各家庭成员试填,确保培训质量。
针对收听行为的个人性和流动性特点, CSM采用的收听行为记录日记卡为个人日记卡,以便于样本人员携带和填写。
(2)试填期间跟进培训
根据以往经验,样本户在初期合作的一两周内,会由于自觉是“被访者”身份而有意识地改变自己的收听行为,结果使调查结果失真;另外,由于刚开始合作,尚需要时间进一步适应。因此, CSM对所有日记卡方式进行的收听率调查均规定了一定的试填期(新样本户在正式提供数据前,必须进行至少两周的试填卡;波次收听率扫描,在每波调查前还必须进行一周的试填卡)。这一方面可以使其后的收听数据变得更为真实,另一方面也可以给接受填涂培训的样本户一定的时间进行消化。在试填期间,访问员需要进行跟进培训,对无法掌握填涂方法的特殊样本户进行重新培训或轮换。
5.质量复核
对固定样组建立质量的复核,包括:固定样组访问质量的复核、频率资料收集质量的复核、样本户填涂质量的复核三个方面。
(1)固定样组访问质量的复核
对固定样组访问质量的复核,与基础研究的内容与执行中问卷复核相同。
(2)频率资料收集质量的复核
由于国内各地自办频率的繁多和转播情况的复杂,一般而言,在固定样组建立期间通过问卷中频率内容的收集、试填期间样本户收听频率的填写等方式将所有提及频率重新汇总,同时关注频率提示卡中未单独列出的“其他”频率的收听情况,然后与前期收集的频率资料比对,及时调整不完整或不准确的频率信息。
(3)样本户填涂质量的复核
样本户填涂质量的复核相比前两项,不仅是固定样组建立期间的必要工作,更是固定样组维护期的重要工作内容之一。样本户填涂质量的复核包括:
●样本户的空白填涂是否是真实的无收听行为,还是未进行及时记录;
●样本户收听填涂中出现了当地收不到的频率,是否是真实的收听行为(例如通过网络收听等);
●样本户收听填涂中在没有节目的时段出现了收听记录,是否是错填;
●通过电话对样本户进行抽样访问并记录收听行为,与样本户最终的填涂记录做比对,查看样本户的填涂正确率。
6.数据监测
前述的各项质量复核是针对固定样组访问、样本户填涂等各个具体的环节进行的细节质量控制,而对固定样组试运行期间收听率数据的监测和分析,则能够直观地看出最终的收听率数据结果、电话抽查的样本户收听习惯以及频率偏好是否与当地对频率偏好的已有看法一致。当然,当地对频率偏好的已有看法由于了解对象的不同而不是一个十分准确的概念(否则我们就没有必要进行收听率调查了),但仍可作为一种比对的参考。比对的结果是否一致并不重要,对对比结果的分析才是目标所在。
此处所谈及的对固定样组试运行期间收听率的分析,主要是为了判断收听率数据与电话户访结果及主要频率节目排期的变化之间是否相吻合。对于收听率起伏不定的情况,应作进一步的分析,以最终判断固定样组的建立质量是否可靠。
(三)收听率日记卡固定样组的维护
日记卡固定样组的维护主要包括人员培训和访问员管理、样本户轮换、样本户背景资料及频率信息更新、数据质量控制、样本户激励等。
1.人员培训和访问员管理
培训工作在日记卡固定样组的维护中当被列为首要工作。日记卡固定样组运作中人为环节较多,从选样到数据采集无一不是人在执行,因而人员培训的质量对最终数据质量具有决定性的作用。人员培训一方面可以强化已有的业务流程和操作要求,改正或改进原来不完善的环节;另一方面则可以了解新的业务规定。
人员培训包括三个层面的培训:督导/录入员的培训、访问员培训、样本户培训。具体方式包括定期全面培训、特定业务内容培训以及针对性较强的个别培训等。所有培训都必须进行考核,以确保培训取得预期效果。
(1)督导/录入员的培训
定期对在岗督导进行全面培训,为所有在岗督导提供一个统一学习和共同交流的机会;也可进行特定业务内容培训和针对性强的个别培训,旨在提高在岗督导某一方面的执行能力。对新聘督导应进行调查行业的入门基础培训、收听率调查的专项培训、固定样组维护的培训;对新聘录入员应进行专用录入软件的培训。
(2)访问员队伍的管理和培训
访问员由督导负责招募,除基本素质方面的要求与基础调查对访问员的要求相同外,作为固定样组的访问员,还要求必须能够保证在每周固定的时间收取和提交日记卡,必须与任何一方广播电台工作人员无较密切的关系。
由于访问员是采用日记卡方法进行收听率调查的枢纽所在,故对访问员队伍的管理是所有环节中的重中之重。日记卡固定样组维护质量的好坏,很大程度上取决于督导管理访问员的水平和能力。督导应制定访问员管理条例,最基本的要求是:应根据访问员的表现进行适当的、有理有据的奖惩;对于访问员出现的错误应及时指正并再次培训;对访问员执行工作中可能出现问题的动向及时把握;对出现严重问题并无法改进的访问员进行及时更换。
对访问员的管理,一个有效的手段是督导跟随访问员进行收卡工作,另一个有效手段是督导通过与样本户的直接接触了解访问员的工作态度和质量,还可以通过各种质量数据对访问员的工作进行监督和控制。正如任何管理工作一样,督导对访问员的管理也是“麻雀虽小,五脏俱全”,无法仅仅通过详细规定就能实现管理目标。
(3)样本户的培训
我们在前面固定样组建立期间已经谈到了对样本户填涂的培训,在固定样组维护期间,这种培训分为两部分:一是对新样本户的填涂培训;一是对老样本户出现的问题进行再次培训。对督导和访问员的培训,其最终目的都是为了使样本户的培训达到要求的标准。
2.样本户的轮换
作为进行连续收听率的调查固定样组,其样本户和样本人员并不是完全固定的,即必须要进行样本户的轮换。样本轮换在所有采用固定样组所进行的连续调查中是一个非常重要的制度。随着合作时间的增长,样本人员对收听调查工作的兴趣可能会下降,从而造成填写日记卡质量和数据质量的下降。为了防止这种情况的发生,同时适应总体的变化,保证固定样组对总体的代表性,需要采用一定规则对固定样组的样本户进行轮换。
CSM收听率调查全年365天连续调查的调查网的样本轮换以周为单位,每周保持固定的轮换比例,按每年50周计算(春节期间的两周一般不换户),平均每周需更换2%的样本户。分波次调查的调查网,每波更换50户样本,这样既保证了样本的相对稳定,又达到了逐步更新的目的。进入固定样组的新样本户,要求从与出网样本户同一个居家村委会中,以最新基础研究结果为依据,采用配额抽样的方法选取。样本轮换时的配额指标与日记卡固定样组的建立时的配额指标一致。
3.样本户背景资料与频率信息的更新
样本户在为期一年左右的合作时间内,家庭情况可能会发生各种各样的变化,固定样组维护工作之一就是及时了解这些变化并将之反映在样本户背景资料中。这种家庭情况的变化既可以通过访问员每周入户收取日记卡过程中获得。也可以通过督导与样本户的直接接触获得。同时也应使样本户懂得:如果我的家庭情况发生了变化,我就应该及时将这这些变化反映给调查人员,以保证收听调查数据的准确。
对收听调查具有重要影响作用的样本户背景资料的变化主要集中在两个方面:一是收听设备的改变,二是家庭人员的增减或居住时间的变化。而其他背景资料的变化,例如样本人员工作情况和使用交通工具情况的变化等,相对而言对收听调查的影响则不大。因此,对样本户家庭背景资料变化的更新应更加关注收听设备、家庭人员数量及居住时间的变化方面。
在固定样组维护中,另一个需要重点关注并更新的信息是广播频率的变化。频率变化的信息,除通过广播电台等各类媒体获知外,还可以通过当地的调查人员对广播频率的密切关注和监测获得。频率信息的变化要及时准确地反映在样本户用作填涂依据的频率提示卡上,这是日记卡法收听率调查数据准确性的基本前提。在频率变化繁多的地区,这种频率维护更新工作要更为细致和及时。
4.数据质量控制
在前面日记卡固定样组的建立中所提到的那些质量复核手段也是固定样组维护时期数据质量控制的重要手段。在固定样组维护时期,一般通过电话户访和入户检查两种方式对样本户的填涂质量和访问员的工作质量进行检查,对存在的质量问题进行持续跟进。通过电话户访得出的填涂正确率的连续结果,也可以作为判断固定样组的质量是否有所提高的依据。
由于在固定样组维护期已有大量的历史收听数据,故可以通过对收听数据的分析来进行数据质量控制。下面通过几个例子来说明,对收听数据的分析可以使我们从更多的角度提前预警数据质量。
●收听行为突然发生大的变化或者收听行为过于单调和持久不变。例如一些样本成员生活比较规律,长期以来平均每天的收听时间基本维持在一个固定的数值上,如果突然出现较异常的延长或者缩短,就需要对这种收听行为予以关注。同样,一些样本人员的收听行为过于单调也应予以注意;
●收听行为与样本个人背景资料出现难以理解的逻辑错误。例如一个10岁的孩子非常频繁地收听新闻类节目,或者老人经常性地收听儿童节目,这时都需要与样本户确认并判断样本户日记卡的填涂质量;
●整个家庭所有样本成员收听记录长期以来完全一致。这种情况需要确认是样本户确实有着完全一致的收听习惯,还是由于样本户家庭成员中只由一人填写日记卡所致。
5.样本户的激励
为了保证固定样组样本户的合作,样本户的激励工作是非常重要的一个手段。在所有激励方式中,物质激励总是扮演最重要的角色。定期给予样本户一定金额的礼金或一定价值量的礼品是经常使用的方法。给予礼金或礼品的一个基本原则是:不能影响样本户的经济水平和收听习惯。通常,给予礼金在收入较低的地区是不被推荐的,尤其在农村地区,现金形式的礼金几乎会直接改变低收入样本户的经济水平而使这些样本户变得过于依赖这种调查,改变原本应当互惠合作的关系。同样,礼品的选择上也应注意,不能选择可能替代收听设备的传媒物件,例如收音机或者电视机,这会直接影响到样本户原本的收听行为;也不能选择带有偏向某一广播电台的物品,例如印有某广播电台标志的纪念品或报纸、刊物等,这将使样本户在无意中加强对某一电台或频率的偏好,使收听率调查出现偏差。
其他激励方法还有很多,其中《样本户通讯》是一种比较好的方式。它一方面可以在样本户与调查方之间建立一个良好的通道,强调固定样组调查的重要性,给予样本户参与调查的荣誉感;另一方面也向固定样组中的每一个样本户传递了具体的工作要求,以明确合作标准,改进调查质量。
四、收听率数据处理
(一)数据处理流程
收听数据处理流程包括以下三个环节:(1)收听调查原始数据(包括样本人员背景资料和日记卡数据)输入计算机后,要进行数据的净化,以确保原始数据的完整及合理;(2)净化后的收听数据、样本背景资料库及节目资料库合并形成一个更全面的“收听率资料库”;(3)在这个“收听率资料库”的基础上,以性别、年龄等为加权变量,对原始数据进行各种加权计算,便产生各种收听率数据。
(二)收听调查原始数据录入
1.样本人员背景资料的录入
访问员通过调查所得到的关于样本户中被调查人员的基本情况,在经过审核、复核等质量控制流程后,录入CSM专用的panel录入软件中。录入数据经过计算机净化清理后备用。
图4 CSM专用panel录入软件
2.日记卡录入
由访问员每周日上门将记录有样本人员收听行为的日记卡收回后送达CSM在当地的办事处,经过办事处督导对日记卡进行仔细检查后,由经过严格培训的录入员将日记卡上的记录用专用收听行为录入软件punching输入到计算机中。
图5 CSM专业的收视收听数据录入软件
在日记卡全部录入完成后,将录入结果输出并通过ftp上传至CSM北京总部的数据检查中心。为严格控制录入结果, CSM的punching软件在输出后将只能由北京总部的数据检查中心或在总部数据检查中心提供密码后打开,每打开一次,密码均会发生变化。
各站每周回传数据并经总部数据检查中心检查无问题后,计算机程序会随机抽取10户日记卡编号下发各地进行复录,总部将复录数据与首次回传数据进行对比检查,并将检查结果反馈各站进行跟进。针对上述不同情况需采取如下措施:复录数据错误率>=0.5‰时,办事处必须注意督促录入员提高数据录入的准确性;复录数据错误率>=1.0‰时,办事处必须注意及时检查错误原因,并且注意避免再次出现错误率高的情况;复录数据错误率>=3.0‰时,总部会通知该站对数据进行100%的复录,即全部数据重录一遍,数据重录操作要求按照复录的要求进行,直至数据录入质量符合CSM标准。
(三)数据加权
加权是收听数据处理过程中的核心环节,在收听数据处理中加权的目的在于对样本结构与总体结构的偏差进行校正,以取得能够准确反映总体收听情况的数据。
现举例说明:假定某市经基础研究调查发现总收听人口为10万,其中男性占48%,女性占52%;所抽样本人数为1000人,在样本中男性占42%,女性占58%;由于样本性别结构与总体性别结构发生了偏离,导致男性权值(样本中的一个男性在总体中所代表的人数)与女性权值不同:
男性权值=总体中男性人数/样本中男性人数=48000/420=114.3
女性权值=总体中女性人口/样本中女性人口=52000/580=89.6
假定样本中收听某节目人数为500人,其中男性180人,女性320人,则:
总体中收听该节目的人数=样本中男性收听人数×男性权值+样本中女性收听人
数×女性权值=180×114.3+ 320×89.6=49246人
则该节目收听率=49264/100000=49.3%(而不是500/1000=50%!)
上例中加权变量只有一个(性别),而在实际工作中加权变量往往不止一个,这样计算权值的过程就比较复杂,需依靠计算机才能完成。
CSM在收听调查网中均采用边际加权方法(Rim weighting)对收听调查的样本数据进行加权,在城市收听日记卡调查网中以性别、年龄为加权变量(如果进行省网调查,则需要加城乡指标)。表3就是通过边际加权方法找到的某城市的性别、年龄权值表,
表中每个数值的实际含义为在某个特定的人口统计区间内每个样本人的推及人数。如10.30435意味着:当周在该城市中,样本中1个年龄在10-14岁的男性在总体中代表10.30435千人。
表3 某城市各种特定人口的权值表(千人)
(四)收听率的计算
在找到权值表后,收听率的计算就非常容易了。例如,根据某一城市的某周收听监测记录(表4),在某一特定时段内收听某一节目的10岁及以上的样本人数为178 人,这178人中的每一个人总可以在权值表中找到其对应的位置,即分别属于某一特定的人口统计区间。将每一个特定人口统计区间内的样本人数分别乘以相应的权值,可以得到在总体中收听了节目的各类听众人数。假定在收听节目的178人中有13人是25-34岁的男性,则在总体中共有8.415584千人×13=109千人收听了该节目,以此类推,计算总体中收听节目的各类人数并汇总,就得到总体中收听该节目的人数,即加权后的收听人数为959千人。用959千人除以总体中10岁及以上听众总人数6256千人,便得出该节目的收听率为15.3%。
表5 某城市某周某时段某节目收听率计算表
(作者:王辛远)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。