第二节 问卷调查资料的整理与数据录入
一、问卷复核
问卷回收以后,在进行整理资料之前,必须对其进行复核,即对问卷事先浏览一遍,以保证资料的客观性、准确性和完整性。
复核的原则有:
1.完整性原则。
要检查问卷是否填答完整,如果资料收集不全,特别是核心问题资料收集不全,就会降低甚至失去分析研究的价值。因而如果发现填答不完整时,在可能的情况下必须回访以完成问卷,如由于条件限制,实在无法完成,而缺失又较多的情况下,该份问卷的资料只得全部放弃,不进入进一步的整理。
2.真实性原则。
首先根据常识或已有经验对问卷中的回答进行辨别,看其是否真实可靠地反映了调查对象的客观情况,如问题较大,必须让调查员或其他人回访,确实无法回访的则必须剔除。
3.准确性原则。
要对资料进行逻辑检验,这项工作可在资料录入前进行,也可在录入后进行,以检查调查得来的资料中有无不合理或相互矛盾的地方,如在问卷中当前面问及“您是否使用过某类药物”时回答为“否”,但后面在问及在此类药物使用过程中是否有不良反应时,问卷中却填答了如腹泻、恶心等选项,这显然是前后矛盾的,准确情况到底如何,需要对此问卷认真分析,然后进行修正,以得到准确的资料。而有时实在无法确定时,只能将二者都作为缺失值处理。
二、编码和录入
1.编码。
编码是对问卷调查资料整理的重要程序,即将问卷中的信息数字化,转换成计算机统计软件和统计程序能够识别的数字,此项工作实质上是一种信息代换的过程。
编码属于资料整理程序,这一程序的成功与否,对市场分析与解释工作将有重大影响。编码工作的最终结果是将资料转化为数字,这些数字代表了变量的不同特性,这些变量又在数据文件中占有一定的位置。
编码工作的主要任务是编写编码手册,编码手册是对变量位置及数字意义的描述。编码手册有两项基本作用:一是作为具体编码过程的指南;二是使研究者在统计分析过程中便于查找变量的名称及各个数字所代表的意义,编码手册相当于打电报的密码手册。调查者要根据它将问卷调查资料转换成能够计算、统计的数字输入计算机,然后再根据它将计算机运算出来的结果转换成我们能够理解的文字。
2.录入。
录入是将经过编码的数据资料输入到计算机的存储设备(软盘、硬盘)中,这样便可供计算机分析了。
数据的录入有两种形式,一种是以单独数据文件的形式录入和存在,另一种是直接录入专门统计软件中(如SPSS 6.0)。但是不管哪种录入方法,鉴于计算机本身的独特性质,对不管是以硬盘,还是软盘形式存在的录完的数据资料都必须进行备份,以防出现意外而使资料丢失,浪费大量劳动和时间。
三、查错和改错
在问卷资料已转换成数据资料存储进计算机后,如果研究人员有能力,可编写专门的程序利用计算机对资料再次进行查错。
查错的程序方式有两种:
第一种是检查输入信息的有效性,即对数码的取值范围进行检查,其检查方法就是看资料是否都在问卷及编码手册所规定的取值范围之内。
例如,对性别进行调查的答案只有两个:男、女,编码手册如将男编为0,女编为1,缺失值编为9,则这个变量答案的取值范围只能是0、1、9,不可能出现2、3、4等数码。这类检查便是要把那些超过取值范围的错误找出来。
第二种检查是对数码进行逻辑检查,即看输入信息相互之间的一致性。逻辑检查主要是检查同一份问卷中,不同问题的答案有无矛盾。
例如某份问卷第二题询问年龄,年龄编码为:1~10岁=1;11~20岁=2;21~30岁=3……而问卷第八题调查婚姻状况,其答案编码为:1是未婚;2是已婚;3是丧偶独居。假如某份问卷第二题的答案是1,那么第八题的答案也应是1,如果第八题答案是2或3的话,那显然不是第二题便是第八题出了错误。逻辑检查可以找出问卷资料的逻辑错误。
事实上,对回收问卷的浏览相当粗略,只能发现一些非常明显的错误,而大量错误很可能未被发现。同时,数据编码和录入过程中同样不可避免地出现差错,导致最后计算机中程序准备使用的数据中存在一些错误,从而影响分析的准确性。不过,通过相关程序的计算机查错,大量此类错误会被发现,然后可以有针对性地翻阅原始问卷资料进行修改,为下一步分析提供良好的基础。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。