第四节 社会数据的属性
在现代社会学、行为学的研究中,对研究对象一般都要采取测量的方法进行观察。测量的尺度,就是用于观察研究对象和处理有关资料的测量方法。有的事物、现象只能或只需对其属性进行分类(称之为定性分析),有些则可以或要求必须用比较精确的数字加以计量(称之为定量分析)。资料的统计分析处理,就要运用这些尺度测量被研究对象,由粗略到精确可分为四个层次,定类尺度、定序尺度、定距尺度和定比尺度四级。每一级都代表了测量的一个层次。各种测量尺度,既可以用于对客观现象的测量,又可以用于对人们主观行为、态度的测量。用于对人们主观行为、思想测量的尺度大多是测量人们对某一事件、现象或政策、行为等的态度的,故又称为态度尺度,这种尺度往往经过一些专家的精心设计而形成尺度体系,称为“量表”。老年人口的身体行为能力,各种用于智力测验的设计,也属这样的量表。以下分别介绍各类尺度。
一、定类尺度
定类尺度(Nominal Scale)也称名义尺度或列名尺度,是测量尺度中层次最低的计量尺度,它仅能区分出不同类别的测量尺度。按照某种属性把事物进行分类,是判断“属于/不属于”的基准。常用于测量定类数据,如性别分为男和女两类;夫妻的婚后居处只能分成独立门户、住婆家、住娘家和其他四种类型。定类尺度在统计处理时也可用数字表示,但这些数字只是由研究者任意规定的某一类别的代号,不具任何数学意义。如对性别可以规定男是1、女是2,也可以规定女是0、男是1。这里的数据不能区分大小或进行加减乘除数学运算,只能计算各类别的频数与频率。在市场调查中,定类尺度常被用来度量被调查的品牌、属性和商店等对象。
定类尺度具有两个特点:首先,它仅仅只是区别不同事物的性质而没有任何数量比较关系,在代号上也没有任何量的关系,因而不能进行数的比较和运算;其次,这种代号具有随意性,其符号既可用数字也可用英文、拼音字母等类。在对它们进行排列时,可以按研究者认定的形式进行。
定类尺度的设计必须遵循两个原则:第一规定的类别必须具有穷尽性,即所有被测量的现象都可分别纳入这些类别;其次,各类别必须是相互排斥的,一种现象只能归入一类,而不能出现同时归入两类的情况。
二、定序尺度
定序尺度(Ordinal Scale)又叫定序数据、顺序尺度,是指能将社会指标排列出大小或高低秩序的测量尺度。它比定类尺度高级一些,不仅能将事物分成不同的类别,还可以确定这些类别的优劣或顺序,是判断“A比B…”的基准。它用于测量定序数据,如文化程度可分成文盲、小学、初中、高中、大专、大学和研究生等七级,每一级都较前一级更高,所给编号分别为1、2、3、4、5、6、7。又如家庭规模,可分为小型家庭、中型家庭、大型家庭等几类,依顺序后一类的规模都较前一类更大。这里的数据除可以计算各类别的频数与频率外,还可以比较大小,但不能进行加减乘除数学运算。如根据文化程度排序,可以判断初中文化程度读书时间多于小学而低于高中,并用数字符号表示为X小学<X初中<X高中,但无法判断初中与小学受教育年限的差别是否同高中与初中受教育年限的差别一样大。这是定序尺度的局限性。在社会、市场调查中,定序尺度常被用来度量相对态度、意见、感觉和偏好。
定序数据在统计处理上,其代号也是由研究者任意确定的,使用符号既可是数字,也可是别的字符。和定类数据不同的是,它的排列顺序不能有任意性,只能从小到大或由大到小。定序尺度仍然不能进行数学运算,因为这类运算不仅无法进行,且也不具有任何的实际意义。
定序尺度是行为学研究中最常用的测量尺度。如在态度测量中要问及调查对象是否喜欢跳舞时,就可列出非常喜欢、喜欢、一般、不喜欢和厌恶等五个等级,并可用代号来表示。使用定序尺度时需要注意:当定序尺度之外的因素引入实际测量之后,原测量的对象会导致由定序数据变成定类数据,从而降低测量的层次。
三、定距尺度
定距尺度(Interval Scale)也称定距数据、间隔尺度,是指能用某种计量单位去测定研究现象的测量尺度。它用于测量定距数据,度量层次高于定序尺度,它不仅能将事物分成不同类别并进行排序,而且可以准确地计量它们间的差距。用定距尺度测量的样本数据间的距离是可以确定的,因而不仅可以比较样本数据的大小,而且可以比较各数据间差别的大小。如考试成绩,90分比80分高10分。其中的数据除可以分类与比较大小以外,还可以进行加减运算。由于没有绝对零点,因此乘除运算是没有意义的,摄氏温度是个很好的例子。如当三个地点的气温分别为20、25、40摄氏度时,不仅知道他们的气温定序排列是25度大于20度而小于40度,而且也知道25度与20度的差别小于25度与40度的差别。由于定距数据有统一计算单位,故可以进行加、减运算,但不能作乘除运算,因为做乘除运算要一个表示真正是“无”的绝对零,否则运算会失去实际意义。再如气温为0摄氏度(严格地讲,温度有绝对零度),就不能说其没有温度,也不能说温度数为30度的气温,是温度数为15度的气温的2倍。
四、定比尺度
定比尺度(Ratio Scale)也称比率尺度、定比数据,是最高层次的度量尺度,除具有以上三种尺度的所有特性以外,还有绝对零点。因此,对于定比数据,除了可以分类、比较大小以及加减运算以外,还可作乘除运算,可以计量测度值间的比值。如以“元”作为计量单位来测定样本的收入量,以“岁”作为计量单位测定对象的年龄。对于收入,0表示没有收入,在此是有实际意义的,不仅可以计算1000元比800元多200元,500元比300元也是多200元,还可以计算1000元是500元的两倍。在市场调查中,销售额、成本、市场份额和消费者数等变量都是定比数据。
等比数据一般都是连续性数据。例如收入,不仅可有从40、41、42、43……直到100元之别,而且每一元之间,还可有精确到分的一百个点相连接,正因为如此,等比数据一般是用计算单位的量度值作为数据值,具有客观的确定性,而没有随意性。
表2.12 社会(市场)调查数据四种计量尺度的比较
以上四种尺度对事物的度量层次是由低级到高级,由粗略到精确逐步递进的,定类尺度是最低层次的测量尺度,定序尺度较定类尺度则高一层次,它包括了定类尺度的特性。定距尺度较定类尺度又高一层次,而且也包括了前两者的特性。由于它们测量的层次、特性的不同,在统计处理中便有量的统计方法的区别。高层次计量尺度的数据可以转化成低层次计量尺度的数据,但反过来,低层次计量尺度的数据不能转化成高层次计量尺度的数据。不同的转换方法,高层次计量尺度可产生不同形式、不同数量的低层次计量数值,尺度转换就会有信息损失,所以除了高层次计量尺度数据质量比较差,或者研究一致性的需要,一般不要随意转换尺度。
数据度量属性的选择有定距或定比数据(Scale)、定序数据(Ordinal)和定类数据(Nominal)三类。定类数据是指那些仅能区分出不同类别的测量尺度的数据。各种尺度所使用的统计方法是不一样的,可以向上兼容,而不能向下兼容。如对于定类数据,仅能进行列联表分析、χ2检验;对定序数据能计算等级相关系数;对等距数据可以计算皮尔逊相关系数。对于方差分析,一元方差分析用于分析一个定类数据(自变量)与一个定距变量(因变量)之间的关系,如各种职业人口的经济收入;多元方差分析用于分析多个定类数据(自变量)与一个定距数据(因变量)之间的关系,如各种职业男女职工的经济收入;协方差分析将方差分析与回归分析相结合,用于分析多个定类数据(自变量)与一个定距数据(因变量)之间的关系研究,如各种年龄、各种职业、男女性职工的经济收入等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。