首页 百科知识 计算标志变异指标

计算标志变异指标

时间:2024-04-09 百科知识 版权反馈
【摘要】:(一)标志变异指标的含义标志变异指标又称标志变动度,是综合反映总体各单位标志值之间差异程度的一种统计指标。标志变异指标与平均指标是一个问题的两个方面,是相辅相成的。一般情况下,标志变异指标数值越大,平均指标代表性越低;反之则越高。标志变异指标按照计算方法和精确度的不同,分为全距、平均差、标准差和变异系数四种。

(一)标志变异指标的含义

标志变异指标又称标志变动度,是综合反映总体各单位标志值之间差异程度的一种统计指标。标志变异指标与平均指标是一个问题的两个方面,是相辅相成的。平均指标将总体各单位标志值之间的差异抽象化,反映了这些标志值的一般水平,说明了变量数列中变量值的集中点或集中趋势;而标志变异指标可以反映变量值的离中趋势,说明总体各单位标志值之间的差异大小或变异程度。

(二)标志变异指标的作用

标志变异指标在统计分析研究中的作用主要有以下几个方面:

1. 反映了总体各单位标志值分布的离中趋势

平均指标反映了总体各单位标志值的集中趋势,但是这些标志值毕竟不完全相同,有大有小,之间存在着差异,而标志变异指标则反映了总体各单位标志值之间的差异大小和分散程度。标志变异指标数值越大,说明总体各单位标志值之间差异越大;反之,就越小。

2. 可以说明平均指标的代表性程度

平均指标代表了总体各单位标志值的一般水平,其代表性的高低与标志变异指标数值大小成反向关系。一般情况下,标志变异指标数值越大,平均指标代表性越低;反之则越高。例如,甲学习小组5名学生的成绩分别为60分、65分、70分、75分和80分,乙学习小组5名学生的成绩分别为30分、40分、80分、100分和100分,则不难通过计算得出两组的平均成绩都是70分,很明显甲组5名学生成绩之间的差异较小,而乙组5名学生成绩之间的差异较大,故甲组学生平均成绩代表性较高。

3. 能够说明现象变动的均匀性或稳定性程度

例如,A企业2011年4个季度完成全年利润额计划百分比分别为10%、20%、30%和40%,B企业分别为24%、27%、26%和23%。很显然,A企业各季度利润额计划完成百分比之间差异大,存在前松后紧的情况;而B企业各季度计划完成百分比之间较为接近,计划执行进度较均匀。

标志变异指标按照计算方法和精确度的不同,分为全距、平均差、标准差和变异系数四种。下面分别介绍它们的特点和计算方法。

(一)全距(R)

全距也叫极差,是最简单的标志变异程度指标,它是标志值中的最大值与最小值之差,以R表示。则:

R=最大标志值-最小标志值

1. 未分组数据的全距

对于未分组数据,在计算全距时,首先应将所有数据按大小顺序排序,然后用最大值减去最小值即是全距。

例如,在前述甲、乙两个学习小组中,甲组学生成绩的全距R=80-60=20(分),乙组学生成绩的全距R=100-30=70(分),由于R<R,在两组平均成绩相等的情况下,则甲组学生平均成绩代表性较高。

2. 分组数据的全距

数据经过统计分组之后,一般要用变量数列表示其结果。

1)单项式数列的全距

单项式数列全距的计算亦非常简单,用最后一组变量值减去第一组变量值即可。

例4-23 A班50名学生年龄分布如表4-7所示。

表4-7 某班50名学生年龄分布

则该班学生年龄的全距R=25-21=4(岁)

2)组中式数列的全距

组中式数列的全距只能近似计算,而且要求所有组必须都是闭口组。计算时用最后一组上限减去第一组下限即可。

例4-24 甲企业200个工人按日产量分组编成分配数列如表4-8所示。

表4-8 甲企业200个工人日产量分布

则该企业工人日产量的全距R=60-10=50(件)

全距计算简便,容易掌握。但极差只涉及最大和最小两个标志值,不是根据全部标志值计算的,容易受极端值的影响,不能充分说明各个标志值的具体变动情况,所以在应用时有较大的局限性。

(二)平均差(AD)

平均差是总体各单位标志值与算术平均数离差的绝对值的算术平均数,又称平均离差。用AD表示。

根据资料是否分组,平均差有简单平均式和加权平均式两种计算公式。

1. 简单平均式

当已知总体各单位的标志值,且这些标志值未经分组形成变量数列时,宜采用该种形式。其公式为:

式中,x——变量值;

n——变量值项数。

表4-9 甲、乙学习小组学生成绩平均差计算

由于AD<AD,故甲组学生平均成绩代表性较高,这与前述依据全距得出的结论相同。

2. 加权平均式

当所依据资料是在统计分组基础上所形成的变量数列资料时,宜采用该种形式。其公式为:

式中,x——各组变量值或组中值;

f——各组次数,其他符号同前。

例4-26 依据表4-7所示资料,A班50名学生年龄之间平均差计算如表4-10所示。

表4-10 A班50个学生年龄平均差计算

例4-27 依据表4-8所示资料,甲企业200个工人日产量之间平均差计算如表4-11所示。

表4-11 甲企业200个工人日产量平均差计算

从以上例子可以看出,平均差是根据全部标志值计算的,不仅仅受极端数值的影响,因此,它能综合反映总体中各单位标志值之间的离散程度。平均差越大,表明总体单位标志变异程度越大,平均指标的代表性就越低;平均差越小,表明总体单位其标志变异程度越小,平均指标的代表性就越高。

(三)标准差(σ)

标准差又称均方差,是最常用的标志变异指标,是指总体各单位的标志值与算术平均数离差的平方的算术平均数的算术平均方根,用σ表示。标志差的平方称为方差,用σ2表示。

根据资料是否分组,平均差有简单平均式和加权平均式两种计算公式。

1. 简单平均式

当已知总体各单位的标志值,且这些标志值未经分组形成变量数列时,宜采用该种形式。其公式为:

式中,x——变量值;

n——变量值项数。

表4-12 甲、乙学习小组学生成绩标准差计算

由于σ,故甲组学生平均成绩代表性较高,这与前述依据全距得出的结论相同。

2. 加权平均式

当所依据资料是在统计分组基础上所形成的变量数列资料时,宜采用该种形式。其公式为:

式中,x——各组变量值或组中值;

f——各组次数。

其他符号同前。

表4-13 A班50个学生年龄标准差计算

表4-14 甲企业200个工人日产量标准差计算

标准差与平均差一样,考虑到总体所有单位标志值之间的差异。标准差是通过对标志值与算术平均数的离差先平方最后再开平方根,来消除正负离差抵消问题的。对离差平方求平均数并开方,就恢复了原来的计算单位。标准差同其他标志变异指标比较,有较多优点,所以得到广泛运用。

全距、平均差和标准差都与平均指标的计量单位相同,也就是与各单位标志值的计量单位相同。这几种标志变异指标都是反映总体各单位标志值变异程度的绝对指标,其数值的大小还要受总体单位标志值本身水平高低的影响。依据它们中的任何一个比较两个平均指标的代表性高低时,这两个平均指标必须含义相同、数值相等。如果两个总体的平均指标数值不相等甚至含义不相同时,就不能直接依据它们比较平均指标代表性高低,而需要依据相对数形式的标志变异指标,即变异系数。

(四)变异系数

变异系数也称离散系数,是将全距、平均差或者标准差与平均指标进行对比得到的相对数、表现形式为无名数,常用百分数表示。变异系数可以克服平均指标数值不等或者含义不同的限制,来比较它们的代表性高低。

变异系数包括全距系数、平均差系数和标准差系数三种。最常用的是标准差系数,用vσ表示,计算公式如下:

例4-31 甲、乙两个农场粮食平均亩产分别为300千克、400千克;标准差分别为7.5千克、9千克。试比较两个农场粮食平均亩产的代表性高低。

因为乙农场变异系数比甲农场小,所以乙农场的平均亩产更具有代表性。如果直接比较标准差,就会得出相反而错误的结论。

(五)是非标志的平均数和标准差

是非标志也叫交替标志,是指具体表现只有两种的标志。如“企业经济类型”分为国有与非国有,“产品质量”分为合格与不合格,“学习成绩”分为及格与不及格等,均为是非标志。是非标志多属于品质标志。

要测定是非标志的变异程度,也需要计算标准差。但是品质标志不能直接计算平均数和标志差,因此需要先将其具体表现人为数量化,然后再计算。

表4-15 总体平均数和标表差计算

以上计算结果表明,是非标志的平均数就是具有某种属性的单位数在总体中所占比重;其标准差就是具有某种属性的单位数在总体中所占比重和不具有这种属性的单位数在总体中所占比重乘积的平方根。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈