第三节 变量数列分布偏度与峰度的度量
平均指标和标志变异指标分别描述了变量数列分布的集中趋势和离中趋势,但要全面了解数据分布的特点,还要知道其分布曲线是否对称、偏斜的程度及分布曲线尖峭程度等。偏度与峰度就是对变量数列分布的这些特征做进一步的描述。
一、偏度的度量
偏度(Skewness)反映了分布的偏斜方向以及偏斜的程度,常用偏度系数来度量。偏度系数的计算方法有很多,这里仅介绍最常用的一种,其计算公式为:
式中:Sk为偏度系数;σ3为标准差的三次方;f为权数。
从上式可以看出,当分布对称时,离差三次方后正负离差可以相互抵消,因而Sk的分子等于0,则Sk=0;当分布不对称时,正负离差不能抵消,就形成了正或负的偏度系数。当Sk>0时,可以判断为正偏或右偏;当Sk<0时,可判断为负偏或左偏。Sk的绝对值越大,表明偏斜的程度就越大。
例3-14:依据表3—11中的资料,计算某公司50名员工月工资水平的偏度系数。
表3-11 某公司员工工资水平及偏度系数计算表
由计算结果可知,偏度系数为正值,说明该公司员工月工资的分布为右偏分布,即多数员工的工资低于平均水平,且偏斜程度较大。
二、峰度的度量
峰度(Kurtosis)反映了分布曲线的尖峭程度,一般用峰度系数来度量,其计算公式为:
式中:Ku为峰度系数;σ4为标准差的四次方;f为权数。
一般来说,当峰度系数Ku>3时称为尖峰分布,说明其分布曲线较陡峭;当Ku<3时称为平峰分布,说明其分布曲线较平坦。
例3-15:由表3-11中的数据计算工资水平分布的峰度系数。
通过计算得:
由于Ku=4.19>3,故该公司员工工资水平为尖峰分布,也就是其分布曲线较陡峭。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。