第一节 数值集中趋势测量:数值平均指标
集中趋势测定中的数值平均数经常用来说明同一总体某类社会经济现象在一定时间、地点、条件下的一般水平。一般有算术平均数、几何平均数、调和平均数和调整后平均数等。
一、算术平均数
算术平均值(Arithmetic Mean)是描述样本数据中心趋势最常用的统计量,因为它具有计算简便、稳定的优点,使用非常频繁。算术平均值是总体的标志总量与总量单位总数之比值,一般用表示。
算术平均值=总体标志总量/总量对应单位总数
按照所掌握资料是否分组,可分别计算简单算术平均数和加权算术平均数两类。
简单算术平均数是根据未经分组整理的原始数据计算的平均数,具体是将一组n个标志总量X值相加X1+X2+X3…Xn后求平均。如n个人工资平均、m个人身高平均。
在分组情况下,假定n组标志总量分别为X1、X2、X3…Xn,其相应各组样本分别为f1、f2、f3……fn个,其算术平均数为:
在不分组情况下,f1、f2、……fn都为1,就可转换为简单算术平均数。
[例3.1]某地调查了300个农户,了解各户农民家庭年纯收入情况如下,现问该地区300户农民家庭平均年收入。
表3.1 某地300农户家庭年收入(元/年)
由于是分组资料,首先需求各组代表值,这一般用组中值代表之;其次需确定什么是变量、什么是权重。本例研究农民家庭户均年收入,显然年收入为X,户数为f。于是有:
=(2500*24+7500*48+……+42500*3)/300=4530000/300
=15100(元/户)
即根据资料,计算出300户农户的年平均收入为1.51万元人民币。
人们经常计算并使用平均数,但往往对于平均数的性质并不十分清楚。比如,市区房价和郊区房价都出现了一定幅度的上升,但综合房价却下降了;再如,外资企业工人和管理人员工资都高于国资企业情况,但是外资企业的平均工资却低于国资企业人员平均工资。这是什么缘故,是否计算有误,如何解释?例如,某市区房价从年初每平方米1万涨到年底1.2万,郊区房价每平方米0.5万涨到年底0.6万;但年初市区商品房供应量为70%,郊区占30%;到年底市区商品房供应量为30%,郊区占70%;于是年初单位平均房价为0.85万下降到0.78万。怎么解释?实际上,由平均数计算公式(3.2)可见,平均数的大小不仅与标志值Xi的大小有关,而且与标志值所占比例(样本结构)有关,即平均数与总体构成密切相关。
算术平均数有如下性质,感兴趣可自行证明。
(1)各变量值与平均数离差之和为零:
(2)各变量值与平均数离差平方之和为最小值:
(3)两个独立变量代数和的均值等于两个变量均值的代数和:
(4)两个独立变量乘积的均值等于两个变量均值的乘积:
二、几何平均数
几何平均数(Geometric Mean)是n个非负数变量X1、X2…Xn连乘积的n次方根。常用以表示或计算人口、国民经济和存款等的平均发展速度、平均增长速度和平均利率等。
假定某大企业总产值每年发展速度(本金加利率)为X1有f1年,年发展速度为X2有f2年,年发展速度为X3有f3年,……,年发展速度为Xn有fn年,则这n年平均年发展速度为G,平均年增长速度为G-1。
类似,计算n年国民经济的平均发展速度和n年人口发展速度和n年银行存款发展速度等,都可用公式(3.3)计算。当f1=f2=f3=…=fn=1时,就由加权几何平均数转变为简单几何平均数。
[例3.2]某投资者持有某种股票,在2007年、2008年、2009年、2010年和2011年收益率分别为3.5%、2.2%、25.2%、-3.8%和1.5%,问2007~2011年5年平均年收益率。
解:收益率属于比率,是指在上一年的基础上增长百分比,因此不能作为算术平均数计算。应该逐年计算历年年底的收益及本金,用几何平均数计算之。
即近5年平均每年收益率为5.28%,若最初投入1万元,则5年后收入为1.293万元。若按照算术平均数计算为5.72%。
三、调和平均数
调和平均数(Harmonic Mean)是平均数的另一种形式。从计算角度而言,调和平均数是n个数X1、X2…Xn倒数平均数的倒数。调和平均数适用于平均价格、平均速度等的计算和分析。调和平均数常用如下公式进行计算,m1=m2= m3=……=mn=1时,下面的公式就由加权调和平均数转变为简单调和平均数了。
[例3.3]某食堂早中晚分三次购买蔬菜,早上购买价格为4元/500克,采购金额2000元;中午价格为3元/500克,采购金额3000元;晚上蔬菜价格为2.5元/500克,采购金额2000元,问平均蔬菜价格为多少?
平均蔬菜价格=购买总价格/购买总量
=(2000+3000+2000)/(2000/4+3000/3+2000/2.5)
=7000/(500+1000+800)=7000/2300=3.04元/500克
即该食堂该日蔬菜采购的价格平均为每500克3.04元。由此可见,调和平均数是算术平均数在分母未知情况下的变形。由相对数、平均数计算总平均数情况下,常常使用这种调和平均数。
四、调整的平均数
当样本比较多的情况下,为排除极大极小值的影响,人们往往采用调整的平均数。调整的平均数(Trimmed Mean)是将样本数据进行排序以后,按照一定比率(比如2.5%、5%和10%)去掉两端的极大、极小值,对剩下的数据求平均,得到调整后的平均数。默认的调整平均数有5%调整平均数,即两端分别去掉2.5%的样本后对剩下95%的样本求平均值。与算术平均数相比,调整平均数较少受极值的影响。
平均数中使用最频繁的是算术平均数,使用平均数时应注意形式组界与实际组界。大部分变量四舍五入取整,如温度、长度和经济变量;但有少数变量是截尾取整,如周岁年龄,在计算和解释平均数时应该十分小心。比如某人说口袋里有10元,实际意味着其有9.5~10.4元,但是某人说自己10岁,则表示其是10.0~10.999岁。因此,若三个人身高165、170、175厘米,则三人平均身高为170.0厘米;若三个人年龄为20、24、28岁,则三人平均年龄严格而言应该是24.5岁,而非24.0岁。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。