某企业106名员工月工资数据如表4‐8所示,采用SPSS软件对工资数据的分布特征进行分析步骤如下:
表4‐8 某企业员工月工资数据 单位:元
(1)单击“分析”→“描述分析”→“频率”,系统弹出一个对话框,如图4‐3所示。
图4‐3 “频率”对话框
(2)把“月工资”选入变量框,单击“统计量”选项,弹出如图4‐4所示对话框,选择需要输出的集中趋势、离散程度和分布指标,如图4‐4所示,点击“继续”。
图4‐4 “频率:统计量”对话框
(3)在“频率”对话框界面,点击“确定”。输出结果如图4‐5所示。
图4‐5 描述分析输出结果
【本章小结】
本章介绍了数据集中趋势的度量、离散程度的度量、偏态与峰态的度量、使用SPSS软件对数据分布特征进行分析的基本步骤等内容。
集中趋势反映的是一组数据向某一中心值靠拢的倾向,集中趋势的度量指标主要为平均数、众数和中位数。
离散程度反映的是各变量值远离其中心值的程度,描述数据离散程度的测度值主要有异众比率、四分位差、方差和标准差等。
集中趋势和离散程度反映了数据分布的形状是否对称、偏斜的程度以及扁平程度等。偏态是对分布偏斜方向和程度的测度。峰度是对分布集中趋势高峰形状的测度。
复习思考题
1.应该从哪些方面对数据的分布特征进行描述?
2.简述班级均值、众数、众位数的特点和应用场合。
3.简述极差、四分位差、方差或标准差的适用场合。
4.什么是离散系数?它适用于什么场合?
5.什么是偏态系数和峰态系数?如何应用这两个数据描述数据分布特征?
6.什么是标准分数?有什么用途?
7.如何使用SPSS软件进行数据的描述性分析?
案例分析
案例一:股票投资的收益与风险
在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。图4‐6的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。
图4‐6 股票投资收益—风险分布
(1)你认为该用什么样的统计测度值来反映投资的风险?
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?
(3)如果进行股票投资,你会选择商业类股票还是高科技类股票?
案例二:组装方法优劣比较
一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。表4‐9是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个),问:
表4‐9 三种组装方法的产量
(1)你准备采用什么方法来评价组装方法的优劣?
(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。
案例三:组装方法优劣比较
在某地区抽取的120家企业按利润额进行分组,结果如表4‐10所示。计算这120家企业利润额的均值和标准差。
表4‐10 企业利润分布
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。