首页 百科知识 损失资料的描述

损失资料的描述

时间:2024-04-05 百科知识 版权反馈
【摘要】:某人想要研究男性和女性驾驶员发生致命车祸的情况,其得到以下两个资料:在发生致命车祸的39000名驾驶员中有男性36700名,女性2300名。一般损失资料数据值以横轴表示,各组发生的频数或频率以纵轴表示。集中趋势指标是指对全部数据具有代表性的一种数值,可以认为是损失资料所处的“中心”。

【任务情景】

某人想要研究男性和女性驾驶员发生致命车祸的情况,其得到以下两个资料:

(1)在发生致命车祸的39000名驾驶员中有男性36700名,女性2300名。

(2)造成致命车祸驾驶员的性别如下图所示:

图3-1

你觉得这两种描述方式哪一种更直观?

【任务描述】

对损失资料进行整理后,为了使得损失数据中隐含的规律以直观的呈现,我们需要通过运用表格、图形或是其他一些指标对这些损失资料进行描述,我们可以用哪些常见图形来描述? 在用数字来描述的时候,又需要考虑哪些评估指标呢?

【知识链接】

一、损失资料的图形描述

通过对资料分组,资料分布的重要特征就看得更清楚了。但是图形描述将会使这些特征更加鲜明。下面将根据表3-1中的数据讨论普遍使用的条形图、圆形图、直方图、频数折线图和累积频数分布图。如何选用这些统计图取决于数据的特性和风险管理决策的需要。

(一)条形图

条形图是按宽度相同的垂直或水平条形线绘成的。它的长度与每一组数据的频率成正比。使用条形图主要用于比较不同时期的损失状况或不同类型之间的某些变动数量。例如全国1998年至2006年地质灾害造成的直接经济损失情况,图3-2是根据表3-6绘制的条形图。

表3-6 全国1998年至2006年地质灾害造成的直接经济损失

图3-2 全国1998年至2006年地质灾害造成的直接经济损失(条形图)

(二)饼状图

饼状图用来比较整个组成部分的相对量,整个圆被分割成若干扇形,每个扇形面积代表一个组成部分,如任务二中的案例,某出租车公司每次事故损失金额分布的饼状图,如图3-3所示。

图3-3 某出租车公司每次事故损失金额分布(饼状图)

(三)直方图

直方图是表现分组资料的最普遍的一种图形,直方图是一个在条形图之间没有间隔的条形图,每个长方形的面积要与该组的频数成正比。一般损失资料数据值以横轴表示,各组发生的频数或频率以纵轴表示。横轴可以从任何合适的数字、位置开始,纵轴一般从0开始。图3-4是表3-3相应的直方图。

图3-4 某出租车公司每次事故损失金额分布(直方图)

(四)频数折线图

将上述直方图中每个长方形的顶端的中点(即组中值)连接起来,形成频数折线图。如果不绘直方图,小圆点则放在每个组中值相应的高度上。如果观察值很多,组距极小,在极限的情况下,折线就过渡为一条光滑曲线,成为连续型频数分布曲线。在极端情况下,频数由概率表示,就得到了概率分布曲线,这类曲线对于定量分析来说,非常重要,如图3-5所示。

图3-5 某出租车公司每次事故损失金额的频数折线图

实际上由于收集的数据个体总是有限的,所分的组数又不能很多,得到真的概率分布曲线是很困难的,但是如果尽可能多地取数据,使组分得更细,再画出频数分布折线图,并以此为基础画出一条平滑的曲线使它与横轴之间的面积不变,那么就可以得到近似于真的概率分布曲线了。

(五)累积频数分布图

累积频数分布图又叫做累积曲线,很多累积曲线呈“S”形。正如直方图和频数多边形一样,累积频数分布图也是画在一对相互垂直的轴上,横轴代表损失值,纵轴上的值用累积频数来表示,表明发生小于这一损失额的事件个数,如图3-6所示。

图3-6 某出租车公司每次事故损失金额的累积频数分布图

目前,使用折线图、柱状图及其他的图形化数据表示方式已经变得越来越重要,通常一个简单的图表就能说明数段文字才能说明的情况,而计算机辅助图表设计也使画图变得更加方便。

二、损失资料的数字描述

为了进一步简化频数分布所提供的信息,并概括出重要的情况。我们需要借助两类指标,一类是描述集中趋势的指标,称为位置量数。集中趋势指标是指对全部数据具有代表性的一种数值,可以认为是损失资料所处的“中心”。另一类是表明离散趋势的指标,称为变异量数。离散趋势指标是表示损失数据如何从“中心”扩散的。为以后表述方便,我们将所收集到的损失资料称为样本,其中每一个数据值称为观察值。

(一)位置量数

1.全距中值

全距中值是样本中最大值与最小值的中心数值,即

表3-1所示的样本中,最小值为1.3,最大值为23.5,因此

2.众数

众数是指一个样本中出现次数最多的观察值。假如每一观察值出现的次数都相同,那么就没有众数。表3-1所示的样本中,每个观察值均只出现一次,因此该样本是没有众数的。如果样本中只有一个众数,则该样本称为单峰的。如果有两个或者更多的观察值出现的次数相同,且它们比其他任何观察值出现的次数都多,那么众数就不止一个,这个样本称为多峰的。

想一想

样本一: 1,2,3,4,4,5,5,5,6,7,8,8,9

样本二: 1,2,2,3,3,4

它们的众数分别是什么?

对经过分组的样本来说,则要考虑哪一组的频数最大。如果某一组的频数最大,表明损失数额常常落在这一组内,它就是分组的众数组。此时的众数常用众数组中的中点来估值。如果有一个以上的众数组,那么我们就认为不存在众数。表3-4中众数组就是1.25~5.75,众数为3.50。

3.中位数

假设数据资料已经进行了排序,而观察值的个数是奇数时,则中位数是位于正中间位置的观察值。如果观察值的项数是偶数,则中位数是两个中间观察值之间的中点数值。例如表3-2样本中共有观察值35个,则第18个值8.9就是该样本的中位数。如果把第一个值1.3去掉,剩下的样本中位数为

4.算术平均数

最常用的位置量数就是算术平均数,简称为平均数,其计算方法一般可由下列公式求出:

公式一 如果有n个观察值,X1,X2…Xn,则算术平均值为:

练一练

5次盗窃损失的金额为1500、1800、1850、2000、2500元,则其平均损失额是多少?

公式二 如果资料已经整理成组,以mi表示第i组的组中值,fi表示该组的频数,则算术平均值为:

练一练

某公司5年内被盗窃的损失整理后如表3-7所示。

表3-7 某公司5年内被盗窃的损失 单位: 元

请计算这家公司5年内被盗窃的平均损失。

在风险分析中,事故损失的平均指标能提供很多有用的信息。

(1)利用损失平均指标与同类型企业进行比较,可以了解本企业在风险管理方面的水平,找出差距,决定对策。

(2)与国家或部门颁布的有关标准进行比较,为风险评估提供依据。

(3)风险管理者可利用本单位不同时期的损失平均指标的变化,来分析损失的发展趋势,并通过发展趋势归纳出损失发生的规律。

(4)利用平均指标还可以分析与事故发生的有关因素的影响程度。如对汽车致损事故,可以计算出喝酒后开车人均事故次数与不喝酒开车人均事故次数,然后进行对比分析,显然,前者大大高于后者。同样,可以计算出女司机人均事故次数与男司机人均事故次数,其数据差异不大。由此可以得出这样的结论,酒后开车是发生车祸的主要原因之一,而车祸与司机的性别关系不大。

(二)变异量数

想一想

甲、乙、丙三家超市在三个月内被盗窃的损失分别为: (单位: 元)

甲: 660,660,660,670,670,670,680,690

乙: 520,530,610,670,710,720,780,820

丙: 430,440,500,540,670,900,910,970

试比较三家超市被盗窃的风险。

通过计算我们发现,三家超市被盗窃损失的平均数均为670,这表明三家超市的平均损失额是一样的。但很明显,三家超市的风险是不一样大的,算术平均数抵消了偶然因素对各标志值的影响,消除偶然性形成的差异,突出了必然因素的作用。因此我们还需要其他指标来表示资料的离散程度,这样才能较完整地说明三家超市的被盗损失风险特征及与其他超市的区别。这种指标就是变异量数或离散量数,在风险管理中选用的变异量数有全距、方差、标准差以及变异系数等。只有把平均指标和变异指标综合起来分析,才能得到全面的风险信息。

1.全距。全距是最简单的变异量数。对于一个样本,全距等于最大观察值与最小观察值之差。如上述案例中甲超市损失数据的全距是690-660=30,乙超市损失数据的全距是820-520=300,丙超市损失数据的全距是970-430=540。该指标尽管只考虑资料的两个端点值,忽略了很多重要情况,但仍在一定程度上反映了全部损失数据的离散程度。

2.方差。方差是各个数据与平均数之差的平方和的平均数。其计算方法有两种:

针对上述案例,我们分别计算甲、乙、丙三家超市损失的方差:

公式二: 如果已经进行了分组,则方差:

下面利用练一练中某公司5年内盗窃损失的例子来计算方差:

表3-8

3.标准差。标准差也叫做均方差,它是方差的算术平方根。

4.变异系数。变异系数是位置量数与变异量数的综合量数,它是在平均值不等的情况下通过系数计算对比风险程度的。其计算公式为:

练一练

5次盗窃损失的金额为1500、1800、1850、2000、2500元,计算方差、标准差和变异系数。

通过上面的分析,可以得出,只有把平均指标与变异指标综合起来进行分析,才有可能从量上确定风险的大小。对于一个风险管理者来说,若过去每次损失的次数都一样,则能用平均损失精确预测下一年度的损失,就可以通过周密考虑将这些损失作为一种经营费用来处理,并可认为企业无风险。但最令风险管理者不安的是,标准差或差异系数很大,即过去的损失资料表明,每年的损失值相差很大。因此,风险管理者不可能精确地预测下一年度的损失。这时,企业面临的风险很大。在实务上,有这么几种特殊情况:

(1)平均损失大、标准差或差异系数很小,不能自己承担。

(2)平均损失很小、标准差或差异系数大,该情况要作具体分析,才能作出明确判断。

(3)平均损失很小、标准差或差异系数亦小,企业面临的风险小,无须转移。

上面介绍的情况比较特殊,实际情况往往介于这些特殊情况之间。另外,所谓损失大或损失小,其“大”、“小”的划分取决于企业的财务状况。如同一损失值,对大企业来说,可能认为是小损失,而对小企业来说,则可能认为是大损失。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈