(一)收入不平等测量指标
在验证相对收入假设的研究中,涉及的两个核心变量是收入不平等与健康,这两个变量不仅在测量水平上可能存在差异(如收入不平等是县级水平,以县级基尼系数衡量,而健康变量则可能是个体水平的自报健康测量),当然也可能是在同一水平的变量。而且,可以有不同的测量指标来表示收入不平等与健康,例如已有的一些研究中在测量收入不平等时采用基尼系数、收入分布中最高10%和最低10%的比值(P90/P10)、Atkinson指数、Theil指数或Robin Wood指数等指标。
基尼系数是国际上用来综合考察居民内部收入分配差距状况的分析指标。基尼系数变动范围从0(绝对公平)到1(绝对不公平),其大小表现为洛伦兹(Lorenz)曲线和绝对收入公平线之间面积的2倍。基尼系数的优点是其常用而且直观,能用一个指标值反映收入分配的整体情况。基尼系数最大的缺点是难以反映收入分配结构,与同一基尼系数值对应的可能是不同形状的洛伦兹曲线。这个问题不仅反映在横断面的测量上,也反映于收入分配状况的纵向变化中。此外,基尼系数的可比性问题也颇受关注。一方面可能是计算方法不一致造成的,另一方面是对基尼系数大小的可接受性不同造成的。基尼系数的可获得性问题也比较突出,以跨国比较而言,往往不能得到连续的时间序列资料,也可能有全国水平的基尼系数,但却没有亚国家水平的基尼系数。我国现行的官方统计资料中并未给出基尼系数,文献中报道的基尼系数多是根据国家统计局分别给出城乡居民收入状况推算出来的,不同文献报道的基尼系数往往也存在较大差别。我国基尼系数测量的另一个问题是缺乏连续时间序列的基尼系数,而且我国存在典型的城乡二元结构,全国整体基尼系数和按城市、农村分别测算的基尼系数有很大差别,这也是应用中国基尼系数资料需要注意的问题。
P90/P10的优点是直观,而且相对基尼系数而言,能够更好地考察收入分配结构的发展变化,比较适合于纵向研究。该指标的不足是缺乏对整个收入分布中非极端分布的测量(即位于收入分布10%~90%分位的部分),而且资料的可获得性较差。
Atkinson指数变动范围0~1;最贫困者的相对位置以参数e加权,该参数测量了社会对不公平的厌恶程度。Atkinson指数必须事先确定幂数的参数值,从而掺杂了主观价值的成分,而且往往难以就此达成共识。此外,Atkinson指数不符合可加性分解原则,其可获得性也不好。
Theil指数(泰尔指数)是熵值指数(generalized entropy index)的成员,变动范围从0(绝对公平)到无穷大。具有可分解的性质,对最贫困者的相对位置进行了加权。用Theil指数测量不平等的一个最大优点是可以给出组内变异和组间变异对总变异的贡献。Theil指数和基尼系数之间具有一定的互补性。基尼系数对中等收入水平的变化特别敏感。Theil熵T指数对上层收入水平的变化很明显,而Theil熵L和V指数对底层收入水平的变化敏感。但Theil指数应用较少,而且不够直观。
Robin Hood指数也是得自洛伦兹曲线的一个测量收入不平等的指标。Robin Hood指数等于洛伦茨曲线[L(x)]与绝对公平线之间的最大垂直距离,即max[x-L(x)]。指数大小近似等于上50%分位收入人群应该转移给下50%分位收入人群的收入份额,变动范围0~1。Robin Hood指数比较直观,但忽略了50%分位上下两部分人群内收入的分布,而且该指数的可获得性也较差。
综合起来看,不同收入不平等测量指标各有其优缺点,并不存在能够完美测量收入不平等的指标,指标本身测量的准确程度也往往受限于资料来源。对不同收入不平等指标本身的评价有一些固定的原则,如Pigou-Delton转移支付原则(即如果出现收入由穷人向富人转移的情况,收入不平等测量指数应恶化)、收入规模独立原则(即如果所有居民的收入按同等比例增减,收入不平等测量指数应维持不变)、人口规模独立原则(如果各收入阶层的人口按同等比例增减,收入不平等测量指数应维持不变)等。本研究并不专门对此开展研究,更多的是从应用角度进行探讨。
不同研究在使用收入不平等指标时更多的是考虑指标的可获得性以及其对不同研究设计类型(横断面设计、纵向时间序列设计、面板数据等)的适用性。生态学研究更多的是采用已有的不平等测量指标,而多水平研究或个体水平研究则更多的是采用实际调查的收入数据进行测算。从表2-1总结的文献看,收入不平等测量工具的选用与研究结果的不同也并无任何明显关系存在,但这仅仅是从统计学角度得到的结论。从方法学的角度,不同测量工具的测量意义不同,应随着研究假设及目的的变化而合理选用。
Hou和Myles(2005)在对加拿大收入不平等和人群健康的研究中,采用了4种标准化有效测量指标和一种时常会被研究者应用但并不符合有效性标准条件的指标,以考察不同收入不平等测量指标对健康的影响[47]。常用指标包括平均对数偏差、Theil指数、中位数分布、基尼系数,不常用指标是变异系数。该研究认为,多种指数可以在不同收入水平上敏感测量收入转移,平均对数偏差和Theil指数对收入分布底层的收入转移较为敏感,基尼指数和中位数分布对中间收入分布的收入转移较为敏感,变异系数对高端收入分布的收入转移较为敏感。研究者在进行多因素回归模型分析时,分别使用5种指标测量社区收入不平等,并按照测量结果将社区收入不平等分为5个级别:低、较低、中、较高、高,形成哑变量。结果显示,在基于单水平模型分析收入不平等与健康的关系时,使用5种测量工具进行的社区收入不平等分类均呈现显著统计学意义;纳入社区水平后,显著性均消失;进一步纳入社区中位收入后,显著性均恢复;再将社区中大学学历所占比例纳入模型,仅Theil指数、基尼系数和中位分布测得的收入不平等存在显著性差异。研究认为,在大多数情况下收入不平等的分布在各个收入层级对健康的影响应该是一致的,故各测量变量对健康影响的显著性会呈现一致性变化,而大学学历所占比例有可能和使用部分测量工具进行的收入不平等分类存在一定的共线性。
(二)健康变量
从已有的关于收入不平等的健康效应研究中,健康变量的选择也呈多样化,既有人群健康综合测量指标,如期望寿命、死亡率(如婴儿死亡率或人群死亡率),也有个人健康测量指标,如自报健康或肥胖、是否吸烟、血压值等,但自报健康属于通用测量(generic measure)指标。已有文献在健康变量选择上以期望寿命、婴儿死亡率和自报健康为主,也有部分研究根据研究假设的需要,采用多种健康测量指数评价收入不平等对健康的影响。
大量已经报道的相关研究成果是以期望寿命和自报健康为健康结果变量的研究以及国际上以婴儿死亡率为健康结果变量的研究,跨国研究多采用人群健康综合评价指标,而国内的研究较多应用人群健康综合评价指标和自报健康指标。
从表2-1对文献的总结来看,各种健康测量变量与最终结果并无必然联系,仅能大致看出,以婴儿死亡率和自报健康状况作为健康变量的研究出现阳性结果(收入不平等对健康存在独立效应,具有显著的统计学意义)的比例似乎较高,以期望寿命为健康指标的研究出现阳性结果的比例较低。但无论使用婴儿死亡率、期望寿命、自报健康状况,还是其他健康指标作为结果变量,都可能得出与收入不平等有关或者无关的结果;而且,各研究的背景、研究人群、研究方法各异,要试图判断出不同研究结论与所选择的健康指标类型的关联存在很大难度。以下具体就婴儿死亡率、期望寿命和自报健康这3个变量选择重点文献展开阐述。
1.婴儿死亡率
婴儿死亡率(IMR)是指婴儿出生后不满周岁死亡人数同出生人数的比例,以千分比表示。它是反映人群健康水平和社会经济发展水平,尤其是妇幼保健工作水平的重要指标。
Schell等在2007年发表了一项包括152个国家的研究[48],采用多因素线性回归研究影响婴儿死亡率的社会、经济决定因素,是近年来发表的收入不平等与婴儿死亡率关系的较为完善的研究之一。该研究试图检验婴儿死亡率与社会经济学因素的关联,并且考察该关联在高收入国家与中低收入国家的区别。
研究资料均来自世界银行的2003年世界发展指数数据库(World Development Indicators 2003),避免了不同资料来源统计方法不同造成的影响,并且排除了数据全部或者部分缺失的国家。研究采用的变量包括婴儿死亡率、人均国民收入(GNI)、年轻女性文盲率、基尼指数、贫困率、公共卫生费用,各因素之间无明显的共线性问题。研究使用了散点图和Pearson相关系数分别测量各解释变量与婴儿死亡率的关联,然后通过多元线性回归测量5个解释变量的各种组合所带来的结果,并通过残差分析对模型拟合情况进行评价,最后对不同收入水平国家的数据分别拟合模型。结果发现,除高收入国家之外,收入不平等和人均GNI以及年轻妇女文盲率对婴儿死亡率具有独立效应。在模型中纳入妇女文盲率后,收入不平等对低收入国家婴儿死亡率的独立效应消失,但仍然是中等收入国家婴儿死亡率的独立预测因素。
2.期望寿命
期望寿命是常用的人群健康综合测量指标,可得性也较好。Moore(2006)的研究重点考察了收入不平等与期望寿命的关联,以及该关联是否与国家分类有关[41]。该研究将107个国家进行不同的分类,按照收入高低分为高收入国家与低收入国家,按照是否OECD成员分为OECD国家与非OECD国家,按照在资本密集型商品的贸易中是否与其他国家存在联系分为核心国家(紧密的横向和向下纵向联系)和非核心国家以及非边缘化国家和边缘化国家(稀疏的横向联系和紧密的向上纵向联系)。并且在Rodgers建立的偏好模型基础上发展了能够测量不同国家分类影响的模型,对联合国和世界银行的相关数据先进行总体分析,再按照不同国家分类进行分析。结果发现,收入不平等在前3种国家分类中作用甚微;仅有一个模型显示,在基尼系数大于45%时,边缘化国家的期望寿命显著低于非边缘化国家。
3.自报健康
自报健康是指调查对象对自身健康的主观感受,常作为客观健康指标的补充。研究认为,自报健康是医疗、行为、心理、社会等因素之外的能够预测死亡率的独立因素[49]。自报健康测量由患者或调查对象独立完成,通过患者或调查对象自报(self-report)或自评(self-assessed,self-rated),包括身体和心理等各方面的健康结果实现对健康状况的评价。典型的如向患者询问:您的总体健康状况怎样?很好,好,一般,差,很差。广义上自报健康测量工具又分为通用测量(generic measure)量表和特定疾病测量(disease-specific measure)量表,两者的区别在于特定疾病测量量表是针对某一特定类型疾病人群而设计的量表,如用于乳腺癌患者的线性模拟自我评价量表(linear analogue self-assessment,LASA)、用于全面评价癌症患者生存质量的癌症康复评价系统(cancer rehabilitation evaluation system,CARES)等。通用测量量表则没有这样特别的针对性,目前已有的一些比较著名的通用自报健康测量工具:诺丁汉健康量表(Nottingham health profile,NHP)、疾病影响程度量表(sickness impact profile,SIP)、功能限制量表(functional limitations profile,FLP)、Dartmouth COOP量表、美国医学结果研究(medical outcomes study,MOS)组开发的SF-36、欧洲范围内广泛应用的EQ-5D,以及WHO开发的WHOQOL等[50-52]。
Christopher等(2003)采用前瞻性队列研究对1994、1996和1998年加拿大都市地区自报健康状况与相应1994年加拿大全国人口健康调查资料中收入不平等、家庭收入和个人特征变量的关系进行研究[40]。自报健康状况是通过调查对象对5个自我健康评定选项——极好、非常好、一般、差的选择作出的判断;不同选项用不同数字表示,数字越大代表结果越好。研究还通过测量收入不平等与MacMaster健康效用指数(MacMaster health utility index,HUI)来验证结果的稳健性。收入不平等采用地区总收入中位数分布表示。家庭收入、城市规模、家庭规模、人口学特征、教育状态、健康行为、社会网络和基线健康状况等作为控制变量纳入模型。结果发现收入不平等与自报健康状况没有联系,家庭收入与自报健康状况的差别存在联系。
(三)其他控制变量
使用控制变量有利于消除混杂因素对收入不平等与健康之间关系测量的影响。表2-1所列举的大多数研究均使用了控制变量。常用的控制变量有收入和教育。其中,前者常常使用人均GDP、个人收入、家庭收入等变量表示;后者常使用教育获得率、文盲率、入学率等变量表示。除此之外,还有研究将人口学因素、健康、政治、保险、就业等相关变量纳入构建模型中进行控制,具体如性别、年龄、国民卫生费用、吸烟率、民主建立时间、压迫程度、社会保险、医疗保险、职业以及劳动市场参与情况等。
通过纳入控制消除混杂因素,文章的结果会更为可信。但合理纳入控制变量似乎更为重要,逻辑上或常识上毫无关联的变量或者与验证研究假设无关的变量纳入进模型以及控制变量与考察变量之间可能存在的共线性问题,会严重影响研究的结论。
例如Verdiell(2003)等进行的研究中对控制变量的选择就可能存在共线性问题[53]。该研究为一项对1975~2000年西班牙婴儿死亡率决定因素进行的研究,作者首先建立了理论模型,认为婴儿死亡率受经济、社会、人口学因素共同影响。其中,经济因素包括收入不平等、劳动参与率、妇女劳动参与率;社会因素包括生育率、母婴教育、粗结婚率;人口学因素包括每10万人口医师数、每1万人口护士数以及人口密度。研究阐述了使用每个变量的理由,并对所有解释测变量取对数后纳入线性回归分析模型进行分析。在变量间可能存在较严重共线性问题的情况下,研究得出的收入不平等对西班牙婴儿死亡率有独立效应的结论就可能欠说服力。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。