模块一 公共卫生学的基础知识
项目一 统计学在眼视光学中的应用
学习目标
◆掌握 眼视光学领域中常用的统计描述指标、统计推断的方法及其应用条件。
◆熟悉 统计学中的几个基本概念;眼视光学领域中资料的收集与处理,并能正确区分不同类型的资料。
◆了解 统计学的基本概念及在眼视光学领域中的意义。
◆基本技能 能够对不同类型的资料进行收集、整理、分析,同时会用统计表与统计图表达统计分析结果,结合工作实际得出结论;培养学生逻辑分析及推断能力、自主学习能力。
问题引导
1.已知某高等职业院校有4 993名学生,其视力情况如何?
2.某视光医生研究一种矫正近视的眼镜,其效果如何?
3.郑州市白内障患病率与上海市白内障患病率是否相同?
4.如何分析某大学2002~2012年新生视力情况?
卫生统计方法是运用数理统计的原理和方法,研究居民健康状况、医药卫生实践、卫生服务领域和医学科学研究的一门应用学科。通过对此领域资料的收集、整理、分析与推断,有利于我们科学、客观地认识事物的本质特征与规律。医学领域中的很多问题离不开卫生统计学,如对某种眼病危险因素的评估、某措施对某种眼病防治效果的评价、疾病不同地区患病情况分析等。同样,眼视光学中,对盲与低视力、眼轴、眼压、视力等的分析与比较也需要卫生统计学的基本理论与方法。
任务一 统计学的基础知识
一、几个基本概念
1.总体与样本 总体(population)是根据研究目的所确定的同质的观察单位的全体。如研究某市儿童的盲与低视力情况,某市所有儿童构成一个总体。个体(individual)是研究的最基本单位,又称观察单位。有时总体中观察单位数是有限的,称为有限总体。若总体中观察单位数是无限的,称为无限总体。
样本(sample)是从总体中随机抽取的部分个体。随机是指总体中的每一个观察单位具有同等的机会被抽取到样本中。这种从总体中抽取样本的过程称为抽样(sampling)。该样本所包含的个体数目,称为样本含量或样本大小。研究某市儿童的盲与低视力情况,我们从该市的所有儿童中随机抽取2 000名儿童进行研究,这2 000名儿童就是一个样本,其样本量为2 000。
为保证样本能够正确反映总体情况须注意:①对总体要有明确的规定;②总体内所有观察单位必须是同质的;③在抽取样本的过程中,遵循随机化原则;④要有一定的样本量(样本含量足够大)。
2.误差 是指各种原因导致的观测值与真值之间的差异,主要有系统误差、随机测量误差和抽样误差。
(1)系统误差(systematic error):由确定的原因所引起的测量值与真值之差。如仪器不准确、检查者掌握的标准过高或过低、所引起观测值单向偏大或偏小。系统误差可以避免。
(2)随机测量误差(random error):又称偶然误差,是指由于偶然的因素导致同一观察对象多次检测结果的不完全一致。该误差无固定方向,也不可避免。但可通过培训观察人员、严格规范操作等措施将该误差降到最低范围。
(3)抽样误差(sampling error):是指由于抽样而引起的样本指标与总体指标或样本指标与样本指标之间的差异,统计学上称为抽样误差。它是由于总体中各观察单位间存在个体变异引起的。一般来讲,样本越大,则抽样误差越小,样本特征就越接近总体,用样本推断总体的精确度越高,反之亦然。由于个体变异是客观存在的,因而抽样误差是不可避免的,但是通过增加样本含量可减少抽样误差。如从某地随机抽取1 000名健康成年人,其平均眼轴长度为24.5mm,这一样本均数不一定完全等于该地区所有健康成年人的平均眼轴长度。
3.概率(probability) 是用来描述随机事件发生可能性大小的度量指标。如事件A发生的可能性大小,即称为事件A的概率,常记为P(A),或简记为P。取值范围为0≤P≤1。随机事件的概率为0<P<1。事件的P值越接近1发生的可能性越大;P值越接近0发生的可能性越小;必然发生的事件概率为1,不可能事件的概率为0。习惯上常将P≤0.05或P≤0.01的事件称为小概率事件,表示该事件发生的可能性小于或等于0.05。通常将其作为事物间有无统计学意义的界值标准。如在医学文献中经常会看到P>0.05,P<0.05或P<0.01等,以表达统计分析结果的可能性。
知识拓展与自学指导
参数与统计量
描述总体特征的有关指标,称为参数(parameter),用希腊字母表示。如总体平均数(μ)、总体标准差(σ)和总体率(π)等;描述样本特征的有关指标,称为统计量(statistic),用拉丁字母表示。如样本均数()、样本标准差(S)和样本率(p)等。如研究某地12岁男孩身高的情况,该地所有12岁男孩作为观察对象,得到的身高均数为参数。若进行抽样研究,用随机的方法从总体中抽出一部分12岁男孩,计算出的身高均数为统计量。
二、统计资料的类型
根据观察单位的某项特征的不同,将视光学领域中的统计资料分为计量资料、计数资料和等级资料。
1.计量资料(measurement data) 又称数值变量,是指用定量方法测量每个观察单位某项指标量的大小,它的取值是定量的,表现为数值大小,一般有度量衡单位。如身高(cm)、体重(kg)、眼轴长度(mm)、眼压(mmHg[1])等。计量资料常用平均数、标准差、标准误等指标进行描述;用t检验、u检验、方差分析、相关与回归分析等统计方法做资料的比较和分析。
2.计数资料(count data) 是将观察单位按某种属性或类别分组,然后分别对各组观察单位的个数进行计数所得资料。此类型资料一般无度量单位。如血型分为A型、B型、AB型、和O型,某地小学生近视人数。计数资料常用相对数指标进行描述;用率的u检验、卡方检验等统计方法做资料的比较和分析。
3.等级资料(ordinal data) 是将观察单位按某种属性或类别的程度等级顺序分组,然后分别对各组观察单位的个数进行计数所得资料。各类别之间存在程度上的差别和等级顺序关系,如盲和低视力分为1~5级,疾病治疗结果分为痊愈、显效、好转、无效,尿糖检测结果分为-、+、++、+++、++++等。
根据不同的研究目的,计量资料、计数资料和等级资料之间可以互相转化。如某人群视力测量所得资料是计量资料;若根据其视力情况分为近视患者组、未近视组,分别计数各组人数,则为计数资料;若将近视患者根据眼球屈光度数值将患者分为低度近视眼组(小于-3.00D)、中度近视眼组(-3.00~-6.00D)和高度近视眼组(大于-6.00 D),分别计数各组患者人数,为等级资料。
三、统计工作的基本步骤
卫生统计工作一般分四个步骤,即先有一个精密、完善的设计,然后根据设计的要求搜集资料,整理资料和分析资料。这四个步骤是相互联系、前后呼应、密不可分的整体。后三步是卫生统计工作的三个基本步骤。
1.统计设计 是研究中最关键的一步,其设计的好坏将影响以后工作实施是否顺利及工作质量。其主要内容是根据研究目的,结合专业要求对资料搜集、整理和分析全过程进行总的、周密的设计和安排,以保证结果的准确性、严密性和可重复性。同时对采用何种统计指标与统计方法,预期试验结果都要考虑设计。统计设计是整个研究过程的总体规划,一个好的统计设计可以节省人力、物力和时间,取得更多的较为可靠的资料。
2.搜集资料 是根据研究目的及统计设计的要求,及时取得完整、准确的原始数据的过程。这是保证统计分析结果正确的重要一步,是进行资料整理与分析的前提与基础。眼视光工作过程中常见资料来源:医疗卫生工作记录、视光门诊日常记录、视力检查结果、专题调研等。
搜集资料过程中须注意资料的完整、准确、及时。完整首先是指研究单位数量和研究对象的完整,即所有研究对象不能遗漏,也不能重复;其次指所有研究项目和内容都应填写记录,不能遗漏、重复。准确是指填写的项目应界限清晰、项目之间无矛盾、无重复,保证资料真实可靠。及时是指调查和实(试)验应在规定的时间内完成,不能任意拖延。否则资料可能无法反应特定时间的具体情况。只有获得完整、准确的原始资料,才能得出科学的结论。
3.整理资料 是根据统计设计的要求,对搜集到的原始资料进行有计划、有目的的科学加工,使其系统化、条理化,以便进一步进行统计分析的过程。整理资料过程中不同工作环节过程均要检查核对。
4.分析资料 是将整理好的资料,按照设计的要求,运用统计指标进行描述、运用统计方法进行统计推断,并结合专业知识得出统计结论,以阐明事物的内在规律与本质特征。有时可选择恰当的统计表与统计图将统计结果直观形象地表达出来。
统计描述(descriptive statistics)就是应用统计指标及统计表、统计图描述资料的某些特征,为进一步做统计推断奠定基础。统计推断(inferential statistics)的目的是由样本信息推断总体特征。因此,统计推断是统计学的主体。它是根据研究目的和资料性质,利用样本信息对总体特征或性质进行估计和推断的统计方法,包括参数估计和假设检验。分析资料时应注意,不同资料类型,不同分析目的,使用的统计分析方法不同。
归纳总结与思考
卫生统计学是运用数理统计的原理和方法,研究居民健康状况、医药卫生实践、卫生服务领域和医学科学研究的一门应用科学。常用的基本概念有总体与样本、误差和概率。工作实践中常见的资料分为计量资料、计数资料和等级资料。统计设计、收集资料、整理资料和分析资料是统计工作的基本步骤。
学习检测
1.列举实例解释说明总体与样本的含义。
2.列表比较不同类型的资料特点?
3.工作实践中如何才能正确区分不同类型的资料?
4.调查某市大学生的近视情况,所得资料是何种类型的资料?
5.表1-1所表达的资料为何种类型的资料?
表1-1 某地某年不同职业人群近视发病率
任务二 计量资料的统计分析
统计分析包括统计描述和统计推断两大部分内容,统计描述是分析的基础。常用的统计描述指标有集中趋势指标与离散趋势指标两大类。
一、统计描述
(一)集中趋势指标
集中趋势指标是描述集中在某一位置水平的变量值。对计量资料进行分析时,经常用平均数。平均数(average)是用来表示一组性质相同的计量资料的集中位置或平均水平的指标体系。它常作为一组资料的代表值,使资料产生简明概括的印象,又便于进行组间的比较。常用的平均数有算术均数、几何均数、中位数。
1.算术均数(arithmetic mean) 简称均数(mean),总体均数用希腊字母μ表示,样本均数用拉丁字 母(读作eiksba)表示。均数适用于对称分布资料,尤其是正态分布资料,是医学研究中最常用的平均水平指标。
均数的计算方法有直接法和加权法。
(1)直接法:用于样本含量较少时(n<50),其公式为:
式中,X1,X2,…,Xn为各观察值;n为样本含量,即观察值的个数;希腊字母∑(读作sigma)表示求和。
例1 10名8岁小学一年级轻度近视儿童的前房深度分别为3.20,3.82,3.61,3.78,3.92,3.91,3.42,3.81,3.56,3.81(mm),求其平均水平。
答:这10名8岁儿童的前房深度平均水平为3.69(mm)。
(2)加权法(weighting method):也称为频数表法。当观察值个数较多时(n≥50),用直接法比较麻烦且容易出错,为计算方便,可先编制频数表,再用加权法求均数。加权法的计算公式为:
式中,X1,X2,…,Xn与f1,f2,…,fn分别为频数表资料中各组段的组中值和相应组段的频数。组中值是指某组段的下限与相邻较大组段的下限相加除以2。
加权法计算较为复杂,不做过多介绍。随着计算机和数据库技术的广泛应用,给大样本统计分析带来较大方便,尤其是统计软件(如SPSS、SAS)的普及,利用SPSS、SAS等数据库技术或统计软件进行样本均数和标准差计算非常简便和准确。首先建立数据库,即将数据录入计算机,然后采用相应的统计分析软件进行统计分析,得出相应的均数及其他相应统计指标。
应用均数时须注意的问题:均数用来描述一组变量值的平均水平,这些变量必须是同质的;均数适用于呈正态或近似正态分布的资料,因为它位于分布的中心,最能反映分布的集中趋势;对于偏态分布资料,可用几何均数、中位数等描述;均数只能反映数据集中趋势,对正态或近似正态分布资料,应结合离散趋势指标标准差来全面反映其分布的特征。
问题引导
检测10例葡萄膜炎患者的血清抗弓形虫抗体效价,依次为1∶4,1∶4,1∶4,1∶16,1∶16,1∶16,1∶16,1∶64,1∶64,1∶256。若说明其平均抗体滴度,能选用算术均数吗?为什么?
2.几何均数(geometric mean) 用G表示,适用于数据经过对数变换后呈正态分布的资料和观察值之间呈倍数变化(等比关系)的资料,如某些疾病的潜伏期、抗体滴度、平均效价等。
几何均数的计算方法有直接法和加权法。
(1)直接法:用于样本含量较少时(n<50),其公式为:
式中,∑lgX为变量值取对数后的和,lg-1为反对数符号。
例2 5人的血清效价分别为1∶10,1∶100,1∶1 000,1∶10 000,1∶100 000,求平均滴度。
先求平均效价的倒数:
答:这5人的平均血清效价为1∶1 000。
(2)加权法 当观察值个数较多时(n≥50),先列频数表,再计算,其公式为:
几何均数的应用与特性:
1)几何均数常用于呈等比数列的资料,即变量值呈倍数关系或近似倍数关系时,如血清中抗体滴度和血清凝集效价等;还可用于对数正态分布或近似对数正态分布的资料,如某些传染病的潜伏期。
2)计算几何均数时应注意:①观察值中不能有0,因为0不能与任何其他值呈倍数关系;②不能同时有正值和负值,若全是负值,计算时可先除去负号,得出结果后再加上负号。
3.中位数(median) 是将一组观察值由小到大按顺序排列,位次居中的变量值即为中位数,用M表示。适用于描述偏态分布资料的集中位置,它不受两端特大值及特小值的影响。当一组变量值呈偏态分布时,用中位数表示集中趋势比均数更为合理。
直接法:当例数不多时,将观察值由小到大排列,按公式1-5或公式1-6计算。
式中,n为样本例数,为变量值按顺序排列后的位数。
例3 9只近视眼的中央角膜厚度(单位mm),分别为0.46,0.48,0.51,0.54,0.56,0.49,0.50,0.54,0.53,试求中央角膜厚度的中位数。
本组数据为奇数(n=9),第(n+1)/2个数值即为中位数,即第5个数值0.5mm为中央角膜厚度的中位数。
(二)离散趋势指标
离散趋势指标就是用来描述计量资料的变量值之间参差不齐的程度,即离散程度或变异度。两组学生验光技术考试成绩分别为:
甲组:60,74,78,80,90,96,100。
乙组:78,80,86,88,88,90,92。
两组的集中趋势可用来描述。均为86分,单从集中趋势指标可说明两组数据的分布特征是相同的,但这两组数据不尽相同,甲组各数据离均数的距离远,而乙组各数据离均数近。可见平均数只反映数据的集中趋势,只有把集中趋势指标和离散趋势指标结合起来才能全面反映计量资料的分布特征。常用的变异指标有极差、方差、标准差、变异系数。
1.极差(range) 又称为全距,简记为R,是一组同质观察值中最大值与最小值之差。它反映了个体差异的范围,极差大,说明变异度大;反之,极差小,说明变异度小。不足之处有:只考虑最大值与最小值之差异,不能反映组内其他观察值的变异度;样本含量越大,抽到较大或较小观察值的可能性越大,则全距可能越大;即使样本含量不变,全距的抽样误差亦较大。因此极差应用较少。
2.方差(variance) 简记为σ2或S2,为全面考虑观察值的变异情况,克服全距的缺点,可计算总体中每个观察值X与总体均数μ的差值(X-μ)之和,即∑(X-μ)。但由于正负抵消,同一组数据的离均差总和会等于0,即∑(X-μ)=0,不能反映变异度的大小,用离均差平方和∑(X-μ)2(sum of squares,SS)则可避免正负抵消的因素。但∑(X-μ)2的大小,除了受资料离散度的影响外,还与变量值的个数N的多少有关,当观察值数量很多时,即使资料的离散度不大,可其总和却很大,这不能反映资料间的离散度。若除以N求其平均数,得方差(variance,σ2),即,就可消除观察值个数的影响。方差越小,资料的离散程度越小;方差越大,资料的离散程度就越大。实际工作中,总体均数μ往往是未知的,所以只能用样本均数作为总体均数μ的估计值,即用代替,用样本例数n代替N,即计算的结果总是比实际σ2小。英国统计学家W.S.Gosset于1908年建议用n-1代替n来校正,即是样本方差S2。
式中,n-1称为自由度(degree of freedom),用希腊字母ν表示。
3.标准差 方差的算术平方称为标准差(standard deviation),简记为σ或S,是描述计量资料最常用的离散程度指标。标准差分为样本标准差S和总体标准差σ。
例4 两组学生验光技术考试成绩如下。甲组:64,78,86,88,90,96,100。乙组:78,80,86,88,88,90,92。试比较两组资料的离散程度。
两组学生的平均成绩均为86分,经计算得甲、乙两组的标准差分别为12和5;甲组的标准差大于乙组,说明甲组学生的离散程度大于乙组学生的离散程度。
标准差的用途:
(1)表示资料的离散程度:当比较的两组资料均数相等或相近,且单位相同时,标准差大,资料的离散程度大;标准差小,资料的离散程度小。医学文献上常用表示资料的平均水平和变异程度。当两组资料的均数相差较大或计量单位不同时,不能直接比较,应选择变异系数来比较。
(2)用标准差计算变异系数。
(3)用标准差估计变量值的频数分布情况。
(4)用标准差计算标准误。
4.变异系数 变异系数(coefficient of variation),简记为CV。当多组资料的单位不同或均数相差较大时,不能用标准差直接来比较,须采用变异系数进行比较。CV值小表示变量值密集,变异度小;CV值大表示变量值分散,变异度大。计算公式为:
例5 某研究者观察10只近视眼的屈光度为(-3.18±0.26)D,中央角膜厚度为(0.52±0.04)mm,试问两组数据的变异程度如何?
这两组数据的单位不同,均数相差也较大,须选择CV比较其变异程度大小。
由结果可知,屈光度的变异系数大于中央角膜厚度,说明屈光度的变异程度较大。
5.标准误 医学研究中,很多情况下需要采用抽样研究,从而推断总体的特征与规律。由于事物的个体差异是客观存在的,抽样研究存在抽样误差,使样本统计量不一定等于相应的总体参数。这种由于抽样引起的样本指标与总体指标或样本指标与样本指标之间的差异,称为抽样误差。根据资料的性质和指标种类的不同,抽样误差分为均数的抽样误差和率的抽样误差两种。均数的抽样误差是指由于抽样引起的样本均数与总体均数或样本均数与样本均数之间的差异;率的抽样误差是指由于抽样引起的样本率与总体率或样本率与样本率之间的差异。
(1)均数/率的标准误(standard error):衡量均数/率的抽样误差大小的指标称为均数/率的标准误。总体均数的标准误用表示,样本均数的标准误用;总体率的标准误用σp表示,样本率的标准误用Sp表示。计算公式为:
式中,σ为总体标准差,π为总体率,n为样本观察例数。
由于在抽样研究中,σ或π常属未知,而用样本标准差S或p来估计。因此在实际工作中,常以公式1-12计算结果作为均数标准误的估计值,率的标准误的估计值Sp。
式中,S为样本标准差,p为样本率,n为样本观察例数。
例6 某研究者观察10只近视眼的屈光度为(-3.18±0.26)D,中央角膜厚度为(0.52±0.04)mm,试估计其抽样误差大小。将数据代入公式1-12。因此,10只近视眼的屈光度标准误为0.08D,中央角膜厚度的标准误为0.01mm。从公式1-12可以看出,当n一定时,均数的标准误与标准差成正比。标准差越大,均数标准误越大,均数的抽样误差越大,反之亦然。当标准差一定时,均数的标准误与成反比。样本含量愈大,均数的抽样误差愈小。在实际工作中,可通过适当增加样本例数来减小抽样误差。标准误是描述样本均数变异程度大小的指标,说明抽样误差的大小,也说明了样本均数的代表性。标准差表示个体变异程度的大小,而标准误是样本均数的标准差,表示样本均数间变异程度或样本均数与总体均数的接近程度。标准误小,表示样本均数抽样误差小,样本均数与总体均数接近。
(三)制定医学参考值范围
医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。其确定步骤如下:
1.正确定数量足够大的“常人” 所谓“正常人”并非指身体没有任何疾病,而是指排除了影响所研究指标的疾病和有关因素的同质人群。
2.根据研究目的和使用要求选定适当的百分界值 正常值范围是指绝大多数正常人的观察指标所在的范围。通常“绝大多数”是指正常人的90%、95%和99%,最常采用95%。
3.根据指标的实际用途确定单侧或双侧界值 若指标过高或过低均属异常时,就定为双侧,有上限和下限两侧数值。如眼压过高或过低均属异常,这时取双侧界值;若指标仅过高或过低为异常时,求其正常范围时取单侧,即只有上限界值或只有下限界值。如视力过低为异常,求其正常值范围时取单侧下限。
4.对入选的正常人进行统一、准确测量 测量准确才能获得较可靠的正常值范围。
5.根据指标的实际意义确定是否按照正常人不同的特征分组 如某一指标具有年龄、性别、职业分布特征时,即同一指标不同特征之差的差异有统计学意义。如男、女成人白细胞数量差异有实际意义,须分别求其正常范围。
6.根据资料的分布特点,选用恰当的计算方法 常用方法如下。
(1)正态分布法:正态分布法主要适用于正态或近似正态分布的资料。有双侧和单侧两种情况:
双侧界值: 单侧上界,或单侧下界:
式中为均数,S为标准差,uα为正态分布界值。根据选定正常值范围、单侧或双侧,确定不同的u值。见表1-2。
表1-2 常用u值表
注意,单侧95%的界值1.645正是双侧90%的界值。因为,取双侧90%时,两边各占5%;若是取单侧95%上界时,左侧的5%视为正常,与中间的90%相加为95%,只有的5%视为“异常”。见图1-1。
图1-1 单侧95%上界示意
例7 某研究者测定某地成人100只正常眼的眼压值,其均数,标准差S=2.69mmHg,求该地区正常人的眼压正常值范围。
根据本例题意分析,取双侧95%正常值范围,得:
(16.18-1.96×2.69,16.18+1.96×2.69),即10.9~21.5mmHg。
因此,该地成人正常眼的眼压值95%正常值范围是10.9~21.5mmHg。
(2)百分位数法:百分位数法常用于偏态分布资料以及资料中一端或两端无确切数值的资料。
双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。
例8 调查测定某地107名正常人尿铅含量(mg/L)如下,求正常人尿铅95%正常值范围。
表1-3 某地107名正常人尿铅含量
由于铅是人体非必须元素,故只需制定单侧95%偏态分布的上限,即求P95。
P95处在20~24这一组段,根据公式(1-13):
因此,正常人尿铅95%正常值范围的上限为20.43(mg/L)。
知识拓展与自学指导
对数正态法
对数正态法:是指一些原始数据不呈正态分布,当分别对其取对数后,相应的数值呈正态分布。求对正态分布数据的正常值范围时,须用对数正态法。具体内容请自学。
二、统计推断
(一)总体均数的估计
抽样研究的目的是通过样本均数推断总体均数。总体均数估计的方法有两种,点估计和区间估计。点估计(point estimation)就是直接以样本均数估计总体均数。但由于抽样误差的存在,不同的样本,可能得到不同的均数,从而对总体均数可以得到不同的点估计,估计正确程度很难评价。区间估计(interval estimation)是估计总体均数大概在哪一个范围,这个范围称为均数的可信区间(confidence interval,CI)。通常对一个样本均数以95%的可信度或99%的可信度估计总体均数的一个范围,称为总体均数95%可信区间或99%可信区间。实际工作中,常用区间估计。总体均数的区间估计方法,根据总体标准差σ是否已知,以及样本含量n的大小而不同。
1.点估计 即直接用样本均数估计总体均数。
2.区间估计 样本均数抽样分布服从t分布,利用t分布曲线下面积的规律可估计出总体均数的可信区间(confidence interval,CI)。当样本含量较大时(n≥50),t分布接近u分布,可用u分布代替t分布。当α=0.05时,称95%的可信区间(95%CI);当α=0.01时,称99%的可信区间(99%CI)。
(1)总体标准差σ未知:根据t分布的原理,P(-tα,ν<t<tα,ν)=1-α,按代入进行变量变换,可得可信度为1-α的总体均数可信区间的公式为:
简记为
临床常用95%和99%可信区间的公式如下:
总体均数95%可信区间公式
总体均数99%可信区间公式
(2)总体标准差σ已知,或σ虽未知但n足够大,σ已知,可按照正态分布估计,公式如下:
总体均数95%可信区间公式
总体均数99%可信区间公式
σ未知但n足够大(n≥100),t0.05,ν接近1.96,t0.05,ν接近2.58,可近似替代,公式为:
总体均数95%可信区间公式
总体均数99%可信区间公式
例9 抽样研究100名8岁一年级轻度近视儿童的前房深度,得平均数为3.69mm,。试估计该地8岁1年级轻度近视儿童的前房深度总体均数95%可信区间。
本例为大样本资料,按公式1-20得:
总体均数95%可信区间。
(二)均数假设检验的基本概念及步骤
1.假设检验的基本概念 假设检验(hypothesis test)是统计推断的另一重要内容,也称显著性检验(significant test),是用来推断样本均数所代表的总体均数与另一样本均数所代表的总体均数间、某一样本均数所代表的总体均数与已知的总体均数间的差异是由抽样误差引起,还是总体间存在本质差别所引起的统计推断方法。假设检验是对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可能不是来自这个总体。否则,很可能是来自这个总体。其基本思想是建立在小概率事件(P≤0.01或P≤0.05)基础之上,在一次试验中基本上不会发生的。
例10 已知某地8岁一年级视力正常儿童的眼前房深度的总体均数为3.98mm。现随机抽取8岁轻度近视儿童30名,得眼前房深度均数为3.65mm,标准差为0.26 mm。试问能否认为该轻度近视儿童眼前房深度的均数与正常儿童眼前房深度的均数不同?
本例两个均数不等的可能性有两种:①抽样误差引起;②事物本质不同,即轻度近视使儿童眼前房深度变浅。如何做出判断呢?若是由于抽样误差引起的差异,统计上认为无显著意义,如果这种差异超出了抽样误差的范围,那么很可能是本质上的差异,统计上称这种差异有显著意义。要判断两个均数之间的差异是否是由抽样误差所引起,则必须用假设检验。
2.假设检验的步骤
(1)建立假设和确定检验水平:在建立假设之前,首先应根据资料的性质和分析目的确定做双侧检验(two-sided test)还是单侧检验(one-sided test)。一般应用双侧检验较为稳妥,如无特别说明,都是双侧检验。
检验假设(hypothesis under test)亦称无效假设,符号为H0。假设样本指标与总体指标或样本指标与样本指标之间的差异是由于抽样误差引起的。
备择假设(alternative hypothesis)亦称对立假设,符号为H1。它是与H0相对立的假设。假设样本指标与总体指标或样本指标与样本指标之间的差异,不是由于抽样误差引起的。
确定检验水平:检验水平(size of test)的符号为α,它是肯定或否定H0的概率标准,通常取α=0.05,有时根据实际情况,也可以取α=0.01,α=0.10等。
(2)选择检验方法与计算统计量:建立假设后,应根据资料性质类型、分析目的和检验方法的适用条件等选择适当的检验方法计算统计量。确定检验假设H0成立的可能性大小。不同的检验方法有不同的统计量,如t值、u值和χ2值。
(3)确定P值:即确定样本指标与已知总体指标或样本指标与样本指标之间的差异由抽样误差引起的概率。如果H0成立的可能性小,则认为检验假设H0不成立。反之,可能性大,则认为检验假设H0成立。根据计算出的检验统计量,查相应的界值表即可得概率P。如t检验计算出统计量t值后,根据自由度,查t界值表(表1-4),把t值的绝对值与t界值做比较,就可以确定P值的范围。
t≥t0.05(v),则P≤0.05
t≥t0.01(v),则P≤0.01
t<t0.05(v),则P>0.05
表1-4 t界值表
续表1-4
(4)判断结果:当P≤α时,说明样本指标与已知总体指标,或样本指标与样本指标的差别由抽样误差引起的概率很小。根据“小概率事件在一次试验中基本上不会发生”的原理,就有理由按α水平拒绝H0,接受H1;相反,当P>α时,就没有理由按α水平拒绝H0,即统计上所称的不拒绝H0,差别有可能由抽样误差引起。通常的判断标准是,P>0.05表示差别无统计学意义,P≤0.05或P≤0.01表示差别有统计学意义。
(三)t检验与u检验
t检验和u检验是常用的检验方法,其计算的统计量分别为t和u。适用条件是测量值符合正态分布,则称为u检验。样本含量n较大时,用u检验进行分析;当样本含量n较小时,用t检验进行分析。当测量值呈偏态分布或分布未知时,应采用非参数统计方法,如秩和检验。因此,实际应用时应注意各种检验方法的适用条件和注意事项。常用的均数假设检验方法有:
1.样本均数与总体均数的比较 该方法的目的是推断已知的样本是否来自已知总体均数(一般把标准值、理论值或经大量调查所获得的较稳定值作为已知的总体均数μ)的总体。即样本均数所属的总体均数(未知的)与已知总体均数μ0有无差别。要求服从正态分布。计算公式如下:
例10检验步骤如下:
(1)建立假设和确定检验水平。
H0:轻度近视儿童与正常儿童的眼前房深度均数差异无统计学意义,即μ=μ0 =3.98mm。
H1:轻度近视儿童与正常儿童的眼前房深度均数差异有统计学意义,即μ≠μ0。
α=0.05。
(2)计算t值:按公式1-22计算。
(3)确定P值:按ν=30-1=29,查t界值表,得t0.05(29)=2.045,6.951 9>t0.05(29),P<0.05。
(4)判断结果:按α=0.05水平,拒绝H0,还不能认为轻度近视儿童眼前房深度与正常儿童的眼前房深度均数相同。
问题引导
例11 某研究者测得12例中度近视眼患者左右眼屈光不正度资料见表1-5,试问该组患者双眼屈光度是否有差别?
表1-5 12例中度近视眼患者左右眼屈光不正度
2.配对计量资料的比较 配对设计(paired design)是医学研究中经常采用的一种设计形式。这种设计能减少误差,提高检验效率。其假设检验的目的是推断两种处理或处理前后的结果有无差别。即差值的总体均数是否为0。常见配对设计主要有:①将试验对象按照一定的条件配成若干对,然后随机将每对中的两个观察单位分配到实验组和对照组中去,给予不同的处理,观察某种指标的变化;②同一组试验对象在处理前后观察某种指标的变化;③对同一样品用两种方法检测结果的比较等。计算公式如下:
式中为差数的均数为差数的标准误,Sd差数的标准差。
式中,∑d2为差数的平方之和,∑d为差数之和。
例11检验步骤如下:
(1)建立假设和确定检验水平。
H0:12例中度近视眼患者左右眼屈光不正度差异无统计学意义,即差数的总体均数等于零,μd=0。
H1:12例中度近视眼患者左右眼屈光不正度差异有统计学意义,差数的总体均数不等于零,μd≠0。
α=0.05。
(2)计算t值:先计算d,∑d,∑d2,见表1-5,代入公式1-24和公式1-23,得
(3)确定P值:按ν=对子数-1=12-1=11,查t界值表,t0.05(11)=2.201,t0.01(11)=3.106,本例t0.05(11)>t=2.700 8>t0.05(11),0.01<P<0.05。
(4)判断结果:按α=0.05水平,拒绝H0,接受H1,即根据本资料可以认为中度近视眼患者左右眼屈光不正度不同。
问题引导
例12 某研究者为研究眼轴长度变化与近视关系,测得25例7~13岁中度近视儿童的眼轴长度均数为24.90mm,标准差为0.66mm;测得25例7~13岁中度近视儿童的眼轴长度均数为23.90mm,标准差为0.51mm;试问两组儿童的眼轴长度差异有无不同?此案例的统计推断能否选择配对t检验。
3.两小样本均数的比较 两样本均数的比较又称为成组设计两独立样本均数的比较,小样本资料均数比较可选择t检验。目的是推断两样本分别所属的总体均数μ1与μ2是否相等。t检验的应用条件是两组数据均服从正态分布且两总体方差相等(即总体方差齐)。当两个样本含量较小,即n1+n2<100时,用t检验,t值的计算公式如下:
式中为两均数之差的标准 误 ,为两样本合并方差。
例12检验步骤如下:
(1)建立假设和确定检验水平。
H0:两样本所代表的总体均数差异无统计学意义。
H1:两样本所代表的总体均数差异有统计学意义。
α=0.05。
(2)计算t值:先求。
(3)确定P值:按ν=n1+n2-2=50-2=48,查t界值表,t0.05(49)=2.009,t0.01(48)=2.678,本例t=5.994 1>2.678,P<0.01。
(4)判断结果:因为P<0.01,按α=0.05水平,拒绝H0,可以认为两组儿童眼轴长度不同。
问题引导
例13 某研究者观察100例7~13岁正视眼学龄儿童中央角膜厚度为(0.56±0.038)mm,观察90例中度近视学龄儿童的中央角膜厚度为(0.55±0.034)mm;试问两组儿童中央角膜厚度差异有无显著性?此案例的统计推断能否选择两小样本均数的t检验?
4.两个大样本均数比较的u检验 当两个样本含量较大(n1、n2均大于50)时,可用u检验代替t检验,u值计算公式简化运算如下:
双侧检验,如下:
u≥1.96,则P≤0.05
u≥2.58,则P≤0.01
u<1.96,则P>0.05
例13检验步骤如下:
(1)建立假设和确定检验水平。
H0:两组儿童的中央角膜厚度差异无统计学意义。
H1:两组儿童的中央角膜厚度差异有统计学意义。
α=0.05。
(2)计算u值。本题n1=100,,S1=0.038,n2=100,x2=0.55,S2=0.034,代入公式1-27,得:
(3)确定P值:本例u=1.961 1>1.96,P<0.05。
(4)判断结果:按α=0.05水平,拒绝H0,接受H1,可以认为两组儿童的中央角膜厚度不同。
问题引导
例14 某研究者为研究不同民族儿童维生素A水平,在汉族、苗族、黎族儿童中各随机抽取15名,测定血浆中维生素A水平(μmol/L),获得资料见表1-6,问三个民族儿童血浆中维生素A水平有无不同?此资料是何种类型的资料?能否选用两样本比较的t检验?
表1-6 汉族、苗族、黎族儿童血浆中维生素A水平(1) (单位:μmol/L)
表1-7,分为上下两部分。上半部为原始数据,每个原始数据可用Xij表示,下标i表示组号(列号)i=1,2,3,…,k,本例k=3,下标j表示各组内观察单位序号,j=1,2,3,…,ni,本例ni=15。下半部是与上半部原始数据有关的合计数,分别是:
:表示第i组内从j=1到j=ni的各个观察值之和。
ni:表示第i组的观察值个数。
:表示第i组的观察值均数。
:表示第i组内从j=1到j=ni的各个观察值的平方之和。
下半部右端是上述合计数的合计,它们分别是:
:表示各组观察值之和的合计数。
N:表示全部观察值个数之和,即总频数。
表示全部观察值的均数,即总均数。
:表示各组内观察值平方之和的合计,即全部观察值的平方之和。
表1-7 汉族、苗族、黎族儿童血浆中维生素A水平(2) (单位:μmol/L)
5.方差分析 方差分析(analysis of variance,ANOVA),是检验两个或两个以上样本均数间差异有无统计学意义的统计方法,应用条件是数据服从正态分布,并且各个组都有共同的总体方差(即总体方差相同)。其检验步骤与t检验步骤基本一致。
完全随机设计的资料的方差分析:完全随机设计是将受试对象完全随机分配到各个处理组,设计因素中只考虑一个处理因素,目的是比较各组间平均值的差别是否有统计学意义(即由处理因素引起)。如例14所示。
从表1-7中可见,各组均数是有差别的,大的为19.92,小的为16.8,这种差别似乎表明不同民族儿童血浆中维生素A水平不同。但是,仔细观察数据就会发现,即使同一民族儿童血浆中维生素A水平也不完全一致。显然,这种差别与民族无关,而是由于随机变异(包括个体差异和随机测量误差)所造成的。既然在同一民族儿童中,随机变异可以造成各观察值间的差别,那么,各组均数的差别是否也仅仅是由于这种随机变异所造成的呢?这就是完全随机设计资料方差分析所要回答的问题。
检验步骤如下:
(1)建立假设和确定检验水平。
H0:三个民族儿童血浆中维生素A水平差异无统计学意义,即μ1=μ2=μ3。
H1:三个民族儿童血浆中维生素A水平差异有统计学意义(即三组均数不相同或不全相同)。
α=0.05(双侧)。
(2)求F值:F值是方差之比,方差等于离均差平方和除以自由度,因此求F值要先求离均差平方和及自由度。
1)计算离均差平方和:
计算总变异的离均差平方和SS总:求45个观察值与总均数之差的平方和,计算公式1-28。
式中,C为校正数,按 式(1-29)计算。
本例C=(768.5)2/45=13 124.27。
计算组间变异的离均差平方和:将各组均数与总均数之差的平方乘以各组观察值个数,再求其和,计算公式及计算结果如下:
对于各组样本含量相等的资料,组间离均差平方和可按公式1-30计算。
对于各组样本含量不相等的资料,整个方差分析过程,除组间离均差平方和应按公式1-31计算外,其余计算公式均与各组样本含量相同的公式相同。
本例为各组样本含量相等的资料,组间平方和按公式1-31计算。
SS组间=(298.82+2522+217.72)/15-13 124.27=220.98
计算组内变异的离均差平方和:先求各组内观察值的离均差平方和,再将各组离均差平方和相加即得,但这样计算较麻烦。实际工作中,组内离均差平方和可按公式1-32计算。
本例SS组内=2 138.04-220.98=1917.06。
2)计算自由度、均方和F值:
计算自由度:
总自由度:ν总=N-1,本例ν总=44。
组间自由度:ν组间=k-1,本例ν组间=2。
组内自由度:ν组内=N-k,本例ν组内=42。
计算均方:样本的方差又称均方,以符号MS表示,是离均差平方和除以自由度所得的商。
组间均方:MS组间=SS组间/ν组间,本例 MS组间=110.49。
组内均方:MS组内=SS组内/ν组内,本例 MS组内=45.64。
计算F值:F=MS组间/MS组内,本例F=2.64。
将以上计算结果列成表1-8。
表1-8 方差分析表
(3)确定P值:根据自由度ν1和ν2查F界值表,将F值与所查得的F值做比较,确定P值。本例ν1=2,ν2=42,查F界值表(表中纵标目为较大均方自由度,本例为2,横标目为较小均方自由度本例为42),F0.05(2,42)=3.22>2.64,所以P>0.05。
(4)判断结果:按α=0.05水平,不拒绝H0,不能据此资料认为三个民族儿童血浆中维生素A水平均数不相同。
方差分析结果,各组均数之间差异无统计学意义,则无须做进一步统计比较;若各组均数间差异有统计学意义,可进一步进行各组之间的显著性检验(q检验)。因计算方法较为烦琐,在此不做详述,请参考相关专业书籍自学。
在计算F值时,我们把组间均方作为分子,而把组内均方作为分母。如果组间均方略小于组内均方,则F值就小于1,此时不必查F表就可以确定P>0.05;如果组间均方远小于组内均方,则F值就远小于1,这是异常情况,应从实验设计或实验数据的搜集等方面查明原因。
6.假设检验的注意事项
(1)注意检验方法的应用条件,正确选择检验方法。资料的性质不同、设计类型不同、检验方法不相同,因此,要正确选择检验方法,并注意检验方法的应用条件。
t检验和u检验中,要求资料服从正态或近似正态分布,同时两样本资料t检验还要求两样本来自的总体方差齐。正态分布可用正态性检验方法来判断,方差齐性需要用方差齐性检验(F检验)。不满足条件时须进行秩和检验。
(2)确定检验的单、双侧。在假设检验之前须根据资料的性质、样本特征、专业要求及经验确定检验选用单侧或双侧检验。当研究两种方法的效果时,只考虑两种方法大于,而不考虑小于,或只考虑小于而不考虑大于,则为单侧;若两种方法的效果比较时,同时考虑大于或小于时用双侧检验。
(3)注意资料的可比性。
(4)要注意判断结果不能绝对化 如P≤0.05而拒绝无效假设H0,是指当无效假设H0成立时,由抽样误差造成如此大差别的概率很小,而并不是H0绝对不能成立。P值越小,越有理由拒绝检验假设;反之,如P>0.05,不拒绝H0,是指当H0为真时,由抽样误差造成如此大差别的概率P>0.05,并不是H0绝对成立。在检验假设中,不论接受H0还是拒绝H0,都可能犯错误。如果无效假设H0为真,拒绝了它,这叫第一类错误(type Ⅰerror)。如果无效假设H0不真,接受它,这叫第二类错误(typeⅡerror)。第一类错误又称假阳性错误,第二类错误又称假阴性错误。第一类错误的概率为检验水平a,如P<0.05,在100次抽样中,发生这样的错误不到5次,第二类错误的概率用β表示,β很难估计,当样本含量确定时,α愈小,β愈大;反之,α愈大,β愈小,要同时减小α和β,唯一的方法是增大样本含量。
(5)要注意实际差别大小与统计意义的区别。当统计检验结果拒绝H0时,可认为差别有显著性,而不应该误解为两均数相差很大;P<0.01和P<0.05,表示犯第一类错误的概率大小,并不意味着P<0.01比P<0.05的两均数实际差别更大。
(6)报告结论时须注明所使用的统计方法、统计量、单双侧检验以及P值的确切数值。
归纳总结与思考
计量资料有两大特点,集中趋势与离散趋势,描述前者的指标是平均数,常用的是算术均数、几何均数和中位数。离散程度指标又称变异度指标,有全距、方差、标准差和变异系数,最常用的是标准差和变异数。
计量资料的统计推断主要包括参数估计和假设检验。参数估计的方法有两种:点估计和区间估计,常用区间估计。假设检验是用统计学的方法来判断引起两均数之间的差别是抽样误差,还是事物本质。假设检验的步骤均为四大步骤。常用的均数检验方法有单样本t检验、配对t检验、两独立样本t检验、大样本的u检验和方差分析。但不同的资料类型,不同的分布特点应选择不同的检验方法,选择不同统计方法用时要注意其应用条件。
学习检测
1.描述数值变量资料集中趋势的指标主要有哪些?应用条件有何不同?如何计算?
2.描述数值变量资料离散趋势的指标主要有哪些?应用条件有何不同?如何计算?
3.何谓医学参考值范围?应用正态分布理论估计医学参考值范围时应注意哪些问题?
4.说出标准差与变异系数、标准差与标准误的区别。
5.何谓区间估计?它和医学参考值范围有什么区别?
6.假设检验的基本步骤有哪些?如何选择单侧检验和双侧检验?
7.调查收集某大学眼视光技术和康复技术两个专业学生的两眼瞳孔距离数据。问题:
(1)制订调查收集资料的设计方案。
(2)分别整理两个专业所收集的资料,并编制其频数分布表。
(3)分别求出两个专业学生两眼瞳孔距离的算术平均数、中位数、极差、标准差、变异系数、标准误。
(4)分别估计两个专业学生两眼瞳孔距离的95%、99%的可信区间。
(5)比较不同专业学生平均两眼瞳孔距离的差别有无统计学意义?
8.抽样研究所在学校某专业一年级和三年级学生视力平均水平有无差别?
任务三 计数资料的统计分析
问题引导
1.某研究者为研究甲、乙两地儿童近视患病情况,调查得甲地近视儿童2 000人,乙地近视儿童3 000人,该研究者得出乙地儿童比甲地儿童近视程度高的结论?
(1)你是否认同以上说法?
(2)用什么指标比较甲、乙两地儿童近视的患病程度?
2.郑州市白内障患病率与上海市白内障患病率是多少?二者有无差别?
一、相对数
绝对数是反映事物在某时某地出现的实际情况,是统计分析和制订计划的基础。但绝对数的大小,常受基数多少的影响,不便于进行深入的分析比较。若比较资料的特征与规律,需计算相对数,再进行比较,才能得出正确的结论。相对数(relative number)是两个有联系的指标之比值,常用于计数资料的统计分析,常用的相对数有率(rate)、构成比(constituent ratio)、相对比(ratio)和动态数列。
1.率 又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明一定时间内某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、10万分率(1/10万)等表示。计算公式如下。
式中,K为比例基数,常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)表示。计算时比例基数的选择,主要依据习惯用法或使算得的率至少保留1~2位整数。常用的率在模块一中项目二的任务二有详细叙述。
例15 为了解某校新生近视情况,某研究者调查了某校2005~2011年新生视力,并计算相应指标。见表1-9中的检出率,其大小说明某校2005~2011年每年新生近视患病的严重程度。其中2011年患病率最高,2007年最低。为进一步分析不同时间(年)近视的分布情况,选择什么指标?
2.构成比 又称构成指标,它表示某一事物内部各组成部分所占的比例或分布,只能说明某事物所占的比例,不能说明事物发生的频率或强度。通常以100%为基数,故又称百分比,计算公式如下。
表1-9 某校2005~2011年新生视力严重程度分析
例16 表1-10列出了某校2005~2011年每届新生近视人数及其不同程度分布情况。
表1-10 某校2005~2011年新生视力低下情况分析
一般来说,构成比的总和应为100%(也可表示为1),但有时由于计算尾数取舍的关系,其总和不一定恰好等于100%,须对各构成比的尾数做适当调整,使构成比的总和等于100%。
事物各构成部分构成比的大小,受两方面因素的影响:一是该部分自身数值变化的影响,这一影响易被人们所察觉;二是其他部分数值变化的影响,这一影响往往被人们所忽视。
问题引导
例17 某研究者为说明白内障在某省不同地区的患病情况,经调查得A市白内障患者数为1.5万人,B市白内障患者数为2万人,A与B两市的白内障患者数的关系如何?
3.相对比 又称比值,是两个有关指标之比,常以倍数或百分比表示。用以描述两者的对比水平。这两个指标可以是计数资料,也可以是计量资料;可以是绝对数,也可以是相对数,可以是同类指标,也可以是性质不同的两个有联系的指标,都可以计算相对比。相对比常以倍数或百分数(%)表示。计算公式如下。
例17中,A、B市白内障患者数之比为1.5/2=0.75∶1或75%。
知识拓展与自学指导
应用相对数的注意事项
1.计算相对数时分母不宜过小,一般不能小于30例。
2.构成比和率不能相互混淆。
3.求两组或多组数据的总平均率时,不能将各率相加后求平均求得,而应将分子、分母分别相加再相除后求得。
4.注意资料的同质性与可比性。
5.样本率或构成比的比较应建立在随机抽样的基础上,并要进行检验假设。
二、率的u检验
(一)率的抽样误差与标准误
问题引导
例18 某研究者从某地随机抽取小学生1 000名,其中近视学生190名,近视眼患病率为19%,该地小学生近视眼的总体患病率是否为19%?若某研究者从该地再随机抽取1 000名小学生,其近视眼的患病率是多少?
由抽样引起的样本率与总体率之间的差异,称为率的抽样误差。率的抽样误差大小用率的标准误表示,Sp为样本标准误,σp为总体标准误。
本例中患病率p=19.0%,样本例数n=1 000,标准误为:
率的标准误越小,率的抽样误差就越小,样本率与总体率就越接近,用P代表π就越可靠。率的标准误越大,率的抽样误差就越大,样本率与总体率就越不接近,用P代表π就越不可靠。
率的标准误的主要用途:①说明样本率的可靠性;②估计总体率的可信区间;③进行率的显著性检验。
(二)总体率的可信区间估计
当样本含量n足够大(如n>50),且p与(1-p)均不接近于0,即np与n(1-p)均≥5时,样本率p的频数分布近似正态分布,可采用正态近似法。即总体率的95%可信区间为p±1.96 Sp,总体率的99%可信区间为p±2.58Sp。通常对一个样本率以95%的可信度或99%的可信度估计总体率的一个范围,称为总体率95%可信区间或99%可信区间。
(三)样本率与总体率的比较
问题引导
案例1 我国50岁及以上人群白内障的患病率为47%,从某省随机抽取2 000 名50岁及以上人群得其白内障的患病率为49%,能否由此得出某省白内障患病率高于全国水平?为什么?
案例2 某研究者为研究城乡40岁及以上人群糖尿病视网膜病变的患病情况,在某省分别随机抽样40岁及以上的城市居民5 000名,农村居民5 000名,进行调查得其城市和农村糖尿病视网膜病变患病率分别为36.0%和40.0%。能否直接得出农村糖尿病视网膜病变患病率高于城市?为什么?
适用条件:当样本含量n足够大(如n>50),且p与(1-p)均不接近于0,即np与n(1-p)均≥5时,样本率p的频数分布近似正态分布,故应用正态分布的原理对样本率进行u检验。计算公式为:
式中,p为样本率,π0为总体率,σp为率的标准误。
u≥1.96,则P≤0.05,或u≥2.58,P≤0.01,表示差异有统计学意义。
u<1.96,P>0.05,表示差异无统计学意义。
例19 如问题引导案例1,已知白内障患病率π=47%,P=49%。
检验步骤:
(1)建立假设,确定检验水平。
H0:某省白内障患病率与全国总患病率差异无统计学意义,π=π0。
H1:某省白内障患病率与全国总患病率差异有统计学意义,π≠π0。
α=0.05。
(2)计算u值。本例n=2 000,π0=47%=0.47。
(3)确定P值:因u=1.785 7<u0.05=1.96,则P>0.05,差异无统计学意义。
(4)判断结果:按α=0.05水平,不拒绝H0,据此资料还不能认为某省50岁及以上的人群白内障患病率与全国该病的患病水平有所不同。
(四)两样本率的显著性检验
适用条件同上,计算公式如下。
式中,p1与p2分别为两个样本率,Sp1-p2为两个样本率相差的标准误,按下式求得:
式中,pc为合并样本率,x1,x2分别为两样本的阳性数,n1,n2分别为两个样本含量。
例20 某研究者为研究城乡40岁及以上人群糖尿病视网膜病变的患病情况,在某省分别随机抽样40岁及以上的城市居民5 000名,患病人数1 800名,患病率为36.0%。农村居民5 000名,患病人数2 000名,患病率为40.0%,试问城市与农村40岁及以上人群糖尿病视网膜病变的患病率差异有无统计学意义?
检验步骤:
(1)建立假设与确定检验水平。
H0:某省城市与农村糖尿病性视网膜病变患病率差异无统计学意义,π1=π2。
H1:某省城市与农村糖尿病性视网膜病变患病率差异有统计学意义,π1≠π2。
α=0.05。
(2)计算u值:本例x1=1 800,x2=2 000,n1=2 000,n2=5 000代公式1-37和1-38得:
(3)确定P值:因u=4.1237>u0.01=2.58,故P<0.01,差别有极显著的统计学意义。
(4)判断结果:按α=0.05水平,拒绝H0,据此资料可认为某省城市与农村40岁及以上的人群糖尿病视网膜病变的患病率差别有极显著的统计学意义,城市高于农村。
三、卡方检验
(一)四格表资料的卡方检验
问题引导
例21 某研究者研究了两种治疗青少年近视眼远视力的药物,其治疗结果见表1-11,试比较治疗结果差异有无统计学意义。此资料的比较能否用u检验?能否用其他检验方法?
表1-11 两种药物对青少年近视眼的远视力改善的疗效比较
χ2检验(chi-square test)是一种用途非常广泛的假设检验方法,由统计学家Karl Pearson于1900年提出。主要用于检验两个率(构成比)或多个样本率(构成比)的比较,也用于检验配对分类变量资料的差异等。其基本思想是以卡方值的大小来反映理论频数与实际频数的吻合程度,在无效检验假设(H0:π1=π2)成立的条件下,实际频数与理论频数相差不应很大,即卡方值不应该很大,若实际计算的卡方值较大,超过了设定的检验界值,则有理由怀疑H0的真实性,从而拒绝H0,接受H1。
四格表资料的设计特点:2行2列四个基本数字。
1.四格表资料卡方检验的基本公式 其适用条件是样本量n>40,所有格子的理论数T≥5。例21检验步骤如下。
(1)建立假设,确定检验水平。
H0:两种药物对青少年治疗近视眼远视力的疗效差异无统计学意义。
H1:两种药物对青少年治疗近视眼远视力的疗效差异有统计学意义。
α=0.05。
(2)计算χ2值,四格表的基本公式如下。
式中,A为实际数,如表1-11四格表内的四个基本数据就是实际数,分别为354、105、29、256;T为理论数,它是根据检验假设推算出来的,计算理论数的公式如下。
式中,TRC为R行C列的理论数,nR为与理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
从基本公式可以看出χ2值反映了实际数与理论数的吻合程度。如果检验假设成立,则实际数A与理论数T之差一般不会很大,出现大的χ2值的概率P是很小的。
按公式1-40,可计算出四个格子的理论数:
表1-11第1行第1个格子的理论数,T1.1=459×383/644=273。
同理,其余三个格子的理论数(表1-12):
T1.2=459×261/644=186,T1.2=459-273=186
T2.1=185×383/644=110,T2.1=383-273=110
T2.2=185×261/644=75,T2.2=261-186=75
表1-12 两种药物对青少年近视眼的远视力改善的疗效比较
(3)确定P值:卡方检验的自由度=(行数-1)(列数-1)或ν=(R-1)(C-1),则四格表资料卡方检验自由度为(2-1)(2-1)=1。查表得本例。
(4)判断结果:两种药物对青少年近视眼的远视力改善的疗效不同,甲药组高于乙药组。
2.四格表资料卡方检验的专用公式 四格表资料卡方检验还可用专用公式求χ2值。
式中,a、b、c、d分别为四格表中四个实际数,n为总例数,即为a+b+c+d之和。现仍以表1-11资料为例,将上式符号标记见表1-13。
表1-13 四格表资料的基本构成
仍以例21资料为例,见表1-11。
检验步骤同四格表资料卡方检验的基本公式。
3.四格表资料卡方检验的校正公式
(1)适用条件:当四格表中有理论数1≤T<5,且样本总例数n≥40时,则χ2值公式须进行连续性校正,否则算出的χ2值偏大,这样很可能会把差异无显著性的结果误判断为有显著性,特别是χ2值在临界值附近时,更应注意校正。
(2)四格表资料卡方值校正公式见公式1-42。
(3)检验步骤同基本公式和专用公式。
(4)任一格的T<1或n<40,用确切概率计算法。当理论数T<1或样本总例数n<40时,即使采用校正公式计算的χ2值也有偏差,须改用四格表的确切概率计算法。
问题引导
例22 为研究糖尿病性视网膜病变同糖尿病病程的关系,某研究者调查30例病程小于5年的糖尿病患者,其中患糖尿病性视网膜病变者5例;同时调查25例病程大于或等于5年,且小于10年的糖尿病患者,其中患糖尿病性视网膜病变者8例。若比较两组人群患糖尿病性视网膜病变的差异有无统计学意义,能否选择四格表资料的基本公式或专用公式?为什么?资料整理见表1-14。
表1-14 不同病程糖尿病患者糖尿病性视网膜病变患病情况比较
(二)行列表资料的卡方检验
问题引导
例23 某学者研究了两种治疗青少年近视眼远视力的药物,其治疗结果见表1-15,试比较治疗结果差异有无统计学意义。此资料的比较能否用四格表资料的卡方检验?为什么?
表1-15 两种药物对青少年近视眼的远视力改善的疗效比较
行列表资料的卡方检验的设计特点:行数大于2,列数等于2;行数等于2,列数大于2;行数、列数均大于2,这时可采用行列表资料的卡方检验。
式中,n为总例数,A为每个格子的实际频数,nR和nC分别为与A相应的行合计数与列合计数。自由度ν=(R-1)(C-1)。
1.检验步骤 以例23为例。
(1)建立假设与确定检验水平。
H0:两种药物对青少年治疗近视眼远视力的疗效差异无统计学意义。
H1:两种药物对青少年治疗近视眼远视力的疗效差异有统计学意义。
α=0.05。
(2)计算χ2值:本例最小的理论频数是:,故可用公式1-43计算χ2值。
(3)确定P值:因χ2=207.48,自由度ν=(2-1)×(3-1)=2,查χ2界值表(表1- 16)得。
表1-16 χ2界值表
(4)判断结果:两种药物治疗青少年近视眼远视力的疗效差别有统计学意义,甲药好于乙药。
2.注意事项 做行×列表资料的χ2检验时应注意以下几点。
(1)行×列表资料χ2检验应满足其应用条件:样本总量不能太小,一般为大于50;所有格子的理论数均不能小于1,且理论数1<T<5的格子数不宜多于格子总数的1/5。否则,可采用:①增加样本含量以增大理论频数;②将太小的理论数所在的行或列的实际数与性质相近的邻行或邻列的实际数合并;③删去理论数太小的行和列。但是后一种处理方法可能会损失信息,也会损害样本的随机性,不同的合并方式有可能影响推断结论,故应当在不得已时慎用。
(2)应正确理解行×列表资料χ2检验的结果:如假设检验的结果是拒绝H0,接受H1,这只能认为各总体率或构成比之间总的来说有差别,但并不是说它们彼此之间都有差别。如想了解具体是哪两者间有差别,须利用χ2分割法(四格表)进一步做两两比较。
如果行×列表中效应的分类是有序的,属于等级资料(如疗效按痊愈、显效、有效、无效分为四个等级),这种资料若做χ2检验只能说明各处理组间的效应在构成比上有无差别,如欲判断各处理组间的效应有无差别,则应使用秩和检验的方法。
归纳总结与思考
相对数是描述计数资料常用的统计指标。常用的相对数有率、构成比和相对比。在使用相对数时,要注意资料的可比性。为消除资料内部不同的影响,采用统一的标准来计算各率的标准化率,使各率具有可比性。样本率与总体率之间存在着抽样误差,率的标准误是描述率的抽样误差大小的指标。当样本含量较大时,样本率的频数分布近似正态分布,可用u检验对两个率的差异进行假设检验。卡方检验是一种用途较广的假设检验方法。常用于检验两个或多个率(或构成比)之间有无差别,也可用于检验配对分类变量资料的差异等,主要有四格表资料的卡方检验、行列表资料的卡方检验。
学习检测
1.应用相对数的注意事项有哪些?
2.计数资料的统计推断方法有哪些?从假设、公式、设计特点、应用条件、结果判断等方面列表比较他们的不同点?
3.随机抽样调查研究某大学眼视光技术和护理两个专业学生的近视发生程度,其患病率是多少?并比较其差别有无统计学意义?
任务四 相关与回归
问题引导
例24 某研究者为探讨屈光度与眼轴的长度的关系,随机抽取10只近视眼进行其屈光度和眼轴长的测量,测量结果如表1-17所示,试问如何才能判断屈光度与眼轴的长度之间有无关系?
表1-17 10只近视眼的屈光度与眼轴长度
医学领域中,很多现象间都不是独立的,而是相互联系、互相制约。例如儿童的身高与体重、年龄与屈光度、学习时间与屈光度等均有一定的联系。当两种事物或现象的某种变量之间存在着密切的数量关系,又不像数学函数关系那样,能以一个变量精确地求出另一个变量的数值,这种关系称之为相关关系。用适当的统计指标与方法来描述与推断这两个变量之间的相关关系的分析方法,称之为相关分析。用数学函数的形式表达这两个变量之间的关系,称之为回归分析。直线相关分析适用于双变量正态分布,直线回归分析适用于双变量正态分布或单变量正态分布的资料。
一、直线相关
两事物间的关系往往是一个变量(Y)随着另一个变量(X)的变化而变化,X为自变量,Y为因变量。描述两变量间的相关关系的方法有散点图和相关系数。相关关系有正相关和负相关。正相关即两变量X、Y的变化趋势是同向的;负相关是指X、Y间呈反向变化。正相关或负相关并不一定表示一个变量的改变是另一个变量的原因,有可能同受另一个因素的影响。因此相关关系并不一定是因果关系。相关分析的任务就是对两个变量间的相关关系给以定量的描述,计算相关系数。
(一)直线相关系数
直线相关系数简称相关系数(correlation coefficient),又称积差相关系数,是描述两个变量直线相关的方向与密切程度的统计指标。总体相关系数用ρ表示,样本相关系数用r表示。相关系数取值范围为-1≤r≤1,无单位。r值为正值表示正相关,即一个变量随着另一个变量的增加而增加;r值为负表示负相关,即一个变量随着另一个变量的增加而减少;r值等于零为零相关,即一个变量值的大小不受另一个变量值增加或减少而变化;r的绝对值等于1为完全相关,即一个变量随着另一个变量的增加/减少而增加/减少,且完全呈一条直线。r=1为完全正相关,r=-1为完全负相关。r值多界于-1与+1之间。
(二)直线相关分析步骤
1.绘散点图 根据原始数据绘制散点图,初步判断两变量间的直线相关关系。若两变量间的数量关系呈直线趋势,则进一步计算相关系数。
2.计算直线相关系数
3.直线相关系数的显著性检验 就是推断总体的相关系数ρ是否等于零。双变量(X、Y)正态分布总体X和Y的相关系数为ρ。若ρ=0,则X和Y无相关,只有ρ≠0时X 和Y才有直线相关关系,ρ>0为正相关,ρ<0为负相关。相关系数r是样本相关系数,它只是总体相关系数ρ的点估计。显然只有ρ≠0,所求得的样本相关系数才有意义。检验假设H0为ρ=0;H1双侧为ρ≠0;单侧为ρ>0或ρ<0。如果H0成立,则r和0的差别完全由抽样误差造成。常用t检验,公式如下:
以自由度ν=n-2查t界值表判断结果,得出P值。
以例24为例(表1-17中屈光度均为负值,负号省略)。
(1)绘散点图,确定两变量间的相关趋势,见图1-2。此图显示,所绘散点呈直线趋势。
(2)求∑X、∑Y、∑XY、∑X2和∑Y2。
∑X=50.5,∑Y=259.5,∑XY=1 328.75,∑X2=286.25,∑Y2=6 747.25
(3)求lXY、lXX、lYY。
SSXX=lXX=286.25-50.52/10=31.225
图1-2 10例近视眼患者的屈光度与眼轴长度散点图
SSYY=lYY=6 747.25-259.52/10=13.225
SSXY=lXY=1 328.75-50.5×259.5/10=18.275
(4)求相关系数r由公式1-44得。
(5)相关系数的显著性检验。
1)建立检验假设,确定检验水平。
H0:ρ=0,10例近视患者屈光度与眼轴长度无相关。
H1:ρ≠0,10例近视患者屈光度与眼轴长度有相关。
α=0.05。
2)计算t值:由公式1-45得。
3)确定P值:本例自由度υ=10-8,查t界值表,t0.01/2,8=2.896<5.815 6,P<0.01,说明相关系数有极显著的统计学意义。
4)判断结果:10例近视眼患者的屈光度与眼轴长度有正相关关系。
二、直线回归
当两变量之间存在经显著性检验有统计学意义的直线相关关系时,则可通过自变量x来推断算出因变量y的估计值。这种分析方法称为直线回归(linear regression)分析,直线回归分析的目的在于找出描述两个变量依存关系的直线方程,以确定一条最接近各实测点的直线,使各实测点与该线的纵向距离的平方和最小。这个方程为直线回归方程,表示为公式1-46,据此方程描述的直线就是回归直线。
式中,a、b是决定直线的两个常数。a为回归直线在y轴上的截距。a>0,表示直线与纵轴的交点在原点的上方;a<0,则交点在原点的下方;a=0,则回归直线通过原点。b为回归系数(regression coefficient),即直线的斜率。意为x每改变一个单位时,y平均改变b个单位。b>0,表示y随x增大而增大,b=0,表示回归直线与x轴平行,即x和y无直线关系:b<0,表示y随x的增大而减少。
以例24为例。
1.求a、b值
2.列出回归方程
则回归方程:y=22.994 2+0.585 3x
在Χ的取值范围内(2.00~8.00D),令x1=3,x1=7,求y1、y2值:
y1=22.994 2+0.585 3×3=24.750 1
y2=22.994 2+0.585 3×6=26.506
在直角坐标系中,以屈光度为横坐标,以眼轴长度为纵坐标,通过(3,24.750 1)和(6,27.091 3)两点做一直线,即为回归直线,见图1-3。
图1-3 10例近视眼患者的屈光度与眼轴长度散点图
3.回归系数的显著性检验 由样本求得的回归系数b是总体回归系数β的估计值,因存在抽样误差,故需要对回归系数b进行显著性检验。如果无统计学意义,则样本回归系数b来自总体回归系数β=0的总体。如果有统计学意义,则样本回归系数b来自总体回归系数β≠0的总体,表明x、y之间的直线回归关系存在。常用t检验,自由度ν=n-2。
其中,Sb为回归系数的标准误,SY·X为回归剩余标准差。
三、直线相关与回归分析的注意事项
做相关与回归分析要有实际意义,不能把毫无关联的两个事物或两种现象随意进行相关或回归分析。
要正确理解相关分析结果,相关系数反映两变量间相关关系的密切程度,回归分析则反映两变量间的数量依存关系,并不能表示两个事物或现象之间存在着本质联系,也不能证明两者之间确有因果关系。即必须结合专业知识做出合理解释。
未进行显著性检验的样本相关系数b不能直接得结论,因存在抽样误差。相关系数的显著性检验的显著性程度与两个变量相关的密切程度无关,只能说明拒绝检验假设所犯错误的概率大小。P越小只能说明越有理由拒绝检验假设,而不能说两者相关的程度越密切。
直线回归方程求y值一般适用于自变量的取值范围内,若无充分理由证明超过自变量取值范围外还是直线,则不能任意外延。
进行相关与回归分析时,应先绘制散点图,若提示有直线趋势存在时,才适宜做直线相关与回归分析。绘制散点图后,若出现一些特大特小的异常点,则应及时复查修正与剔除。否则,异常点的存在会对回归方程中的系数a、b的估计产生较大影响。
相关分析要求两个变量X、Y是双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归。回归分析要求因变量Y是服从正态分布的随机变量,而自变量X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归。
同一资料,计算的r与b符号相同,显著性检验的t值相等,即tr=tb,相关系数有统计学意义,回归系数也一定有统计学意义,反之亦然。如果要研究两个变量之间的相互关系,一般先做相关分析,当相关系数有统计学意义时,再做回归分析。
归纳总结与思考
当两种事物或现象的某种变量之间存在着密切的数量关系,又不像数学函数关系那样,能以一个变量精确地求出另一个变量的数值,这种关系称之为相关关系。描述两变量间直线关系的方法有散点图与相关系数。相关系数是描述两个变量直线相关的方向与密切程度的统计指标。
学习检测
1.直线相关分析的步骤有哪些?
2.直线相关分析与直线回归分析有何与区别与联系?
3.若两变量间的相关系数r=0.876 0,能否直接得出两变量间有正相关关系的结论?
任务五 统计表与统计图
统计表与统计图均是统计描述的重要工具。在医学科学研究中,经常用统计表和统计图简单明了、直观形象地表达统计分析结果,以便于理解和接受、比较和分析。
一、统计表
广义的统计表(statistical table)包括调查资料所用的调查表、整理资料所用的整理汇总表以及分析资料所用的统计分析表。本节仅介绍在医学领域用于统计描述的表格,即统计分析表。它是将分析事物及其指标用表格的形式列出,用以表达被研究对象的特征、内部构成及研究项目之间的数量关系。
(一)统计表的结构
统计表由标题、标目、线条和数字等要素组成,必要时可加备注。基本格式如图1-4所示:
图1-4 统计表的组成
(二)统计表的制作要求
编制统计表总的原则是结构简单、重点突出、层次分明、数据准确。制表的具体要求如下:
1.标题 标题位于表格的上方中央,要求简明扼要地说明表的中心内容,必要时注明资料的时间和地点。
2.标目 标目是表格内所列的项目,要求其文字简明,有单位时要注明单位。标目可分为分横标目和纵标目。
(1)横标目列在表的左侧,表明表中被研究事物的主要标志,相当于句子中的主语,说明表内同一横行数字的含义。
(2)纵标目列在表的右侧上方,表明横标目的各项统计指标,相当于句子的谓语,说明表内同一纵列数字的含义。
3.线条 表内只有横线,竖线和斜线一律不要。横线也不宜过多,常用三条基本线表示,即顶线和底线,以及隔开纵标目和数字的标目线。如有合计,再加一条隔开合计与数字的合计线。通常顶线和底线略粗一点,另两条线可略细一点。
4.数字 表内数字必须准确,一律用阿拉伯数字来表示,所有数字位次对齐,同一指标的小数位数应一致,表内不得留有空格。数据暂缺或未记录用“…”表示,无数字用“―”表示,数字若为0,则填写“0”。
5.备注 备注不是统计表的必备部分,一般不列入表内。如需要对标题、标目或数字做出说明或解释时,应在表的右下角或左下角用“*”标出,解释写在表的底线下面,多处备注须用不同符号表示。
(三)统计表的种类
统计表分为两种,简单表和组合表。
1.简单表 只按单一特征或标志分组的统计表称为简单表。见表1-18,该统计表只按病型分组。
表1-18 某地某年流行性脑脊髓炎各病型的病死率
2.组合表 按两种或两种以上特征或标志结合分组的表称为组合表。见表1-19,将调查对象疾病种类与性别两个标志结合起来分组,可以分析不同疾病和不同或相同年代性别间的患病率。
表1-19 某市45岁以上知识分子常见病的患病率
(四)统计表的修改
统计表的制作是否良好,可从标题是否正确、标目的排列是否合适、线条是否过多过密等方面来检查。见表1-20,指出其错误之处,并加以修改。
表1-20 两个治疗组对比
表1-20表达的是用两种治疗方法治疗急性心肌梗死并发休克的疗效。缺点:①标题太简单,不能概括表的中心内容;②纵、横标目安排不当;③标目组合重复,两种治疗组的数据未能紧密对应,不便于相互比较;④表内线条过多,不符合制表原则。可修改为表1-21。
表1-21 两治疗组治疗急性心肌梗死并发休克患者的疗效比较
二、统计图
统计图(statistical chart)是用点的位置、线段的升降、直条的长短、图形面积的大小等形式来表达统计资料的一种形式。它把资料反映的趋势、多少、相互关系等直观形象地表达出来,便于资料间的相互比较。与统计表相比,统计图的缺点是不能精确地表达数据,故必要时可结合统计表用文字加以说明。
医学统计中常用的统计图有直条图、百分比条图、圆图、线图、直方图、散点图等。
(一)制作统计图的基本要求
1.选图 根据资料的性质和分析目的选择适合的图形。
2.标题 简要说明图的中心内容,必要时注明资料来源的时间、地点。标题一般放在图的正下方。若同一篇文章有多个统计图,则标题前应加上序号。
3.有的图须有横轴与纵轴 横轴尺度自左向右,纵轴尺度自下而上,数值由小到大,有单位的要注明单位。纵坐标长度与横坐标长度之比一般以5∶7为宜。
4.图例 在同一图内比较两种以上的事物时,须用不同的线条、图标、图案或颜色表示,并附图例说明。
(二)常用统计图及其绘制要求
1.直条图(bar chart) 直条图又称条图,是用等宽直条的长短来表示统计指标数值的大小,适用于比较彼此相互独立的资料。分单式条图(图1-5)和复式条图(图1-6)两种。绘制直条图时应注意以下几点:
(1)以横轴为基线,以纵轴表示频数或频率,且纵轴必须从“0”开始。
(2)各直条之间距离相等,一般与直条等宽或为条宽的1/2。
(3)为了便于对比,直条一般按由高到低的次序排列或按时间的先后顺序排列。
(4)复式直条图以组为单位,每组直条不宜过多,同组直条不留间隙,组内直条排序前后一致。
图1-5、图1-6分别根据表1-18、表1-19的资料绘制。
图1-5 某地某年流行性脑脊髓炎各病型的病死率
图1-6 某市45岁以上知识分子男、女性高血压患病率
问题引导
例25 2002年某地居民脑血管病、心脏疾病、恶性肿瘤、呼吸系统疾病、消化系统疾病和其他疾病的死因构成,见表1-22。
表1-22 2002年某地居民5种主要疾病死因构成比
问题:
(1)上述资料应绘制何种统计图?
(2)绘制圆形图和百分比条图应注意哪些问题?
2.百分比条图(percentage bar chart) 百分比条图是一种构成图,适用于构成比资料。它是以一直条的总面积表示事物全部即100%,直条内各段的面积为相应部分所占的百分比。见图1-7。绘制百分比条图时应注意以下几点:
(1)绘一等宽直条作为100%,在该直条下方画一与直条等长的标尺。
(2)根据标尺指示,按各部分所占的百分比,从大到小把直条分成若干段。
(3)直条各段用简单文字、不同颜色或图案表示,并标出百分比。
(4)如有两种或两种以上类似的百分比相互比较时,可绘制两个或两个以上长度、宽度都相等的直条,在同一起点上依次平行排列,各直条间留适当空隙,一般为直条宽度的一半。
图1-7 2002年某地居民5种主要疾病死因构成比
3.圆形图(pie chart) 圆形图也是一种构成图,适用的资料、用途与百分比条图相同。圆形图是以圆的总面积表示事物的全部即100%,圆内各扇形面积表示事物各部分所占的比例,见图1-8。绘制时应注意以下几点:
(1)以圆的总面积为100%,圆心角为3.6°的扇形面积为1%,各部分的构成比分别乘以3.6°,得各构成部分所占的圆心角度数。
(2)以相当于时钟12点的位置为起点,顺时针方向用量角器在圆上画出相应扇形面积,一般各组成部分按百分比的大小顺序排列。
(3)圆中各部分用不同线条或颜色表示,在图上标出百分比,并附图例说明。
(4)如果有两种或两种以上类似资料的百分比相互比较时,可绘制两个或两个以上直径相同的圆图,并注意各圆图的各构成部分排列次序和图例要一致。
图1-8 2002年某地居民5种主要疾病死因构成比
问题引导
例26 某地1995~2004年10年间男、女不同性别肺癌的发病率资料见表1-23,请用统计图描述该地男、女肺癌的发病率随年代的变化趋势。
表1-23 某地10年间男、女肺癌的发病率(1/10万)
问题:上述资料应绘制何种统计图?如何绘制?
4.线图(line chart) 线图是用线段的上升或下降来表示事物在时间上的变化趋势,或某现象随另一种现象变迁的情况,适用于连续性资料。见图1-9。绘制方法如下:
(1)横轴表示某一事物的连续变量,纵轴表示统计指标。
(2)纵轴一般从“0”开始,若图形的最低点与“0”差距较大,可在纵轴基部做折断处理。
(3)横轴可以不从“0”开始,若以组段为单位时,各组段距离应相等,并以组段下限为起点。坐标点的位置应在组段中点,相邻两点用直线连接,切勿任意描成光滑曲线。
(4)纵、横轴长度的比例一般以5∶7为宜。
(5)同一图内可有多条曲线,以不同线形或颜色相区分,并用图例说明。
图1-9 某地10年间男、女肺癌的发病率变化趋势
问题引导
例27 某地130名正常成年男子的红细胞数频数表资料见表1-24。
表1-24 某地130名正常成年男子红细胞数
问题:根据以上资料宜绘制何种统计图来描述资料的频数分布?如何绘制?
5.直方图(histogram) 直方图是以各矩形的面积表示各组段的频数。适用于表示连续性变量的频数分布情况。绘制要点如下:
(1)横轴表示被观察现象,纵轴表示频数或频率,以各矩形的面积代表各组段的频数。
(2)纵轴尺度应从“0”开始,横轴的刻度按实际范围制定。
(3)各直条间不留间隙。
由表1-24的频数表资料绘制直方图1-10。
图1-10 某地130名正常成年男子红细胞数(×1012/L)频数分布
问题引导
例28 某研究者检测某地12名高三女学生的体重和肺活量的数据见表1-25。
表1-25 某地12名高三女学生的体重与肺活量的测量结果
问题:
(1)请绘制统计图来描述12名高三女学生的体重和肺活量之间的关系。
(2)什么情况下需要绘制散点图?
6.散点图(scatter chart) 散点图是用点的密集程度和趋势表示两事物现象间的相关关系。适用于双变量统计分析。如图1-11,绘制要点如下:
(1)横轴和纵轴各代表一种事物,横轴代表自变量,纵轴代表因变量。
(2)纵、横轴的起点均可不从“0”开始。
(3)每组观察值有两个数值,一个是自变量,一个是因变量,两者在图中用一点表示。
由表1-25的资料绘制成散点图1-11。
图1-11 某地12名高三女学生体重和肺活量的关系
归纳总结与思考
统计表与统计图是统计描述的重要工具。统计表由标题、标目、线条和数字所构成,可分为简单表和组合表。制表要求重点突出、简单明了、层次清楚、符合专业逻辑。统计图可以更加直观形象地表达分析结果,方便阅读和分析。常用统计图的适用范围和分析目的见表1-26。
表1-26 常用统计图的适用范围和分析目的
任务六 眼视光学中需注意的常见统计学问题
一、偏态分布的资料作为正态分布进行统计分析
视力是眼科和视光学中最重要的观测指标之一,其资料是偏态分布,工作实践中却常被研究者选择算术均数来进行统计分析评价。因正态分布的资料选用算术均数进行统计分析评价比较好,如果偏态分布的资料选用它,就不能较为真实客观地描述其资料的特征与规律。如正常人的视力多在1.0以上,年龄相关性黄斑变性患者的视力多在0.3以下,呈明显的偏态分布。这时选用均数会导致平均视力过高或过低,也就不能进行不同研究间的视功能的正确比较。偏态资料的资料可选用中位数或首先要进行数据转换,使其呈为对称分布,然后计算均值。视力数据通常可进行对数转换,转换为对数正态分布,这时计算的均值为几何均数。
目前,国外多数视力表的每两行视标的大小变化是按几何级数变化而制定的,即每两行之间的变化是恒定的,通常采用0.1log单位,每两行视标的大小差别是1.258 9倍。呈几何级数变化的视力表可以真实地反映患者的视功能状态,对此采用几何均数表达平均视力较为合适。LogMAR视力表则直接采用对数表示视力,将视力在0.1~1.0之间分为10个对数等级,则可直接计算其均数,再取反对数即得到患者的平均视力。但是Snellen视力表的视力呈算术级数变化,视角变化呈调和级数时(国内常用的所谓国际标准视力表即为此设计),选用调和均数为佳,只是调和均数往往低估患者的平均视力。因此,对视标呈不同变化级别的视力表,应分别计算相应的不同的平均数。有条件时,最好选用LogMAR视力表测定视力,求其几何均数说明其平均视力。
二、研究中注意双眼或单眼的选择
1.研究中选择双眼或单眼的方法 同一个人的双眼的某些资料具有高度相关性,在眼科或视光学研究中双眼不能作为独立样本来对待,应采用下列方法处理:①选择右眼;②选择左眼;③随机选择一只眼;④双眼取平均值。
2.计算 利用双眼数值计算其相关性。
3.双眼常做配对设计 在临床或试验研究中,常随机选择一只眼作为治疗眼(实验组),另一只眼作为观察眼(对照组),这种自身配对设计可比性较好。但是治疗作用必须在一只眼的局部,不能对另一只眼产生治疗影响。
三、注意不同类型资料间的转换
眼科或视光学研究中,不宜将计量资料转换为计数资料进行统计分析,因转化过程中可能会丢失有用信息,影响结论的正确性。如眼轴长度、屈光度或眼压等资料宜用计量资料进行统计分析,如果转化为计数资料进行统计处理,则会得出错误的结论。
四、样本量不宜过小
工作实践中,用较小的样本含量进行统计分析,因样本的代表性差,而会影响结论的代表性。例如实验动物(兔)采用3只、青光眼患者只选用4只眼进行统计分析是不恰当的。恰当的样含量应根据容许误差δ、所研究总体的标准差σ和Ⅰ类错误的概率α(α通常取0.05)来估算。
实践技能 运用SPSS统计分析软件对眼视光学领域资料的统计分析
【操作目的】
通过对案例资料的学习与讨论,使学生初步了解社会科学统计程序包SPSS主界面的菜单及其主要功能;初步学会运用SPSS统计分析软件包对眼视光学中的常见资料进行简单统计分析;掌握常用的统计分析指标与统计分析方法;能运用所学统计方法对眼视光学领域中的资料进行正确综合分析;能选择正确的统计表和恰当的统计图来表达统计分析结果。
【职业素质】
●培养学生综合分析解决问题的能力。
●培养学生沟通能力和团队协助能力。
●培养学生逻辑思维能力与严谨认真、实事求是的科研精神和工作态度。
【操作方法】
●教师简介示范,提出实践技能相关要求。
●学生以小组形式(每组3~5人)学习讨论SPSS统计分析软件包的应用及操作,并结合实例分析矫正。
●师生讲评,每组选出代表发言、交流。
【操作内容与实施】
●教师讲解系统综合分析眼视光学领地中资料的思维过程及方法步骤。
●教师讲解SPSS统计分析软件包主界面的菜单及其主要功能,并结合实例进行演示示教。
(1)File(文件管理菜单):有新建、打开、存储、显示和打印文件等功能。
(2)Edit(编辑菜单):有关数据内容的选择、复制、剪贴、删除、寻找和替换等功能。
(3)View(视图观察):状态栏、工具条、字体、方格线和数值标识等。
(4)Data(数据管理菜单):有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等。
(5)Transform(数据转换处理菜单):有关数值的计算、计数和、重新赋值、缺失值替代等。
(6)Analyze(统计分析菜单):一系列统计方法的应用。
(7)Graphs(作图菜单):各种统计图的制作。
(8)Uilities(用户程序菜单):有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等。
(9)Windows(窗口管理菜单):控制窗口的显示。
(10)Help(帮助菜单):主要有论题、指导、统计辅导等功能。
点击菜单选项即可激活菜单,弹出下拉子菜单,用户根据自己的需求再点击子菜单选项同,完成特定的统计功能。而统计分析结果输出后,不能被Word等常用文字处理软件直接打开,只能采用复制或粘贴方式使用。
【综合训练与技能提升】
●运用思维导图系统整理该项目各知识点间的关系,并对各学习小组作业学生自行评比。
●学生自主讨论、练习。
案例1 为研究眼轴与屈光度的关系,某验光师收集了20只近视眼的屈光度(D)与其眼轴长度(mm)。见表1-27。
表1-27 20只近视眼的屈光度与眼轴长度
(1)讨论思考题:
1)属于何种类型的资料?
2)选择恰当的指标分别描述20只近眼的屈光度和眼轴长度的集中趋势与离散趋势?为什么?
3)若比较20只近视眼的屈光度和眼轴长度的离散趋势应选择什么指标?为什么?
4)20只近视眼的屈光度和眼轴长度之间有无关系?
5)运用SPSS统计分析软件包进行统计计算。
(2)每组选出代表发言交流与师生讲评。
案例2 某研究者为研究某种治疗白内障的手术新方法,选择26名白内障患者,实验组14人,对照组12人,分别获得术前术后视力资料如表1-28和表1-29,了解两组患者手术前后的视力有无差异?
表1-28 实验组14例白内障患者手术前后的视力分布
表1-29 对照组12例白内障患者手术前后的视力分布
(1)讨论思考题:
1)属于何种类型的资料?
2)选择何种显著性检验方法?为什么?
3)运用SPSS统计分析软件包进行统计处理。
(2)每组选出代表发言交流与师生讲评。
案例3 探讨角膜塑形镜验配在不同年龄中度近视患者,相近程度近视性屈光不正矫治效果。方法利用标准片试戴法验配角膜塑形镜,在成功配戴角膜塑形镜的患者中,分别抽取15岁以下、16~20岁和20岁以上中度近视患者各30例(60只眼),利用fareast综合验光仪进行配前裸眼视力、屈光度数检查,与配戴角膜塑形镜矫治后裸眼视力进行对比。结果不同年龄的中度近视性屈光不正患者配戴角膜塑形镜后,青少年组显效率分别为74.28%和86.67%,20岁以上组显效率为4.54%。角膜塑形镜能有效矫治近视吗?对不同年龄的近视患者矫治效果是否不同?
(邢华燕 赵小钊)
项目二 流行病学常用的研究方法
学习目标
◆掌握 描述性研究、分析性研究的特点、常用方法及基本模式;流行病学的研究内容及研究方法;现况调查的基本原理、分类、眼病筛检的应用及原则。
◆熟悉 流行病学的用途;研究疾病分布的意义;病例对照研究和队列研究的概念、研究对象的选择方法、资料分析的方法及特点、常见的偏倚及控制方法;病例报告的内容;抽样调查的方法及特点;普查的特点。
◆了解 流行病学、眼病流行病学的基本概念;流行病学的原理及描述疾病分布常用的统计指标。
◆基本技能 说出疾病的三间分布、现况调查的实施步骤;能独立完成病例报告;会开展眼病的现况调查与筛检。
问题引导
1.如何获得某大学某年新生发生近视患者数?如何说明其严重程度?
2.如何获得某市60岁及以上老年人白内障患病率?
以上问题的解决需要用到流行病学的基本知识与研究方法。流行病学是建立在观察、推理和计算基础上的一门科学,是公共卫生学的基础。它是一门预防和控制疾病、促进健康的实用科学,也是一门重要的方法学。眼视光医务工作者的主要工作是视觉检查、眼睛的健康保健、屈光矫正眼镜的验配、角膜接触镜的验配、视觉训练、近视控制、低视力保健、公众视觉保健普及等。因此,眼视光医务工作者需要学习流行病学的基本概念、原理和研究方法及其在眼视光领域中的应用。
任务一 流行病学的基本概念与研究内容
一、流行病学与眼病流行病学
流行病学(epidemiology)是揭示疾病、伤害、健康和卫生事件在人群中发生、发展和分布的现象及其决定因素,提出预防、控制和消灭疾病及促进健康的策略和措施的科学。它是在人类与疾病斗争过程中逐渐发展成熟起来的。早年,传染病在人群中广泛流行,给人类带来极大的灾难,流行病学以研究传染病的发生与流行规律为主,并进行深入的流行病学调查研究,采取防制措施,为传染病的控制发挥了重要的作用,形成了较系统的理论。随着主要传染病逐渐得到控制,传染病发病率和死亡率的大幅度下降,慢性非传染性疾病成为20世纪后期影响人类健康的主要疾病。危害人类健康的疾病谱与死因谱的变化,医学模式由生物医学模式向生物-心理-社会医学模式的转变,流行病学又应用于研究慢性非传染病,应用范围不断扩大。如心血管疾病、糖尿病、恶性肿瘤、视觉残疾等也成了流行病研究的重要任务。此外,流行病学还应用于促进人群的健康状态的研究,流行病学的理论与方法也日趋完善成熟,成为预防医学和现代医学的骨干学科,被誉为“公共卫生之母”。目前流行病学的研究对象又扩大到与健康有关的状态及卫生事件。
流行病学与眼科学结合起来,将流行病学的理论与方法运用到眼科学及视光学领域,研究眼病及视觉问题发生、发展和流行的规律,发现其危险因素和病因,评价预防、保健、防治的效果,提高人群的眼视觉健康水平,以提高其生命质量,也称之为眼病流行病学。1974年第三届巴黎国际眼科大会强调指出了“公共卫生眼科学”的新概念。眼科流行病学是公共卫生眼科学的重要内容之一。它不但研究传染性眼病,如沙眼、急性结膜炎、感染性角膜炎的研究和防治,也更加关注严重的非传染性致盲性眼病,如白内障、屈光不正、糖尿病视网膜病变、青光眼的研究和防治,同时眼病流行病学也是初级眼保健和防盲治盲工作的理论基础和重要的方法。
二、流行病学的研究内容
在长期的医学实践中,传统的流行病学所形成的科学方法在医学众多领域发挥着重要作用。流行病学不但渗透到公共卫生学、预防医学、临床医学领域,也渗入基础医学、视光学的各个领域,与相关学科相互结合、相互渗透,产生了许多交叉性学科。因此,流行病学研究及应用范围非常广泛,概括为以下几方面的内容。
1.研究疾病、伤害与健康状况的分布 调查研究对象的年龄、性别、职业等自然特征,研究人群疾病、伤害与健康状态在不同时间、不同地区及不同人群中的发病率、患病率或死亡率等。研究疾病或健康状态的分布是流行病学研究工作的起点,依据疾病或健康状态在人群中的分布特点,可以提出某些病因或流行因素的假设,也可为卫生行政决策提供参考依据。例如,通过调查人群眼病患病率、近视率等,研究人群眼健康状况,评价眼保健措施的效果,为卫生管理部门制订眼保健政策提供依据。
2.探讨疾病的病因、危险因素与流行因素,制订疾病预防和控制的对策与措施 流行病学可探讨引起各种疾病的特殊病因,从而寻找预防和控制这些疾病的防治措施。根据疾病的病因、分布特点,不同时期的气候条件,不同地区的地理环境条件、经济条件、卫生条件及人们的生活习惯、文化水平等可能影响某种疾病的发生或流行,成为影响疾病发生或流行的危险因素。流行病学可通过探讨疾病的散发、暴发或流行的因素,从而提出有效的控制措施。如某地区卫生条件差、住房拥挤等会加重沙眼的流行。若提高当地卫生条件,改善环境条件,人们养成良好的卫生习惯,可控制沙眼的发生与流行。
通过对人群健康状况的评价,了解和掌握疾病的病因、流行因素和分布状况,明确疾病的病因及其危险因素,针对具体地区、具体人群、具体疾病制订其合理有效的卫生策略和防治措施,以达到控制或根治某些疾病的目的。同时,对各种预防措施的考核与筛选也需要运用流行病学方法。
3.研究疾病的自然史(natural history) 疾病从发生、发展到结局的整个过程,经历症状出现前阶段、临床症状和体征出现阶段及疾病结局(治愈、好转、死亡、恶化等)几个阶段。不同的疾病自然史不同,对疾病自然史的准确了解,可以帮助医务人员对患者病情做出迅速、准确的判断。通过流行病学方法研究人类疾病的自然史和健康的发展规律对研究与评价预后有着重要的意义,为提出准确的治疗和预防措施提供依据,以用于疾病预防和健康促进。
4.患病概率、死亡概率的预测 根据人群调查研究,可以估计某因素引起个人或人群患某病的危险性,以及不患某病的概率。例如,通过流行病学调查资料表明,每天吸烟25支以上者,死于肺癌的危险性比不吸烟者高32倍。
5.用于医疗、卫生、保健服务的决策和评价 通过描述人群中有关疾病与健康状况,使卫生行政主管部门了解人群中的疾病及其有关因素所造成的负担,有助于确定优先的预防及保健项目的卫生规划,使有限的卫生资源发挥最好的效益。流行病学研究还可用于评价卫生服务的效果及效益,如确定某病(如脑梗死)的最适宜住院期限,确定治疗某病(如肺癌)的价值,确定最为经济有效的治疗方案等。
6.评价防治疾病的效果 综合运用流行病学方法、统计学和社会医学的方法,针对主要疾病的防治措施评价其防治效果,为进一步提高疾病防治效果,制订相应措施提供科学依据。如观察疫苗接种的效果,了解新药的安全性和有效性,评价社区预防眼病的干预项目,评价卫生工作或卫生措施的效果等,均需进行流行病学研究是否降低了人群发病率,提高了治愈率和促进健康水平。
任务二 流行病学的基本理论
问题引导
1854年秋季,伦敦宽街暴发霍乱,10天内死去500多人。惊人的死亡率促使当地居民纷纷逃往他处,在霍乱暴发后的6天内,发病严重的街道有3/4以上的居民离去。当时霍乱病原体尚未发现。英国医生John Snow深入现场,对8月31日至9月2日三天内所发生的89例死亡病例做了详细调查,并将死亡病例标点在地图上,首创了标点地图分析方法。从标点地图发现死亡病例集中分布在宽街水井周围。根据这种分布特点,John Snow认为此次暴发是由于宽街水井被污染引起,封闭该水井后,暴发即告终止,该结果比霍乱弧菌的分离早30年。
一、疾病分布
疾病的分布(distribution of disease)是指通过疾病的频率指标描述疾病在不同时间、不同地区、不同人群的发生频度与分布现象,简称“三间分布”。疾病分布的研究是流行病学研究的起点和基础,属于描述性研究的范畴。任何疾病在人群中都具有一定的分布形式,通过描述疾病分布规律,分析、比较疾病的分布特征,可以认识疾病的流行特征;帮助查找重点防治对象和重点防治疾病;发现病因线索,探讨病因;为制定疾病的预防和控制策略和措施提供科学依据;评价预防和控制措施的效果。
(一)疾病频率测量指标
采用数量频率指标测量疾病的分布可进行定量比较分析发现差异。常用的测量指标有:
1.疾病发生的频率指标
(1)发病率(incidence rate),是指特定人群在一定时间内(一般为1年)发生某病新病例的频率。
式中,K=100%,1 000‰,10 000/万或100 000/10万。
发病率是描述疾病的分布,探讨发病因素和评价预防措施效果的重要指标。在计算发病率时,时期通常以年来表示,也可根据所研究的病种及研究问题的特点而决定,以1天、1周、1个月来表示。新病例是指在观察期间新发生的病例。流行性感冒、急性心肌梗死、急性角膜炎等急性病,其发病时间容易确定,新旧病例容易区分。而慢性病发病时间难以确定,一般以初次确诊时间为发病时间。在观察期间内,如果同一个人发生一次以上同种疾病(如一年内患几次感冒),则应分别计为几个相应新发病例。暴露人口也称危险人群,必须符合两个条件:①必须是观察时间内观察范围内的人群;②必须有可能发生所观察的疾病。正在患病或因曾经患病或接受了预防接种,而在观察期内肯定不会再患该病的人不能算作暴露人口。
发病率反映了疾病发生的比率,可用于描述疾病的分布。发病率可按不同特征,如年龄、职业、性别、民族和婚姻状况分别计算,通过不同人群的某种疾病发病率的比较确定可能的病因,提出病因假设,探讨发病因素,评价防治措施的效果。
(2)罹患率(attack rate)与发病率同样是测量人群中新发病例发生频率的指标,常用于小范围人群或较短时期内某病新病例发生的频率,观察时间可以日、周、月为单位,也可以一个流行期为时间单位。其优点是能根据暴露程度更为精确地测量发病的频率,常用于疾病流行或暴发时病因的调查。
式中,K=100%,1 000‰。
(3)续发率(secondary attack rate,SAR),也称二代发病率,是指在某些传染病最短潜伏期到最长潜伏期之间,易感接触者中因受其感染而发病的病例数占所有易感接触者总数的百分率。
续发率是反映传染病传染力强弱的指标,也用于分析传染病流行因素及评价防疫措施的效果。
2.疾病存在频率的指标
(1)患病率(prevalence rate),又称现患率,是指在某一特定时间内总人群中某种疾病的现患新旧病例所占的比例。常用来表示病程较长的慢性病的存在或流行情况,可为规划医疗设施,估计医院床位、卫生设施及人员的需求量,评估医疗质量和医疗费用的投入等提供科学依据。
式中,K=100%,1 000‰,10 000/万或100 000/10万。
根据观察时间的不同,可将患病率分为时点患病率(point prevalence)和期间患病率(period prevalence)。时点患病率的调查时间期间一般在1个月以内,而期间患病率的调查期间常常超过1个月。
(2)感染率(infection rate),是指调查人群在某一特定时间内某病现有感染者人数所占的比例。感染率的性质与患病率相似,常用于研究某些传染病或寄生虫病的人群感染情况和分析防治工作的效果。
知识拓展与自学指导
影响患病率的因素
(1)增高患病率的因素:未治愈者寿命延长或病程延长;观察期间疾病发病率增加,新病例增加;疾病易感者在人群中比例升高,如疾病易感者迁入,健康者迁出;病例迁入;诊断水平提高,发现更多病例。
(2)降低患病率的因素:病程缩短;病死率增高;观察期间疾病发病率下降,病例减少;疾病易感者在人群中比例下降,如疾病易感者迁出,健康者迁入;病例迁出;治愈率提高。
当某地某种疾病的发病率和该病的病程在相当长时期内保持稳定时,患病率(P)=发病率(I)×病程(D),这时可计算某些疾病的病程。
3.死亡统计指标
(1)死亡率(mortality rate),是指在一定时期内(通常指1年),某一定人群中死于某种疾病或所有原因的人数在该人群中所占的比例。是测量人群死亡危险最常用的指标。
计算时,常以年为单位。平均人口数,一般用年中人口数或年初人口数与年终人口数之和除以2。
死于某种疾病的死亡率是某病死亡率,而死于所有原因的死亡率是一种未经调整的率,也称粗死亡率。死亡率用于评价一个国家或地区某一时期、某一地区的人群死亡危险性大小的指标,也反映居民总的死亡水平,是一个国家或地区卫生、经济、文化水平的综合。不同地区、不同年代人群的年龄、性别构成不同,死亡率不能直接比较,必须先将死亡率标准化,以排除年龄或性别构成不同造成的影响。因此常将未标准化的死亡率称为粗死亡率。死亡率也可以按照不同特征如疾病种类、人群的年龄、性别、职业等分别计算,称为死亡专率。死亡专率可以提供某病死亡在人群、时间和地区中变化的信息,也可用于探讨病因和制订防治措施。
(2)病死率(fatality rate),是指在一定时期内患某病的全部患者中因该病死亡者所占的比例。
病死率可说明疾病的严重程度,常用于病程短的急性病,以衡量该病对生命威胁的程度,也可用于评价医院的医疗水平。
知识拓展与自学指导
生存率
生存率(survival rate)是指接受某种治疗的患者或某病患者中,经若干年随访(通常为1年、3年、5年)后,尚存活的患者数所占的比例。生存率反映了疾病对生命的危害程度,也可用于评价某些病程较长疾病的远期疗效,在某些慢性病如癌症、心血管疾病等的研究中经常使用。
4.频率测量指标在眼视光学中的应用
(1)白内障患病率,是指在某一特定时间内一定人群中白内障现患新旧病例数所占的比例。
(2)白内障手术覆盖率,是指应施行白内障手术的人群中接受白内障手术者所占比例。应施行白内障手术的人群包括接受白内障手术的人数、未接受白内障手术的人数和因白内障致盲而未施行白内障手术的人数之和,常以百分率来表示。
(3)致盲率(prevalence of blindness),是指某一特定时间内总人口中盲人所占的比例。
(二)疾病流行的强度
疾病的流行强度是指某种疾病在某地区一定时期内某人群中发病数量的变化及病例间的联系强度。常用散发、暴发、流行和大流行表示。
1.散发(sporadic),是指某病在一定地区人群中呈历年的一般发病率水平(即发病率维持历年的一般水平),病例在人群中散在发生或零星出现,且病例间无明显联系。历年的一般发病率水平可参照当地前三年该病发病率的平均水平。确定是否散发一般与同一个地区的同一种疾病前三年的发病率水平比较,如当年的发病率未明显超过历年的一般发病率水平时为散发。形成散发的原因:①某病在当地常年流行,居民有一定的免疫力或因疫苗接种维持人群一定的免疫水平;②以隐性感染为主的传染病;③传播机制难以实现的传染病;④潜伏期的传染病。
2.暴发(outbreak),是指在一个局部地区或集体单位的人群中短时间内突然发生许多临床症状相似的患者的现象。短时间主要是指在该病的最长潜伏期内。暴发的原因主要是通过共同的传播途径感染或由共同的传染源所引起,如集体食堂的食物中毒、托幼机构的麻疹暴发流行等。
3.流行(epidemic),是指某地区某病发病率显著超过历年的散发发病率水平。流行与散发是相对的流行强度指标,一般要与当地的历史发病水平比较。若某地某病达到流行水平,则可能有促进发病率升高的因素存在,应当引起注意。
4.大流行(pandemic),是指某病发病率远远超过流行水平。其特点是疾病传播迅速,涉及地域广,往往在短时间内越过省界、国界。如流行性感冒、霍乱、鼠疫,历史上曾发生过多次世界性大流行。
知识拓展与自学指导
地方性疾病与输入性疾病
(1)地方性疾病(endemic disease):是指某些疾病经常存在于某一地区或某一人群或呈现发病率增高时,这种现象状况称为地方性,具有地方性的疾病称为地方性疾病。
(2)输入性疾病(imported infectious disease):现有的疾病是本国不存在的或曾经有但已经消灭,这种从国外传入的特性称为输入性。具有输入性的疾病称为输入性疾病,如艾滋病等。
(三)疾病的三间分布
在描述疾病的流行特征时,通常从疾病在不同地区、不同时间和不同人群三个方面的分布来说明,称为疾病的三间分布。流行特征是判断和解释病因的依据,也是形成病因假设的重要来源。
1.地区分布 疾病的地区分布是描述各地区某病的发生频率,不同国家之间,城市与乡村之间,平原与山区之间,疾病的发生可能存在着明显的不同。影响疾病不同地区分布的因素可能是自然环境和社会条件,如自然地理环境、社会制度、经济发展水平、人口密度、宗教、文化、生活习惯、卫生条件、医疗设施。了解疾病在空间上的特征,为探索病因及影响因素提供线索。
描述疾病的地区分布,可以用疾病地区分布图,也可以按照不同地区计算发病率、患病率、死亡率等指标进行比较,比较时需要先进行率的标准化。
(1)疾病在不同国家间的分布:某些疾病只存在于世界某些地区,某些疾病在全世界均可发生,但其在不同地区的分布各异,发病和死亡情况不一。如黄热病的分布与埃及伊蚊的分布一致,主要在非洲及南美洲流行。肿瘤发病在世界各地的差别更为明显。如肝癌主要分布在东南亚,而欧洲、美洲则少见。乳腺癌在北美洲、北欧、西欧发病最多,东欧次之,非洲和亚洲各国较少。糖尿病在发达国家的患病率高于发展中国家。欧美各国心脏病死亡率高于我国和日本。我国和日本脑卒中死亡率高于欧美各国。
(2)疾病在同一国家内不同地区的分布:疾病在同一国家不同地区的分布也有明显差别。我国疆域辽阔,人口众多,地处温带和热带气候区,南北气温相差悬殊,地势高低起伏,河流纵横交错,各种民族地区和杂居地区具备人民生活习俗和卫生文化水平差异明显,这些是了解疾病流行因素和探讨病因的有利条件。例如鼻咽癌在我国以广东、广西、福建等南方六省(自治区)死亡率较高,其中死亡率最高的是广东省,但广东省内不同人群的死亡率也有差别,以讲广东话的居民死亡率最高,可能与遗传易感性、饮食习惯、EB病毒感染等多种因素有关。
(3)疾病的城乡分布:城市与乡村在经济发展、自然环境、卫生条件、生活习惯等方面存在较大的差别,因此疾病分布有城乡差异。卫生部公布了2005年城乡居民主要死亡原因,城市恶性肿瘤、心脑血管病在居民死亡中已处前列。而农村地区呼吸系统疾病仍居首位,而且肺结核的死亡还居于前十位死因之列。
城市人口密集、流动性大,容易发生呼吸道传染病的流行。城市中工业集中,空气污染比较严重,空气中有害物质的浓度比农村高,是城市肺癌发病率比农村高的可能原因。细菌性痢疾、甲型肝炎、伤寒等肠道传染病及寄生虫病、农药中毒等,农村发病显著高于城市。食管癌、肝癌、宫颈癌等恶性肿瘤也是农村多于城市。
2.时间分布 疾病发生的频率随时间而不断变化,是一个动态的过程。分析疾病的时间分布特点,亦能探索某些病因和流行因素的线索。时间分布的表现形式有四种类型。
(1)短期波动:在较大人群中出现的某种疾病的流行或暴发。易发生短期波动或暴发的疾病主要是急性传染病和急性中毒性疾病,如麻疹、流行性脑脊髓膜炎、食物中毒等。疾病的短期波动社会影响大,病因较易推断。
(2)季节性:是指疾病的频率在一定季节内升高的现象。呈季节性变化的疾病主要是传染病,一些营养缺乏病、过敏性疾病有某季节多发的现象,一些慢性病的急性发作(脑血管意外等)与季节变化有一定关系。季节性有两种表现形式:一种是季节性升高,即一年四季均可发生,但在一定季节,其发生率升高。如春季结膜炎发病率明显升高,呼吸道传染病一般冬春季高发,肠道传染病则多发于夏秋季;另一种是严格的季节性,即一年中只在某些季节有某病发生,经吸血节肢动物传播的疾病大多呈严格的季节性。
疾病季节性变化的原因较复杂,受气象条件、昆虫媒介、风俗习惯及生产、生活活动等因素的影响。研究疾病的季节性变化有利于探索病因和流行因素,并有助于提前采取防制措施。
(3)周期性:是指疾病有规律地每隔一个时期出现一次流行高峰的现象。如麻疹在城市表现为两年一次流行高峰、流行性脑脊髓膜炎7~9年流行一次。通过有效的疫苗接种,则可削平流行高峰。
知识拓展与自学指导
疾病周期性的原因
疾病呈现周期性的原因主要有:①该病的传播机制容易实现;②病后可形成较为稳固的免疫;③由于新生儿的累积,使易感者的数量增加;④病原体的抗原发生变异,使原来的免疫人群失去免疫力。
(4)长期趋势:是指疾病的发病率、死亡率或临床表现等在一个较长时期(多指长达几十年)的变化趋势,也称长期变异。如随着近视眼患病率的不断增高,原发生闭角型青光眼的患病率有可能降低,因前者是前房加深,后者是前房变浅。引起疾病长期变异的原因可能是:致病因素的变化、社会生活条件及生产生活习惯的改变、医疗技术的进步、自然条件的变化及环境污染等因素,导致致病因子和宿主发生了变化。但是在长期观察研究疾病长期变异时应注意疾病诊断标准的变化和诊断技术进步的影响。
研究疾病长期变异的趋势,探索导致变化的原因,可为制订中长期疾病预防战略提供理论依据。
3.人群分布 疾病在人群中某一属性上的分布特点,如年龄、性别、民族、职业、宗教、婚姻与家庭、流动人口等人群属性上的不同。这种分布差别的原因主要有宿主的遗传、免疫、生理及暴露机会等。研究疾病的人群分布特征有助于探寻致病病因和流行因素的线索,明确高危人群。
(1)年龄:是人群分布中最重要的因素。由于不同年龄人群有不同的免疫水平、不同的生活和行为方式、对危险因子的暴露机会等不同。因此,几乎所有疾病的发病和死亡都与年龄有关。不同类型的疾病可有不同的年龄表现。如婴幼儿易患急性呼吸道传染病,盲和视力损伤易发生在高龄的人群中,青少年近视眼的患病率较高,老年人易患白内障,一些非传染性疾病,如恶性肿瘤、高血压、冠心病等,其发病率随年龄增高而升高。
研究疾病年龄分布的目的是:①确定疾病的高危人群及重点保护对象;②探索流行因素,提供病因线索;③分析传染病的年龄分布动态,了解人群的免疫状况;④制订预防措施并评价其效果。
(2)性别:多数疾病的发病率和病死率有一定的性别差异。疾病在不同性别间分布差异的原因主要是暴露于致病因子的机会或程度不同,其次是存在解剖、生理、心理方面的差异。如全国肺癌的男女死亡率比约为2∶1,血吸虫和钩端螺旋体病常因下田劳动而造成感染。因此,一般男性高于女性,胆囊炎和胆石症以中年女性多发,可能与解剖、生理特点有关。描述疾病的性别分布,一般是比较男女的发病率、患病率或死亡率,有时也可以用性别比来表示。
(3)职业:许多疾病的发生与职业因素有关系。职业与疾病的关系,首先应考虑暴露机会的多少与劳动条件;其次应考虑职业反映劳动者所处的社会经济地位和文化卫生水平;此外,不同职业的体力劳动强度和精神紧张程度不同,在疾病种类上也有不同反应。如炉前工易患白内障,跳水运动员易患视网膜脱离,潜水员易患视网膜血管阻塞,暴露于游离二氧化硅的碎石工易患矽肺,煤矿工人易患尘肺;生产联苯胺的工人易患膀胱癌,饲养员、屠宰工人及皮毛加工工人易患炭疽和布鲁菌病等。与不同职业人群的劳动强度和精神紧张程度有关的疾病,有汽车司机和飞行员则易患高血压和消化性溃疡。另外,劳动者的职业也决定了劳动者所处的社会经济地位和所享有的卫生服务水平,这些因素无疑对某些疾病的发生有影响。
(4)种族和民族:不同种族和民族发病率、死亡率有明显差异。其影响因素有:①遗传因素不同,如我国广东是世界上鼻咽癌的高发区,而移居到东南亚、美国的中国广东籍人鼻咽癌发病率仍高,提示鼻咽癌的发生与遗传因素有关;②宗教信仰和风俗习惯等不同,如伊斯兰教民族,男童一律行包皮环切术,使男子阴茎癌的发病率很低;③民族定居点所处的自然和社会环境不同;④不同民族间社会经济状况和医疗卫生质量、水平不同。
(5)行为:行为方式是影响人们健康的重要因素,尤其不良的行为生活方式(如吸烟、饮酒、饮食不当、缺乏体育锻炼、吸毒等)可导致许多疾病。如长期饮酒易患慢性球后视神经炎,据世界卫生组织报道,在发达国家和部分发展中国家,危害人类健康和生命的主要原因是恶性肿瘤、冠心病、脑卒中、高血压、糖尿病等慢性非传染性疾病,而这些疾病的发生与发展,60%~70%是由于社会因素和不健康的生活方式与不良行为习惯造成的。
二、病因论与因果推断
研究病因与因果推断是流行病的基本原理。病因的研究不仅同疾病的诊断有关,也直接关系到疾病的治疗与预防,探讨疾病的病因、危险因素与流行因素,制订疾病预防和控制的对策与措施,并评价防治效果是流行学的研究内容之一。
(一)病因的概念
1.概率论因果观 传统的决定论因果观认为,一定的原因必然导致一定的结果。因客观世界本身的发展变化具有概率性,从经验证据得出的结论也是归纳性,归纳性的结论也具有概率性,现代科学由此产生了概率论因果观。原因就是使结果发生概率升高的事件或事物特征,即一定的原因只是可能而不是必然导致一定的结果。
2.现代流行病学的病因 早期,流行病学以研究传染病为主,对病因的研究主要关注环境卫生条件水、空气和居住条件等,如甲肝的流行同饮水污染及食物有关。随着微生物学的发展,细菌学的兴起,对病因的研究转到特定的病原体,如Koch发现了结核病是由结核杆菌引起。对传染病来讲,不仅仅有了病原体就会发病,还会有宿主和环境因素的影响而导致疾病,并形成了病因、宿主和环境的平衡失调引起疾病的理论。环境对疾病的发生有着重要的影响,如长日照、高海拔和低营养水平的地方,白内障的患病率明显增高;对于照明差、学习负担重的儿童近视眼患病率会增高;长时间电脑操作工作人员视频终端综合征的发病率增高。
20世纪50年代,流行病的研究逐步扩展到非传染性疾病,病因的研究也就不再仅仅局限于传染病的特定病原体,还认识到一些疾病的发生是由多种原因引起。如白内障的发生由日照时间长和营养缺乏作用的叠加引起。还有一些疾病是由因果相联而导致,如淋雨易引起感冒,感冒引起机体抵抗力下降,机体抵抗力差易导致单纯疱疹病毒性角膜炎的发生。这种疾病发生因有关因素的复杂化,产生了疾病发生的病因网络学说。1980年,Lilienfeld从流行病学角度定义病因:凡能使人群发病概率升高的因素,就可认为是病因,其中某个或多个因素不存在时,人群疾病频率就会下降。这也使得流行病学探讨病因时通过疾病的分布从病因网或病因链中找出与疾病发生关系密切的关键因素。流行病学中的病因一般也称为危险因素。
知识拓展与自学指导
传染病发生与传播的基本条件:病原体、宿主和环境。传染病流行过程的三个基本条件:传染源、传播途径和易感人群。
(二)因果推断
因果关系研究必然涉及因果推断的问题,即运用描述性流行病学方法,仔细研究疾病的分布,依据疾病的分布特点和医学知识提出疾病病因的假设。运用逻辑方法归纳推理进行流行病学方法的反复检验,以推断这些假设的病因与疾病之间的因果关系。
1.建立病因假设 病因假设是在为数不多的经验事实以及已有理论的基础上,通过逻辑推理或创造性想象或猜测等形成。
2.因果推断及验证 因果推断的逻辑方法主要是归纳推理方法,包括假设演绎法和消除归纳法(Mill准则)。验证假设的病因可通过实验的方法在动物或人群中进行证实,但动物模型难以建立,在人群中进行证实病因假设的试验有时也有难度。较好的方法则是利用观察和许多询问等手段来调查社会人群中的疾病和健康,从而描述频率和分布,如现况调查。通过归纳、综合和分析提出假说,然后采用分析性研究对假说进行检验,如病例对照研究或队列研究。最终通过实验研究来证实,如临床实验或现场实验。同时研究结果又能得到发病机制的相关研究支持,则可最后确定假设的病因为真正的病因。
(1)假设演绎法(hypothetic deductive method)最早由赫歇尔(Hershel)提出,其中“演绎”仅仅指待观察(检验)的经验事实(证据),可由假设相对于背景知识而演绎地推导出来,从一般的假设导出具体个别的事实(证据),就是一个演绎推理。但从具体个别的事实成立而推出一般的假设成立,则是一个归纳推理。其推理过程为:从假设演绎地推出具体的证据,然后用观察或实验检验这个证据,如果证据成立,则假设亦成立。从一个假设可推出多个具体证据,多个具体证据的经验证实,则可使归纳支持该假设的概率增加。如假设H:长时间近距离用眼导致近视;根据该假设H,以相关背景知识为前提,演绎地推出若干具体经验证据E1(近视患者的长时间近距离用眼高于对照)、E2(长时间近距离用眼队列近视发生率高于对照)、E3(改变长时间近距离用眼后,近视的发生率下降)。如果证据E1、E2、E3成立,则假设H亦获得相应强度的归纳支持。
(2)Mill准则主要的应用是分析流行病学研究的比较推理。Mill准则先由穆勒提出实验四法,后人将同异并用法单列,成为科学实验五法:求同法、求异法、同异并用法、共变法和剩余法。
求同法:如果在不同情况下,发生某种疾病的患者均有某种相同的因素时,则这种因素有可能是疾病的病因。
求异法:如果不同组别人群中,某种疾病的发病率有明显的差异,同时发现不同组别人群中某些因素有差别时,则这种有差别的因素很可能是导致疾病的病因。
同异并用法:如果在不同情况下,发生某种疾病的患者均有或相当部分(统计学显著地)有某种相同的因素,而在未患某种疾病的人群中(对照组)中均无或相当部分(统计学显著地)无相同的因素,则该种因素有可能是导致疾病的病因。
共变法:如果某一因素的量变引起疾病的发病率发生变化时,说明该种因素有可能是导致疾病的病因。
剩余法:如果已知某些因素(a、b、c)共同存在时,引起相应的疾病结果(A、B、C),通过先前的归纳研究又已知a说明A,c说明C,则剩余的b必定说明B。
3.统计关联 流行病学在探讨病因时,要先判明某种疾病与某种事物之间是否有联系,然后判断联系的意义,在许多事物中找出与疾病发生具有因果关系的事物。当两事物之间存在密切的数量关系,并通过统计学方法来判定事物之间是否存在着联系。统计学上,两种事物之间的联系形式有以下3种。
(1)人为的联系:是由于在调查研究中因偶然因素或有意造成的假象。如在研究某种措施预防近视的效果时,并没有客观的指标,全凭受试者的主观反应来判断,就有可能真实地反映两种事物间的联系。
(2)间接的联系:如果事物A能引起事物B,事物B能引起事物C时,事物A与事物C之间也会有统计学相关性,而这种相关性是一种间接联系。再者如果事物A能引起事物B,也能引起事物C时,事物B与事物C之间也会发生统计学相关,这种相关也只是一种间接联系。干预事物B不会使C发生的改变。
(3)因果关系:在有统计学相关性的事物中,某事物会因另一种事物的发生而发生,这两种事物间可能是因果联系。
4.因果推断的标准 判断某种因素是否为某种疾病的病因时,还须考虑一定的条件。
(1)关联的强度:一般来讲,关联的强度越大,因果关联的可能性越大。但须排除混杂因素的情况下,得出此结论。
(2)关联的时间性:当两种事物之间有因果关系时,原因总是发生在结果之前,因果关系的可能性会更大。
(3)剂量效应关系:如果作为病因的因素剂量会影响人群某种疾病的发病率也随之变化时,则可能是因果关系。
(4)关联的特异性:如果某种因素与多种疾病之间有关,其特异性就低。如果某种因素与一种疾病之间有关,其特异性就高。
(5)关联的普遍性:如果某种因素与某种疾病之间在不同时间、不同地点和不同人群中都有同样有意义的结果时,因果关系的可能性会更大。
(6)关联的可重复性:作为病因的因素与某疾病之间的多次因果研究实验,其结果相同时,因果关系的可能性增加。
(7)实验论证:有实验根据支持两事物之间因果关系时,确定二者之间因果关系的把握性更大。
(8)分布的一致性:作为病因的因素的分布与疾病的空间分布、时间分布相符合时,因果关系的可能性大。
一个因果研究本身必须要满足第1、第2条标准,第7条标准决定了因果关联结论的把握度。满足的条件越多,判断事物之间因果关系时出现的错误概率就越小。但即使不能完全满足上述8个条件,也不能否定因果关系的存在。
知识拓展与自学指导
应用Mill准则的注意事项
如果病因假设清单没有包括真实的病因,Mill准则就不能提供任何帮助。再者,Mill准则原本是用于能控制干扰条件的实验类型,以及假定原因为确定性的必要或充分条件。因此,对于观察性研究或非确定性条件,Mill准则需要控制混杂或做概率性推广。
(邢华燕)
任务三 流行病学的研究方法
流行病学是一门应用学科,也是逻辑性很强的科学研究方法,且在众多的医学领域中发挥着重要的作用。如临床医学领域中运用流行病学方法,从群体角度来研究疾病的自然史、诊断方法及疗效评价,其目的是解决各种临床问题,如疾病的分布规律、治疗、影响预后的因素、疾病病因和危险因素等。
流行病学研究方法分为观察性研究、实验性研究和理论性研究三大类。又以观察性研究和实验性研究为主。观察法是流行病学的主要研究方法,它是在疾病自然发生过程中,通过现场调查和资料分析来认识疾病的自然发生发展过程。观察性研究方法在观察时不施加人为因素,是对疾病自然发生发展过程的观察,它包括描述性研究和分析性研究两大类。
一、描述性研究
描述性研究(descriptive study)是描述疾病或健康状态的分布以揭示其发生发展的规律及其现象,为病因研究提供线索,即提出假设。具体来讲,它是采用常规监测记录或通过现场调查获得的数据资料(包括实验室实验结果),按照不同时间、不同地区及不同人群特征分组,描述人群中疾病或健康状态与暴露因素的分布情况,再经过比较分析,获得疾病三间分布特征,进而提出病因假设和线索。在揭示暴露和疾病因果关系的过程中描述性研究是最基础的步骤,也是流行病学研究工作的起点,其他流行病学研究方法的基础。描述性研究主要包括病例报告、现况调查、生态学研究等研究方法。
(一)病例报告
1.病例报告的概念 病例报告(case report)包括个案报告和大宗病例分析,是指研究具有某一或一系列具体情况,或接受某一种治疗的临床病例,无特设对照组,只是描述所研究疾病的发生和分布,不能用于估计发生该病的危险程度。
病例报告往往对一些罕见或特殊的疾病进行报道,全面介绍疾病的发生、发展与转归,报道疾病的诊断、治疗和疗效评定结果。个案报告是研究少见病常用方法,通过对临床上一个或几个特殊病例的报道,往往可以提供许多有价值的信息,为循证医学研究提供临床信息。
2.病例报告的内容
(1)说明该病例为何值得报道。
(2)对病例进行描述,提供有关的数据资料。
(3)说明判断该病例未曾报道过的依据,或指出该病例的独特之处,并加以讨论。
(4)该病例的各种特点是否还有其他可能的解释。
(5)指出该病例给予笔者和读者的启示,做出结论。
3.病例报告的步骤
(1)选择合适、典型的病例是写好病例报告的关键。合适、典型的病例主要是指选择特殊的病例,诊断或治疗某种疾病新方法,或常见疾病的异常现象等。为选择合适的病例、写好病例报告,应当进行广泛的文献检索,确定此报告有无报告价值,能否给读者以启示。
(2)提供完整的资料,明确报告病例的诊断及依据。病例报告包括病例一般资料(个体特征)、现病史、疾病发展过程及结局、各项临床检查、诊断与治疗、分析结论及病例的启示等资料。如性别、年龄、职业、婚姻史、主诉、现病史、既往史、体格检查、实验室检查、特殊检查、诊断与鉴别诊断、治疗与结局、预后等资料。临床资料部分中,描述治疗措施与效果是重点内容。个案报告资料应具有完整性、准确性和真实性,以便客观反映病例的实际情况。病例报告可以是一个典型病例,也可以是一组相同疾病的资料。病例报告需要对于病例资料进行搜集、整理、分析、总结并得出结论。
4.病例报告的优缺点 病例报告是一种描述性研究方法,观察对象少,资料容易收集,易于做到翔实、准确;节省人力、物力与财力;研究过程中较少涉及伦理道德的问题,易于为医生和患者接受。其缺点是观察例数少,代表性较低,论证强度较低,可信度较差。因未设对照组,不能较好控制混杂因素,可能会导致错误的结论。又因研究对象仅为病例,无发生该种疾病的危险人群,故不能估计该病发生的危险度。
(二)疾病发生的流行病学描述
通过收集个体特征资料,如性别、年龄、种族、文化程度、职业、婚姻、社会经济状况、居住地区、调查时间、发病情况、疾病史等研究对象人群资料,以分析研究什么时间、什么人群、什么地区易发生某种疾病。
描述疾病流行病学分布特征时常选择一些相应指标,以定量化说明患病情况,便于分析比较说明。常用指标见本项目二中任务二的疾病分析内容所述。
(三)现况研究
问题引导
如何才能获得某市儿童低视力患病情况?制订调查实施方案?
1.现况研究的概念 现况研究(prevalence study)又称现况调查或横断面研究,是运用某种手段对某一特定时间内某一特定范围的目标人群,以个人为单位收集和描述人群的特征及疾病或健康状况的方法。现况调查所获得的描述性资料是特定人群在某一个时间断面的疾病信息,因而又称横断面研究(cross sectional study)。它能了解某一时点或时段的疾病患病率。
2.现况调查的目的和用途
(1)了解目标人群中疾病或健康状况的分布特征。通过现况调查可以描述目标人群中疾病或健康状况的三间分布,发现高危人群,分析疾病或健康状况的频率与哪些环境因素、人群特征等因素有关,为疾病的防治提供依据。如欲了解我国青少年近视患病情况,则可采用某种抽样技术,从我国青少年中(总体)随机抽取足够数量的研究对象(样本),逐一进行细致的调查和检测,并同时收集有关的研究因素,如视力情况、个体一般特征(年龄、性别、学习情况等),以期对目标人群的视力健康状况的三间分布做出适当的评估,为进一步的病因研究及制定预防保健措施奠定基础。
(2)提供疾病病因研究线索。现况研究的目的是描述目标人群的某些特征与疾病或健康状况之间的关系,寻找病因及流行因素线索。通过描述疾病在不同暴露因素状态下的分布差异、一致、趋同等现象,进行逻辑推理(求同法、求异法、类推法等),进而提出该疾病可能的病因。现况研究可以收集同一特定时点或时期内个体的暴露状况与疾病或健康状况,也可以通过回顾调查或查找历史资料来了解人体过去的暴露状况,以便获得更接近于事实的因果假设而建立病因假设。如在对冠心病的现况调查中发现冠心病患者中有高血压、高血脂、肥胖等因素的比例明显高于非冠心病患者人群,从而提出冠心病的某些病因假设。
(3)了解人群的健康水平,对医疗卫生工作的质量进行评价,为卫生保健工作的计划和决策提供科学依据。在疾病监测、预防保健过程中,通过不同阶段重复开展现况研究获得开展其他类型流行病学研究的基线资料,也可以通过对不同阶段患病率差异的比较,对防治策略、措施的效果进行评价。
(4)适用于疾病的二级预防监测高危人群。在人群中通过普查或筛检等手段,可达到“早发现、早诊断、早治疗”的目的。如宫颈刮片可以发现早期宫颈癌患者,使其得到早期治疗。
(5)评价疾病的防治效果。定期在某一人群中进行横断面研究,收集有关暴露与疾病的资料,通过这种类似前瞻性研究的动态调查,可评价某些疾病防治措施的效果。
3.现况研究的类型 根据研究对象涉及的范围将现况研究分为普查和抽样调查。
(1)普查:普查(census)即全面调查,是在特定时间对特定范围内人群中的所有成员进行的调查或检查。特定时间应该较短,甚至指某时点,一般为1~2天或1~2周,最长不宜超过2~3个月;特定范围可以指某地区或某种特征的人群,或是某社区的全部居民。如老年人(≥60岁)眼健康状况的普查。
普查目的:①了解疾病在人群中发生情况及其危险因素;②早期发现、早期诊断和早期治疗患者。如开展青少年视力状况的普查,可了解青少年中屈光不正的状况,并根据调查结果开展屈光不正的防治工作;③了解慢性疾病的患病及急性传染性疾病的疫情分布,如白内障普查和针对青少年开展的视力普查。
适用条件:①所普查的疾病病程长,发病频率、患病率较高,以便在短时间内发现足够多的病例;②调查目的明确,调查项目简单;③普查疾病的检验方法、操作技术易于操作,其灵敏度和特异度均较高;④有足够的人力、物力和设备用于发现病例和及时治疗;⑤有严密的组织和高质量的普查人员队伍;⑥适用于比较稳定的暴露因素。
普查的优点:能够发现人群中的全部病例,使其得到及时治疗;通过普查可以获得某人群中某一事件的实际情况和绝对数,能较全面的描述疾病的分布和特征,提供与疾病有关的危险因素与流行因素,为病因研究提供线索;通过普查能起到普及医学科学知识的作用;在调查中确定调查对象比较简单。
普查的缺点:普查涉及的人群范围比较大,调查时需要更多的时间、人力和费用,工作量大,调查质量不易控制,所得资料比较粗,准确性较差;易发生重复和遗漏现象,无应答率较高;不适用于患病率很低或诊断复杂的疾病,不适合目前尚无简易诊断手段的疾病;调查时耗费的人力、物力和财力往往较高;一般只能获得患病率资料,而不能获得发病率资料;组织工作难度大。
(2)抽样调查:抽样调查(sampling survey)是相对于普查的一种比较常用的现况研究方法。它是从研究对象的总体中随机抽取部分有代表性的样本进行调查,从样本获得的信息来估计和推断目标人群的总体特征。
抽样调查的优缺点:与普查相比较,抽样调查的优点是调查的人数相对较少,节省时间、人力、财力和物力资源;由于调查范围小,调查工作容易做到细致,调查的质量容易保证。但抽样调查的设计、实施及资料分析较为复杂;不适用于调查变异较大的资料;当某病的患病率很低时,小样本不能提供足够的信息,若估计的样本量达到总体的75%时,直接进行普查更有意义。
知识拓展与自学指导
抽样调查时样本量不能太小,也不能过大,为什么?
影响样本量大小的因素:①预期的患病率的大小;②研究结果精确性高低;③评价指标的资料类型,是计数资料还是计量资料;④要求的显著性水平(α)越高,样本量要求越大;⑤单位间的变异程度大,则样本量要大。
保证样本具有代表性的原则:①样本量足够大;②采用随机化原则抽取样本。
抽样调查中,样本量的估计较为重要,眼病流行病学调查中常用的计算样本量的公式如下。
式中,n为所需样本量的大小,uα为双侧正态分布界值,δ为允许误差,p为可能出现的总体率中最靠近50%的值。
常用的抽样方法有单纯随机抽样、系统抽样、分层抽样、整群抽样和多级抽样。
1)单纯随机抽样(simple random sampling):是最基本的随机抽样方法。具体方法是先将总体中每个抽样单元编号,然后用抽签法或用随机数字表、电子计算器(或计算机)产生随机数字,根据随机数字选号,直到达到预期的样本量为止。单纯随机抽样适用于总体和样本均不太大的小型调查或用于实验室研究时的抽样。此抽样方法简便、易行,但不适用于样本量很大的研究,也不适用于个体差异很大的研究。
2)系统抽样(systematic sampling):又称机械抽样,是按照一定比例或一定间隔抽取调查单位的方法。首先将每个抽样单元依次编号,并确定抽样间隔(k),随机确定以某个编号为起点,然后顺次每隔k个单元选一个单元进入样本。例如,拟选一个5%的样本(即抽样比为1/20),可先从1~20之间随机选一个数,假如为14,这就是选出的起点,再加上20,得34,34加20得54……这样,14,34,54,74,94就是前100号中入选的号码,依此类推。系统抽样的优点是简便易行,样本的观察单位在总体中分布均匀,抽样代表性较好,抽样误差与单纯随机抽样相似或略小一些。缺点是如果总体各单元的排列顺序有周期性,则抽取的样本可能有偏倚,因此必须事先对总体的结构有所了解才能恰当地应用。
3)分层抽样(stratified sampling):先将总体按照某个特征(性别、年龄、民族等)分成若干层,然后在各层内采用单纯随机抽样或系统抽样方法抽取一个随机样本,组成调查样本。抽样误差比单纯随机抽样小,精确度高,组织管理更方便,且它能保证总体中每一层都有个体被抽到。从分布不均匀的研究人群中采用分层抽样,不同层间变异越大越好,层内变异越小越好,这样可以提高抽样的精度。
4)整群抽样(cluster sampling):总体由若干相似的群体(县、乡、村、家庭、学校等)组成时,随机抽取N个群体作为样本,对群内所有观察单位进行调查的方法。适用于群内变异大而群间变异小的较大的总体。整群抽样的优点是便于组织,抽样和调查均比较方便,节约人力、物力,在实际工作中易为群众所接受,因而适用于大规模调查。缺点是抽样误差较大,资料统计分析工作量也较大。
5)多级抽样(multistage sampling):进行大规模调查时常常结合使用上面几种抽样方法,如我国进行的慢性病大规模现况调查大多采用此方法。从总体中先抽取范围较大的单元,称为一级抽样单元(省、自治区、直辖市),再从抽中的一级单元中抽取范围较小的二级单元(县、区、街道),这就是两级抽样。如果再依次抽取范围更小的单元,即为多级抽样。其优点是节省人力、物力;观察单位在总体中分布均匀,能提高统计学的精确度;多级抽样还可充分利用各种抽样方法的优势,克服各自的不足。其缺点是抽样前须了解各级调查单位的人口资料和特点,使抽样的实施和结果分析产生困难。
4.现况研究的设计与实施 现况研究一般是较大规模的调查,涉及的工作人员、调查对象较多,调查前有一个良好的研究设计方案是研究成功的前提和保证。
(1)明确研究目的与类型。开展现况研究前,必须根据研究所期望解决的问题明确本次研究所要实现的目的,再根据具体的研究目的选定调查方法,即普查还是抽样调查。而且此后的调查研究设计、实施及结果分析都要围绕研究目的进行。如了解某地40岁及以上人群中白内障的患病情况,其研究目的为白内障患病率及其分布特点和危险因素。
(2)确定研究对象。确定合适具有代表性的研究对象同样是顺利开展现况研究的关键环节,应根据研究目的选择合适的研究对象。若研究的目的是为了“三早”预防,可选择高危人群;若是为了研究某些相关因素与疾病的关联,寻找病因线索,则要选择暴露人群或职业人群;若是为了获得疾病的三间分布资料或确定某些生理、生化指标的参考值,则要选择有代表性的人群;若是为了评价疾病防制措施的效果,则要选择已实施了干预措施的人群。如了解某地40岁及以上人群中白内障的患病情况,其研究目的为白内障患病率及其分布特点和危险因素,则某地40岁及以上所有人均为研究对象。
(3)确定样本量和抽样方法。在抽样调查时,样本量过大可造成人力和物力的浪费,难以保证调查质量而使结果出现偏倚;样本量过小,则因缺乏代表性而使结果不真实。样本量的决定因素较多,如前所述,实际工作中样本量要依据上述各项指标按照相应的公式进行估计。同时,还要考虑现有的人力、物力和财力情况。如了解我国白内障患病率,以晶状体混浊度和视力<0.7为标准,白内障患病率预计为5.99%,在95%可信限时uα=1.96,允许误差不超过20%,则调查白内障所需样本量至少为1 500人,即:
抽样分为非随机抽样和随机抽样。随机抽样要求遵循随机化原则,即保证每一个研究对象都有同等的机会被抽作样本,且样本含量要足够大。常用的抽样方法略。白内障患病率调查时,可选择整群随机抽样的方法。
(4)确定研究变量和设计调查表。现况调查的研究变量分为三类。①一般项目:包括性别、年龄、种族或民族、职业、文化程度、住址、联系方法等。这些变量一般是作为备查项目,也用于比较不同人群组间是否有可比性。②疾病或健康状况:包括发病、现患疾病、死亡、伤残、生活质量、疾病负担等。疾病的分类应严格按照国际疾病分类标准或由国家权威部门颁布的诊断标准进行,以便于对不同人群的调查结果进行比较分析。如白内障患病率调查时。③暴露情况:流行病学中的暴露可以是外环境中的理化因素和生物因子,也可以是社会心理方面的因素或机体内部因素;暴露可以是有害的,也可以是有益的。如行为生活方式、饮食习惯、曾患某种疾病或父母曾患某种疾病、有某种病原体感染史、具有某种遗传特征、曾经历某种生活事件(丧偶、离异或父母离异)等。要根据研究目的确定需要调查哪些暴露因素,对所调查的暴露因素必须有明确的定义,并尽量采用客观方法对暴露程度进行测量。如白内障的调查除一般情况外还要检查视力,包括最佳矫正视力;裂隙灯检查外眼和晶状体,包括晶状体混浊度的类型、前房深度、眼压测量、眼底检查,对部分受检查者还要进行散瞳眼底检查等;还要了解受检者日照时间、接受手术的情况、术后的并发症、术后的矫正视力、家族史、用药史、全身疾病史等。
调查表又称问卷(questionnaire),是流行病学调查的主要工具。一般来说,一份问卷通常包括:封面信、指导语、问题与答案、编码和其他资料。
1)封面信:即致被调查者的短信,其作用在于向被调查者介绍和说明调查者的身份、调查目的、调查内容和范围、调查对象的选取方法和调查结果保密的措施等。在信的结尾处还要向被调查者表示感谢。封面信的文笔要简明、亲切、诚恳。
2)指导语:用来指导调查者和被调查者如何正确填答的一组陈述,一般以“填表说明”的形式出现在封面信之后。
3)问题与答案:问题和答案是问卷的主体。问卷中的问题分为开放式和封闭式两大类。①开放式问题没有具体的答案,由被调查者自由回答。优点是它能够使被调查者充分按照自己的想法回答问题,所得到的资料往往比封闭式问题更丰富;缺点是它要求被调查者要有较高的知识水平和文字表达能力,而且所获得的资料难于处理和进行定量分析。②封闭式问题就是给出若干个备选的答案,供被调查者根据自己的实际情况从中选择。优点是被调查者填写问卷十分方便,对文字表达能力也无特殊的要求;资料便于进行统计处理和定量分析。缺点是封闭式问题限制了被调查者回答的范围和回答的方式,难以发现其中的偏误,从而影响到调查结果的准确性和真实性。问题答案的设计要注意以下问题:答案的设计要符合实际情况;要保证答案的穷尽性和互斥性;注意答案要按照一定等级次序排列。
4)编码和其他资料:编码就是给每个问题的答案赋予一个数字,作为该答案的代码,便于计算机处理,常在每项数据后留出编码用方框,以便于编码输入。此外,有些问卷还需要填写调查员姓名、问卷发放及回收日期、审核员姓名等。
调查表提出问题的数量要适当,不必要的问题不要列入。问题通常按逻辑分类排列,一般先易后难、先封闭式后开放式、先一般后特殊(如敏感问题)。设置问题时要尽量避免使用模糊词语或意义不明确、容易引起歧义的提问。
(5)资料的收集。资料收集是现况研究中重要的一步,要求收集的资料完整、准确。收集的资料通常有经常性资料,如日常医疗工作记录和统计报表,病历和检查记录等;一时性资料,如专门调查的结果、实验室结果。收集过程中要注意暴露的定义和疾病的标准均要明确统一,所有调查人员和检测人员都必须进行统一的培训,避免产生测量偏倚。现况调查收集资料的常用方法如下。
1)利用现有记录资料:临床病历、检验报告单、出院证明、出生证明、死亡证明、传染病报告卡、劳动记录、环境监测记录、医疗卫生部门的各类报表等。
2)访问:对于现有记录资料不能提供的信息,可以通过询问调查对象获得,包括面访、信访、电话访问等。
3)体检、实验室检查及特殊检查:主要用于收集有关调查对象疾病和健康状况的信息,也可收集一些暴露因素(生化指标、免疫指标、营养状况等)。
4)现场观察与有关环境因素的检测:对调查现场进行周密观察常常可以提供有价值的线索,必要时可以对一些可疑环境因素进行现场测定或采集样品带回实验室检测。
(6)资料的整理及分析。
资料的整理:首先要对原始资料进行逐项仔细检查与核对,同时应填补缺漏、删去重复、纠正错误等,以提高原始资料的准确性、完整性;其次要建立相应的数据库。
资料分析:现况调查资料分析包括两个方面,一是描述分布,二是相关性分析。分布的描述包括全部调查对象的描述和分类描述,对于定量资料可以计算均数、标准差、中位数、四分位数间距等集中趋势和变异趋势指标。对于分类资料可以计算相对数指标,如患病率、感染率等。然后按照不同地区、时间和人群特征分别计算,并进行差异性比较,通过比较或相关回归分析,判断健康结局与某可疑因素之间是否有联系。但需要注意的是,现况调查是在一个时间断面上或在较短时间内收集的人群资料,通常不同变量之间的时间顺序不很清楚,因此不能仅凭现况调查的结果得出因果关系的结论,只能为进一步的流行病学研究提供线索。
(7)结果的解释与报告撰写。最后还须结合实际及统计分析结果对现况研究资料的分析结果进行解释说明疾病分布规律的正确性,某些因素与疾病或健康之间的关系有无实际意义,提供病因的线索,对防治疾病,促进健康提出建议。同时也要说明样本的代表性、应答率等情况,分析调查中有无人为因素造成的偏倚及其来源、大小、方向和调查方法。
为保证现况研究的质量,须采取质量控制措施。样本选取随机化;应答率一般应高于80%~90%,若无应答率在30%及以上,调查结果无实际意义;开展预调查;统一培训调查员;调查或检查方法标准化且保持研究过程的一致性;控制偏倚;调查后复检10%,进行多次一致性检验等。
5.常见偏倚及其控制 影响现况调查资料真实性和可靠性的有抽样误差和偏倚。现况研究中,常由于某些人为的因素造成偏倚(bias),导致研究结果的不可靠。如在研究设计或实施阶段,由于某些因素的影响,使得研究或推论的结果不符合真实情况。偏倚属于系统误差,应设法防止其产生。现况调查常见的偏倚及其控制方法有:
(1)选择偏倚(selection bias):是指研究者在选择研究对象时或调查过程中由于条件限制或设计失误,导致被调查者与总体特征不一致而引起的系统误差。
无应答偏倚:调查对象不合作或因种种原因不能或不愿意参加调查称为无应答。无应答者在身体素质、暴露状况、患病情况、嗜好等方面可能与应答者不同,由此产生的偏倚称为无应答偏倚。
选择性偏倚:在调查过程中,被抽中的调查对象没有找到,而随意找其他人代替,从而可能破坏调查对象的同质性。
幸存者偏倚:在现况调查中,调查对象均为幸存者,难以调查死亡者,故不能代表某病的实际情况,带有一定局限性和片面性。
现况调查中,应严格遵照随机化原则选择研究对象,在调查前及调查实施过程中要做好宣传和组织工作,调查方法或调查内容适当,调查对象在调查时因各种原因未能参加者应设法补救,必要时进行补查以提高应答率。
(2)信息偏倚(information bias):是指在调查过程中获取信息时导致的偏倚,如收集和整理有关暴露或疾病资料时所出现的系统误差,主要发生在观察、收集资料及测量等实施阶段。
调查对象所引起的偏倚:当询问调查对象有关个人疾病史、个人生活习惯、经济状况等,由于种种原因使回答不准确,从而引起的偏倚称为报告偏倚。当询问调查对象某种暴露史时,患者会因自己患病而对暴露史详细地回忆,而健康者对此却不太介意,这种偏倚称为回忆偏倚。
调查员偏倚:调查员有意识地详细询问某些人或具有某种特征者,而比较马虎地调查另一些人或不具备某些特征者而导致的偏倚。
测量偏倚:测量工具、检验方法不准确、试剂不符合规格、试验条件不稳定、检验技术操作不规范等都可引起测量偏倚。
防止信息偏倚的产生要在调查时做好解释工作,尽可能消除调查对象的顾虑,尽量询问近期的情况。调查员应在调查前进行系统、科学的培训,调查中尽量使用客观指标,并互相监督和复查。测量工具在使用前要进行校正,试验条件和检验方法应有详细规定并要求严格遵循。
知识拓展与自学指导
某高职院校新生近视患病率现况调查:
1.分组。5~6名学生组成一个调研小组。
2.以小组为单位自主设计现况研定方案,并开展实施。
3.撰写现况研定报告。
二、分析性研究
分析性研究是检验特定病因假设所用的研究方法。可通过观察某一危险因素的暴露和疾病发生之间的关系,来确定病因。分析性研究方法包括观察性研究和实验性研究。观察性研究包括病例对照研究和队列研究,实验性研究包括临床试验、现场试验和社区干预试验。
(一)病例对照研究
1.概念 病例对照研究(case control study)是指选择患与未患所研究疾病的两组人群,调查并比较两组人群过去是否暴露于某种或某些可疑因素及其暴露程度,从而推断该暴露因素与该病是否有关联及其关联程度大小的一种观察性研究方法。病例对照研究在时间顺序上是逆向的,是从现在是否患有某种疾病出发,追溯研究对象过去的暴露情况,即由“果”推“因”,通常又称为回顾性研究(retrospective study)。病例对照研究在临床研究中被广泛应用,尤其是慢性病和罕见病的研究,研究者不能主动控制病例组与对照组的危险因素有无暴露及暴露程度。病例对照研究的模式见图1-12。
图1-12 病例对照研究模式
暴露(exposure)是指曾经接触过某种因素或具备某种特征。如环境因素、个人行为因素、人类生物学因素等,可以是危险因素,也可以是保护因素。
2.研究步骤
(1)明确研究目的。提供病因线索,形成病因假设,研究疾病与危险因素之间的关系及关联程度;评估人群干预措施的效果。
(2)研究对象的选择。是研究过程中的一项重要内容。
病例的选择:选择病例时首先要有一个明确、统一的诊断标准,所选定的病例者均应符合疾病的定义和选择标准,并保证病例样本的代表性和暴露于危险因素的可能性,即所调查的病例能够代表总体中该病的病例;尽可能选用新发病例,以保证所提供的疾病危险因素的信息较为可靠;收集现患病例和死亡病例资料时易产生回忆偏倚。病例的来源主要有两种:一是选择某地区人群中在某时期内发生的全部病例或其随机样本,这些病例可以是普查或抽样调查中得到的,也可以是报告的病例。这种方法所选择的样本代表性较好,但实施时难度较大;二是选择某家医院或几家医院在某一时期内就诊或住院的全部病例,通常选择新发病例或初治病例,较少选择现患病例或死亡病例。虽然这种来源的病例样本代表性不如前者,但由于实施方便,可以由临床医生在医院内完成,故更为常用,但要特别注意控制选择偏倚。
对照的选择:选择对照的目的是为了正确地估计病例组人群中暴露人群分布情况。对照组的人群必须是未患该病的人,可以是正常人,也可以是患有其他疾病的人,但对照能够代表产生病例的源人群。对照组来源:一是与病例组来自同一人群,是同一人群中非病例的随机样本,或选择病例的配偶、同胞、亲戚、邻居、同学或同事等作为对照。优点是研究结论推断总体的真实性好,缺点是选择对照和调查时都比较复杂,且应答率低;二是来自医院,与病例组同属一家医院,同一时间就诊或住院的其他病例。这种对照的应答率和信息的质量均较高,但要特别注意,对照组的患者所患疾病的病因,不能与所研究疾病的病因相同或相互有影响。如肺结核与慢性支气管炎均与吸烟有关,两者不能互为对照。
(3)病例和对照的配比。配比又称匹配(matching),即使对照与病例在对结果有干扰作用的某些因素或特性上保持一致的一种限制方法。通过配比可以消除配比因素的作用,还可以增加统计检验效能,提高研究效率。匹配分为频数匹配和个体匹配。频数匹配即病例组、对照组在配比因素的比例上相同;个体匹配即病例与对照以个体为单位匹配,按照研究因素以外的外部因素进行1∶1、1∶2、1∶3……1∶M匹配选择对照,一般不超过1∶4。
(4)样本量的估计是在满足一定条件下的一个粗略估计值,只具有相对意义。病例对照研究所需样本量的决定因素:①研究因素在对照人群中的估计暴露率(p0);②预期暴露于该研究因素造成的相对危险度(RR)或比值比(OR);③假设检验的显著性水平α =0.05或0.01;④β=0.10或0.20,检验的把握度(1-β)为0.90或0.80。样本含量的估计可采用公式或查表法得到所需的病例组与对照组样本量。
(5)资料收集。
1)设计调查表:根据调查的疾病和危险因素设计调查表。收集的内容包括一般情况、疾病情况和暴露史三个方面的资料。
一般情况:主要作为备查项目,也可作为匹配的依据,或用于组间可比性分析和混杂因素分析。
疾病情况:包括发病时间、诊断依据、诊断医院等。必须有统一的、明确的诊断标准,对照也应采用相同的标准加以排除。
暴露史:包括是否暴露、暴露时间和剂量等。一项病例对照研究可以同时调查多种暴露因素,但也不宜过多。
2)收集方法:主要是查阅现有记录资料、访问调查、体检和实验室检查等,一般由经过统一培训的调查员按照专门设计的调查表进行。暴露的测量要尽量采用客观的定量或半定量方法。病例组和对照组在调查项目、调查员和调查方式等方面应相同,必要时可采用盲法。实验室检查或特殊检查项目在方法、仪器、试剂等方面要一致,最好由一个中心单位负责检查或复查核实。
(6)资料的整理与分析。根据资料类型和分析目的整理所收集的资料,以便统计分析。
数据整理:如果暴露不分级,通常将研究数据归纳成四格表;如果暴露分级,则归纳为行×列表。
统计描述:对研究对象的一般特征进行描述,如性别、年龄、职业、出生地、疾病类型等,一般情况下只能计算各种特征的构成比。此外,还须比较病例组和对照组之间除研究因素以外的各种特征是否一致,考察组间的均衡性。
显著性检验:检验判断暴露与疾病是否有统计学联系,一般采用χ2检验。整理与分析资料的模式表1-30。
表1-30 病例对照研究资料的模式
P<0.05,说明病例组和对照组暴露率差异有统计学意义,暴露与疾病有关联。
疾病与暴露关联强度大小及方向:常用的指标是比值比(odds ratio,OR)。比值是指某事物发生的概率与不发生的概率之比。比值比(odds ratio,OR)是两个概率的比值,即病例组的暴露比与对照组的暴露比之比。
OR是指暴露者的疾病危险性为非暴露者的多少倍。当OR=1时,表示暴露与疾病无关联;当OR>1时,说明暴露使疾病的危险度增加,称为“正”关联,暴露是疾病的危险因素;当OR<1时,说明暴露使疾病的危险度减少,称为“负”关联,暴露是疾病的保护因素。
(7)常见偏倚与控制。
1)选择偏倚(selection bias):在以医院为基础的病例对照研究中更易发生。常见的选择偏倚有入院率偏倚、现患病例-新发病例偏倚、检出征候偏倚、时间效应偏倚。选择偏倚的控制主要是在研究设计阶段。尽量随机选择研究对象,以人群为基础选择研究对象或从多家医疗单位选择研究对象;调查时明确规定纳入标准为新发病例;尽量选择不同病情、不同特征的患者作为病例组;调查中尽量采用敏感的疾病早期检查技术等。
2)信息偏倚(information bias):病例对照研究中常见的信息偏倚有回忆偏倚和调查偏倚。对于回忆偏倚的控制主要是选择不易被人们忘记的重要指标,并重视问卷的提问方式和调查技术;对于调查偏倚可以通过规范调查研究方法、校正仪器、严格按照规定程序收集资料或采用盲法收集资料、完善质量控制方法等措施进行控制。
3)混杂偏倚(confounding bias):是由于混杂因素的影响,掩盖或夸大了研究因素与疾病之间的联系。混杂因素是指与所研究的暴露因素和所研究的疾病均有关的因素,这些因素如果在病例组和对照组中分布不均,就可能歪曲暴露与疾病之间的真正联系。要控制混杂偏倚,首先必须认识混杂现象及其影响,并对混杂因素采取相应的控制措施。在研究设计阶段,可通过限制研究对象的入选条件、匹配等方法对一些主要混杂因素(年龄、性别、职业等)进行控制,其他混杂因素则可以在结果分析阶段采用分层分析、多元回归分析等方法解决。
(8)优点与局限性。
优点:①特别适用于罕见病的病因研究;②节省人力、物力和经费,容易组织,所需样本较少;③研究周期短,可以较快获得结果;④可以同时探讨多种因素与一种疾病的关系;⑤既可以检验有明确危险因素的假设,又可以广泛探索尚不够明确的多种因素。
局限性:①不能测定暴露组和非暴露组疾病的率,只能计算比值比估计相对危险度,虽然可以检验或探讨病因,但是不能得出因果关系结论;②容易发生的偏倚较多,如选择偏倚、信息偏倚和混杂偏倚;③不适用于研究人群中暴露比例很低的因素。
(二)队列研究
1.概念 队列研究(cohort study)又称定群研究、群组研究。队列研究根据是否暴露于所研究的可疑因素或暴露程度将研究对象分组,然后随访观察一定时间,比较暴露组和非暴露组某种或多种疾病的发病率或死亡率,以说明暴露因素与疾病之间的关系及关联程度。如果暴露组与非暴露组之间或不同暴露剂量组之间的发病率或死亡率有显著差异,则可认为暴露因素与疾病存在因果关联。所谓队列也称群组,是指具有某种共同特征的一群研究对象,如同时出生的一代人或暴露于同一可疑因素的一群人。队列研究是从“因”推“果”的一种观察性研究方法。队列研究的模式见图1-13。
队列研究的目的是:检验病因假设,其效能优于病例对照研究,因此深入检验病因假设是队列研究的主要用途和目的。一次可检验一种暴露与一种疾病之间的因果关系,也可同时检验一种暴露与多种结局之间的关联;评价预防效果;研究疾病的自然史。
图1-13 队列研究模式
队列研究的特点:是一种观察性研究;设立对照组;是由“因”到“果”的研究;能进一步证实暴露的关联,可计算疾病的发病率;队列研究根据研究对象进入队列的时间及终止观察时间的不同,分为3种。①前瞻性队列研究。是队列研究的基本形式,研究对象的确定和分组是根据研究开始时所获得的现实暴露状况而定的,观察开始时研究的结局还没有出现,需要前瞻观察一段时期,才能得到发病或死亡的结果。②历史性队列研究。其研究对象的确定和分组是根据研究开始时已获得的历史资料中的暴露情况而决定的,疾病的结局在研究开始时已经从历史资料中获得。③双向性队列研究。也称为混合型队列研究,在历史性队列研究的基础上,继续进行前瞻性队列研究。
2.研究步骤
(1)明确研究目的。某暴露因素与某疾病之间的因果关系。
(2)研究对象的选择。由于前瞻性队列研究须对研究对象随访观察,研究周期较长,故在选择研究对象时首先要考虑是否便于随访,而且暴露容易测量,有必要的医疗条件,居住比较集中,人口流动性小,不会在随访过程中出现大量失访。
暴露人群的选择:①特殊暴露或职业人群,是对研究因素有较高暴露水平或从事暴露于研究因素的职业人群。这部分人群暴露明确,发病率高,有利于探索暴露与疾病之间的关系。如选择高原作业与白内障的关系,选择原子弹爆炸的受害者、接受过放射线治疗的人,研究电离辐射与白血病的关系;从事油漆、皮革制作等苯作业工人苯暴露与血液病之间的关系等。②一般人群,选择一个地区的全部人口或其无偏样本中的暴露者作为暴露人群。若研究目的是对一般人群进行防治,且某个可疑病因有较高的人群暴露率,所研究的疾病又有较高的发病率或死亡率,就适合在一般居民中进行队列研究。如美国Framingham地区的心脏病研究。③有组织的人群团体,选择有组织的人群作为一般人群的特殊形式,如以学生、部队官兵等较易合作的群体中的暴露者作为暴露人群,优点是便于有效地收集随访资料。如Doll和Hill选择英国医生协会的会员研究吸烟与肺癌的关系。
对照人群的选择:选择对照组的基本要求是尽可能保证其与暴露组的可比性,即对照人群除未暴露于所研究的因素外,其他各种影响因素或人群特征(年龄、性别、民族、职业、文化程度等)都应尽可能地与暴露组相同。①内对照:选择一组研究人群,按照人群内部的暴露情况分为暴露组和非暴露组,该非暴露组称为内对照组。内对照的好处是选择对照比较方便,并可以从总体上了解研究对象的发病情况。②外对照:当选择职业人群或特殊暴露人群作为暴露人群时,常需在该人群之外寻找对照组,故称外对照。选用外对照的优点是随访观察时可免受暴露组的影响。③总人口对照:当选择某职业人群为暴露组时,可以用总人口作为对照,即与该地区全人群的发病(或死亡)率进行比较分析。其优点是资料容易得到,缺点是全人群的资料常不能满足研究需要,非暴露组与暴露组人群在地理和时间上不容易保证一致性。
(3)样本量的估计。队列研究样本量较病例对照研究的样本量大,其大小取决于下列4个因素:①一般人群(对照人群)中所研究疾病的发病率(p0),越接近0.5所需样本量越少;②暴露组与对照组人群的发病率之差(d=p1-p0),差值越大,所需样本量越少;③第一类错误的概率(α),水平要求越高,需要观察的人数越多,通常取0.05;④把握度(1-β)越大所需观察人数越多,通常取0.10。
(4)资料收集。①基线资料收集:包括基本人口学特征、研究对象的暴露及健康情况。资料可以来源于医疗记录、人口普查和户籍管理资料、劳动记录、环境监测、疾病监测等常规资料,必要时也可通过访问、医学检查及环境检测来获得所需的资料。②随访:随访(follow-up)即对所确定的研究对象进行追踪观察,目的是确定终点事件的发生情况。所有被选定的研究对象(不论是暴露组还是非暴露组),都应采用相同的方法进行随访,并坚持追踪到观察终止期。随访的方法包括对研究对象的直接面对面访问、电话访问、自填问卷、定期体检、环境与疾病监测,医院医疗与工作单位出勤记录的收集等。随访内容一般与基线资料内容一致。③结局资料收集:首先要明确观察终点,即研究对象出现预期的结局,至此将不再对其进行随访。观察终点是指出现了所研究的疾病、因研究疾病而死亡或检验指标达到某水平。研究对象患其他疾病或死于其他疾病不应视为观察终点。观察终止时间是指全部观察工作的截止时间。终止时间应该以暴露因素作用于人体直至产生结局的一般潜伏期为依据,在此原则上尽量缩短观察期,以节约人力和物力,并减少失访。
(5)资料整理与分析。资料分析前,首先要对资料进行审查、修正或剔除,对不完整的资料要设法补齐。在此基础上,一是对资料进行描述性统计,即描述研究对象的组成、人口学特征、随访时间及失访情况等,分析两组的可比性及资料的可靠性。二是对资料进行推断性分析,通过比较暴露组与非暴露组的率或不同暴露剂量组的发病率(或死亡率),来判断可疑暴露因素与疾病(或死亡)是否存在关联,以及关联的强度与方向。若有联系,则进一步计算有关指标以分析联系强度。队列研究的基本数据整理与分析表。见表1-31。
表1-31 队列研究资料整理与分析表
描述分析:累积发病率(cumulative incidence,CI):当观察期间人群比较稳定,且人数较多时,以开始观察时的人数为分母,整个观察期内患者数为分子,计算该观察期的累积发病率。
发病密度(incidence density,ID):若在随访期间内因失访、迁移、死于其他疾病、中途加入或退出等原因使观察人数有较大变动时,宜用发病密度来测量发病情况。
人时=观察人数×随访时间,时间单位常用年,故又称人年(person-years)。
显著性检验:一般常用χ2检验,如果暴露组与非暴露组的发病率(或死亡率)差异有统计学意义,可认为暴露与疾病之间有关联。
联系强度的测量:主要用相对危险度(relative risk,RR),又称率比(rate ratio),是暴露组发病率(Ie)或死亡率与非暴露组发病率(I0)或死亡率的比值。说明暴露组发病或死亡是非暴露组的倍数,其数值的意义为:RR=1,说明暴露因素与疾病无关联;RR>1,说明暴露因素与疾病有“正”的关联,暴露是疾病的危险因素,暴露的效应越大,暴露与结局的关联强度越大;RR<1,说明暴露因素与疾病有“负”的关联,暴露具有保护意义。无论RR大于或小于1,都应进行显著性检验。
从表1-31的资料得到:暴露组的发病率Ie=a/n1,非暴露组的发病率I0=c/n0。
归因危险度(attributable risk,AR):又称特异危险度或率差,即暴露组的发病率(Ie)与非暴露组的发病率(I0)之差。
归因危险度表示因暴露所致的发病率(或死亡率)的增加量,表示疾病危险特异地归因于暴露因素的程度。
相对危险度与特异危险度的意义:RR和AR同为估计暴露与疾病关联强度的指标,彼此关系密切,但其意义不同。RR说明个体在暴露情况下比非暴露情况下发生疾病或死亡风险的倍数,具有病因学意义。而AR则是对于人群来说,暴露情况下比非暴露情况下增加疾病的超额数量,消除暴露因素,就可以减少这一数量的疾病,具有疾病预防和公共卫生学意义。
知识拓展与自学指导
人群归因危险度与人群归因危险度百分比
人群归因危险度(population attributable risk,PAR)与人群归因危险度百分比(population attributable risk proportion,PAR%):PAR是指总人群发病率(It)中归因于暴露的部分,而PAR%是指PAR占总人群全部发病的百分比。
PAR和PAR%通过暴露组与全人群的比较,说明暴露对于一个人群的危害程度,以及消除这个暴露因素后该人群中的发病率(或死亡率)可能降低的程度,即暴露的社会效应。
3.常见偏倚与控制
(1)选择偏倚。如果研究人群在一些重要方面与总体存在差异,就会产生选择偏倚。避免和减少这类偏倚应采用随机化原则选择研究对象,明确规定研究对象的入组标准和排除标准,尽量提高研究对象的应答率和依从性。
(2)失访偏倚。队列研究由于随访时间较长,研究对象中有人不能坚持到底而退出队列、有人迁居、有人死亡,到最后观察终止时,能够用于分析结果的人数远少于进入观察时的人数,从而破坏了原有样本的代表性,而导致偏倚。控制的方法是在研究中采取各种措施尽量减少失访率。
(3)信息偏倚。队列研究随访时,对疾病的诊断缺乏客观的标准、缺乏特异性诊断指标、测量仪器精确性差或人为的测量误差等均可造成漏诊或误诊,而导致偏倚。控制这类偏倚的办法有培训调查员,改进测量手段,选用精确性高的仪器,加强特异性诊断和采用客观的标准,同等地对待每个研究对象,严格按照规定的标准进行测量。
(4)混杂偏倚。控制方法是在设计阶段采用限制和配比的方法,在分析阶段采用标准化方法计算发病率或死亡率,按混杂因素进行分层分析及多因素分析等。
4.优点与局限性
(1)优点:①研究对象的暴露资料是在结局发生之前研究者亲自收集的,资料可靠,一般不存在回忆偏倚;②可以得到暴露组和非暴露组的发病率或死亡率,计算相对危险度和特异危险度,估计暴露因素与疾病的关联强度;③病因发生在前,疾病发生在后,因果关系的时间顺序合理,一般可以验证病因假设;④可以同时研究一种暴露因素与多种疾病的关系,并能了解人群疾病的自然史。
(2)局限性:①不适用于发病率很低的疾病研究;②随访时间长,失访难以避免,需要预先大概估计失访率,适当扩大样本量。若失访率为10%时,需要将估算的样本量再增加10%作为实际样本量;③研究耗费较大的人力、物力、财力和时间,实施难度较大;④在随访过程中由于未知变量的引入或已知变量的变化,都可使结局受到影响,使分析复杂化。
知识拓展与自学指导
实验性研究
遵循分析性研究的思路及内容自学实验性研究的下列内容:①概念;②实验性研究的分类;③临床实验设计内容;④临床试验的基本原则;⑤临床试验的样本量估计;⑥常用临床试验;⑦常用的临床试验研究方案。
(邢华燕 段丽菊)
任务四 疾病的筛检
问题引导
一些眼病具有潜伏期,一旦发现往往比较严重,为患者及家庭带来较大的痛苦。如何才能早发现、早诊断?以便采取积极的治疗措施,减轻患者的痛苦,阻止病情的进一步发展?
疾病的筛检与现况调查的意义、工作内容及步骤有何异同?
医学的目的或生物-心理-社会医学模式的医学优先战略是,确立预防疾病和促进健康;解除疼痛和疾苦;治疗疾病和对不治之症的照料;预防早死和提倡安详地死亡。这一战略要求我们,若一种眼病或视功能异常可以预防时,我们应当采取有效的方法进行预防;若一种眼病或视功能异常尚无有效的方法进行预防时,应积极做到早发现、早诊断、早治疗。做到早期发现、早期诊断的方法:一是,尽快注意到疾病的最早期的症状和体征;二是,在无症状的人群中发现患有某种眼病的患者或视功能异常者。无症状的人可能是正常人,也可能是已患有某种眼病或视功能异常但未出现任何症状和体征的人。疾病的筛检可在无症状的人群中检测出患有眼病或视功能异常者。而且疾病的筛检已在眼视光学领域开展了许多眼病的筛检,如某些学校对学生定期进行视力检查,可发现视力低下者;某些学校对学生进行视力和屈光检查,可发现屈光不正者。通过进一步检查,使他们得以确诊,及时做到早期干预、早期治疗。
一、疾病筛检的概述
(一)筛检的概念
筛检(screening)是运用快速、简便的试验、检查或其他方法,从表面健康的人群中发现哪些可能有病或缺陷、可疑者或具有发生这种疾病的高危者(个体)。筛检是描述性研究的一个组成部分,疾病预防的重要手段之一,也是发现眼病或视功能异常的重要方法。其目的是,通过筛检所获得的信息,有助于了解眼病或视功能异常的分布特点;早期发现某些可疑病例或有缺陷者,达到早诊断、早治疗的目的。早治疗使其康复或延缓其发展,以实现二级预防的目的,提高眼病的治愈率;确定一些眼病或视功能异常发生、发展情况或自然病程或开展流行病学监测;确定高危险人群,可以发现一些患有某种眼病的高危人员,尽早地从病因学的角度采取措施,达到预防疾病发生的目的。如一些眼病在出现临床症状和体征之前,眼组织已发生了病理改变,在临床症状和体征出现时,眼组织的病理改变以及对视功能的损害已很明显。若能在眼病的早期及时发现并给予及时治疗,可避免视功能的严重损害,提高治愈率,达到疾病的一级预防和二级预防。但筛检不能对疾病做出诊断。
筛检试验的对象:无该病的健康人;可疑有该病但实际无该病的人;的确有该病的人。
(二)筛检试验和诊断试验
诊断试验(diagnostic test)是主要应用于疾病诊断、疾病随访、疗效考核以及药物不良反应的监测。临床医生单凭经验难免不够稳妥诊断,如未能给患者及时有效的治疗,甚至造成不可弥补的损失。掌握科学的研究和评价诊断试验的方法可为其选择合理的诊断方法奠定基础,同时可避免单凭经验造成的错误。
筛检试验(screening test)用于识别表面健康的人群中可能患有某种疾病的个体或未来发病危险性高的个体的方法。其目的和意义在于早期发现、早期诊断和早期治疗患者。筛检试验是眼病筛检的基本工具,是一项粗略检查,对筛检识别出的患者或有缺陷的人,还必须进一步进行检查才能确诊,并对确诊患者采取必要的治疗措施。具体鉴别如下。
1.目标对象 筛检试验针对的是一组人群,是要从其中筛检出有病或可能有病的人;而诊断试验针对的是个别患者,是了解受检者是否确定患有某种疾病。前者的对象是健康人或无症状的患者。对已确诊为某种眼病的患者,不必再进行筛检试验。诊断试验受检者应当是患者或筛检阳性者。
2.试验目的 筛检试验的目的是在人群中识别可能患有某种疾病的人,即把可能患有某病的个体与可能无病者区分开;而诊断试验的目的是证实临床上提出的可能诊断,即进一步把患者与可疑有病但实际无病的人区分开。
3.治疗时间 对筛检试验阳性者不能立即给予治疗措施,而是应当进一步实施诊断试验,以便明确诊断;对于诊断试验阳性者,已经明确了所患的疾病,应当及早施予治疗措施。
4.试验的费用 对于筛检试验,应当是对检查者无伤害,价格便宜,使用方便,能被大范围人群所接受;对诊断试验,多运用实验室、医疗器械等手段,费用较高些。
5.试验方法的灵敏度与特异度 筛检试验应当具有较高的灵敏度,尽可能地发现所有的患者或可疑者;诊断试验应当有较高的特异性,尽量排除所有的非患者。
6.检查结果的可靠性 一般来讲,筛检试验的结果准确性较差,权威性较低;而诊断试验具有较高的准确性和权威性。
(三)筛检的分类及方法选择
1.根据筛检对象的范围分类
(1)整群筛检(mass screening),指用一定的筛检方法对整个目标人群进行筛检,找出其中可疑患某病的人,然后对其进一步诊断及治疗。主要用于疾病患(发)病率很高的情况下,对一定范围内人群的全体对象进行普查筛检,也称普查。如中学生通过视力检查与屈光不正检查,而进行近视或屈光不正的筛查。
(2)目标筛检(targeted screening),对有某种暴露的人群、高危人群或某一特殊单位人群进行定期健康检查(periodical health examination),以早期发现患者,及时给予治疗。如高原作业人员白内障的筛检。
2.根据所用的筛检方法的数量多少分类
(1)单项筛检(single screening),指用一种筛检方法检查一种疾病。
(2)多项筛选(multiple screening),筛检中同时应用多种方法进行筛检,可以同时筛检多种疾病。
用于筛检的方法较多,如问卷询问、体格检查等物理学检查;血清学、生物化学等实验室检查等。在筛检项目的实施中应综合各方面因素选择恰当的方法进行疾病筛检。
(四)实施原则
筛检能实现早期发现疾病的目标,但也有可能发生过度或错误的诊断,如有病而未被识别,无病而诊断为患病者都会对受检者产生不良的影响。因此,筛检计划实施前,要认真考虑筛检实施的有关原则。
(1)所筛检的疾病或状态是该地区现阶段重大公共卫生问题,在人群患病率比较高。所用筛检方法技术易于被筛检者接受且费用低廉,成本-效益比较高;对筛检阳性者能实施有效的追踪和干预治疗。
(2)筛检的疾病应无明显症状或有明显症状患者却不能体验到或不能认识到。如轻度近视眼患者,特别是在其发病的早期常常无明显症状;儿童对正常近视无明确的概念,而难以体会到或认识到近视发生的症状。因此,应关注儿童近视的筛检。
(3)对所筛检疾病或状态的自然史有比较清楚的了解,有可识别的早期临床症状或体征;对所筛检的疾病的预防效果及副作用有清楚的认识。
(4)从伦理方面来讲,筛检开始前已确认筛检可以改变疾病的自然史,对筛检阳性者,有相应的诊断和治疗方法,或者有可行的预防措施。对于目前无有效的治疗方法的疾病,则不宜进行筛检。
实施过程中,必须遵守尊重个人意愿、有益无害、公正等一般伦理学原则。
对某疾病的筛检最理想的情况是以上原则均能满足,满足的条件赿多,筛检的实施愈成熟。但某些疾病虽不能满足多项条件,但仍值得实施。因此,筛检最基本的条件是:适当、可行的筛检方法、确诊方法和有效的治疗手段。三者缺一不可。
知识拓展与自学指导
筛检的条件
Wilset和Junger,在1968年提出了实施筛检计划的10条标准。在此基础上世界卫生组织提出了筛检计划及成功与否的7条标准。1999年Crossroads提出了评价筛检计划更加全面的13条原则。其主要内容如下。
(1)所筛检的疾病或状态应当是当时当地的重大卫生问题。
(2)被筛检的疾病应当在确诊后具有可以接受的治疗方法。
(3)被筛检的疾病或状态应具有诊断和治疗的设施。
(4)疾病应当具有潜伏期,有足够的时间实施筛检。
(5)被筛检的疾病或状态具备适当的检验和检查方法。
(6)所采用的试验能被人群所接受,实施较方便。
(7)对疾病的自然史,包括从潜伏期到晚期的全过程有恰当的了解。
(8)对于接受治疗的人应当有患者同意接受治疗的规定。
(9)要考虑疾病诊断与治疗的费用。
(10)筛检是一个完整连续的过程。即发现病例到进一步诊断治疗。
二、疾病筛检的实施
筛检试验的目的是将某一表面健康的人群中将所有患者与真正健康的人识别开,但任何一种筛检试验都难以避免其假阳性和假阴性的结果。为提高确定患者的准确性,筛检实施前需对筛检的项目进行精心的设计,以保证项目的顺利实施和质量。
(一)选择筛检试验
疾病筛检项目中,选择恰当的筛检试验非常重要。好的筛检方法易于实现、廉价、快速便捷、安全性好、能被目标人群接受,如采用视力表进行视力检查。效率高是指筛检的方法灵敏度、特异度、预测值高。在制订筛检方案时要根据实际情况,一般选用简便易行的方法,如眼底检查、视力表检查等进行初筛,然后再采用准确性高但较为复杂的方法,如眼底照相、综合验光仪进行复筛。要保证筛检的可疑患者准确无误不被误诊或漏诊。同时筛检方法应在保证可行性的前提下,提高其科学性、可靠性。
疾病筛检中,可采用一个灵敏度与特异度均较高的试验作为筛检试验,否则,可选择多个筛检试验联合应用来提高筛检试验的灵敏度与特异度。这种同时应用两种或两种以上的试验方法来筛检或诊断疾病称为联合试验。通过联合试验,可依据试验者的意图,有效地、选择性地提高试验的真实性。根据判断试验结果方法的不同,联合试验又可分为并联试验和串联试验两种。
(1)并联试验(parallel test)又称平行试验,是指同时应用多个试验,其中任何一项的结果为阳性,即判为阳性的试验方法。并联试验可提高试验的灵敏度,减少漏诊率。但会降低特异度,提高误诊率。如可将视力检查、遮盖试验、色觉检查和检眼镜检查以并联方式排列来筛查儿童的眼病,其中任何一项检查为阳性时都要筛检试验为阳性,再进一步检查,以便确诊有无眼病。这样可以更多地发现眼病儿童,降低漏诊率。据资料报道,单用视力检查来筛查眼病,则可能会有50%的眼病患者被漏掉。因此,当临床医生希望尽可能全面地发现患者,而可获得的各项试验方法均不够敏感时,则可采用并联试验的办法。
(2)串联试验(serial test)又称系列试验,是指依次顺序应用多项筛查试验,只有全部试验均呈阳性时才能判为阳性。该方法可提高试验的特异度,但却降低了试验的灵敏度,增加了漏诊率。当疾病筛检时所用试验的特异度均不能达到要求时,则可采用串联的办法。如采用视力和视网膜检影来筛查屈光不正,则可明显提高特异度。
(3)并串混合式,即并联式和串联式并用。根据疾病筛检项目的特点,可将多个筛检试验以既有串联,又有并联的方式联合应用,同时兼顾筛检试验的灵敏度与特异度两个方面,以取得较好的筛检效果。
(二)确定疾病筛检的标准
1.“金标准” 是指目前临床医学界公认的诊断疾病最可靠的方法,是指可靠的、公认的、能正确地将有病和无病区分开的诊断方法。常用的金标准有活检、手术发现、微生物培养、特殊检查、影像诊断、临床综合判断和长期随访的结果等。这些金标准的使用可准确区分受试对象是否患有某种疾病。
2.阳性标准 筛检试验的阳性标准是指筛检过程中诊断,初步诊断受试者是否患有某种疾病的方法。它的改变可影响筛检试验的灵敏度与特异度。因此,疾病筛检时应根据筛检目的,疾病后果严重程度等多方面因素选择恰当的阳性标准。如病死率高、预后差、后果严重的疾病应降低阳性率判断标准,以提高试验的灵敏度,发现更多的可疑患病者,但这样会出现较多的假阳性,增加确诊患者的工作量,也会增加假阳性者的心理负担;而对于并不十分严重的疾病,则应提高阳性判断标准,降低试验的假阳性率,提高试验的特异度,以减少试验假阳性人数。因同样会增加假阳性者的心理负担。
知识拓展与自学指导
阳性标准与筛检试验灵敏度和特异度的关系(实例)
眼压作为筛检原发性青光眼的筛检试验的阳性标准,如果将原设定的≥27 mmHg调整为≥21mmHg时,试验的灵敏度将会增加,即将发现更多的原发性开角型青光眼的可疑患者,这使得假阳性率增加,同时降低了试验的特异度。为什么?
(三)确定受试对象
根据筛检的目的,筛检试验的原则、疾病的分布特点等选择恰当的受试对象,且受试对象具有代表性,能代表筛检试验可能应用的目标人群。选择的原则是选择筛检疾病患病率高的人群和地区,选择当地政府部门和医疗卫生机构合作和支持的地区。目的是发现更多的可疑者或早期患者,提高疾病筛检项目的效率。若疾病的人群分布特点显著,选择受试对象时就应当考虑此特点。如盲和中、重度视力损伤主要发生于老年人群,在筛检盲和中、重度视力损伤时,选择年龄大于或等于40岁的人群作为筛检对象则比较恰当;青少年是近视眼好发人群,也是防治的关键时期,筛检近视眼时选择青少年作为筛检的重点人群比较恰当。
(四)确定样本量
影响样本量大小的因素有:①待评价筛检试验的预测灵敏度和特异度;②显著性检验水平α;③容许误差δ。当灵敏度和特异度均接近50%时,可用下列近似公式。
式中,n为所需样本量,uα为样本率呈正态分布时累积概率等于α/2时的u值,如u0.05=1.96或u0.01=2.58。δ为容许误差,一般在0.05~0.10范围内。Р为预评价的筛检方法的灵敏度和特异度,通常用灵敏度估计病例组所需要的样本量,特异度用来估计对照组所需样本量。
待评价的筛检试验的灵敏度或特异度小于20%或大于80%时,样本率的分布呈偏态分布,所需样本量的估计略。
例如,待评价筛检试验的预测灵敏度或特异度分别为70%和60%,试估计病例组和对照组所需样本量。
设α=0.05,δ=0.08,得:
n1=(1.96/0.08)2×0.70×(1-0.70)=126.05≈126
n2=(1.96/0.08)2×0.60×(1-0.60)=114.06≈114
所评价筛检试验,病例组样本量为126例,对照组为114例。
(五)整理评价结果
疾病筛检收集到资料要及时检查核对、整理、录入计算机及分析。经“金标准”将研究目标人群分成有病和无病两组,然后用待研究的筛检试验,对该人群进行同步盲法重复检查,将两组检查结果进行分析比较后,就能对筛检试验进行评价。确诊的受试疾病患者和非患者,接受待评价的筛检试验检测后,可出现4种结果,见表1-32。
表1-32 筛检试验结果评价
表中A代表真阳性,即金标准确诊为患者,而被筛检试验判断为有病;B代表假阳性,即金标准确定为非患者,而被筛检试验判断为有病者;C代表假阴性,即金标准确诊为患者,而被筛检试验判断为无病者;D代表真阴性,即金标准确诊为非患者,而被筛检试验判断为无病者。
对整理的资料,应计算出筛检的阳性率和早期患者检出率、受治率。对于受治的患者要进行随访,以便进行生存率的分析,并提出进一步工作的建议和设想。
(六)疾病筛检试验的质量控制
为保证筛检试验的灵敏度与特异度,筛检试验实施过程中应严格控制试验质量,其措施如下。
(1)筛检者的选择与培训。除进行精心设计之外,在实施筛检试验之前,应选择筛检者,同时加强筛检人员的培训。筛检者是否为专业人员应由筛检试验的复杂程度来确定试验者。但一般还是由卫生专业人员实施以能保证筛检试验的准确性,若筛检试验非卫生专业人员也能完成,且需要降低筛检试验的成本时,也可选用非卫生专业人员来完成筛检试验。这时,一定要对他们进行足够的培训,使他们能很好地胜任这项工作。
(2)争取当地政府部门和医疗卫生机构的大力支持与合作,以保证筛检项目的实施。
(3)仪器设备校正。在筛检试验之前,需要对所用仪器进行校正,以保证仪器的正常使用及准确性。
(4)筛检试验过程中,注意受检对象无漏检,非筛检对象的混入及所收集到的资料完整性、准确性。
(5)认真填写筛检记录,对关键环节进行核对。如每天工作结束前,要有专人仔细核查,发现问题要及时解决。
三、疾病筛检试验的评价
疾病筛检试验需要进行精心的设计和实施,也需要对疾病筛检试验进行评价,以便可能保持筛检项目的最高准确性、有效性和尽可能高的效益。疾病筛检试验的评价,除考虑安全可靠、简单快速及方便价廉外,还主要从真实性、可靠性和效益性三个方面来评价。
(一)真实性
真实性(validity)又称准确性(accuracy),是指测量值与实际值的相符合的程度,是正确地判定受试者有病与无病的能力。评价筛检试验真实性的指标有:灵敏度与假阴性率、特异度与假阳性率、正确指数。
1.灵敏度(sensitivity) 又称真阳性率,是指金标准诊断患病而被筛检试验正确地判断为有病的百分比。它反映了筛检试验将实际有病的人正确地判断为患者的能力。
假阴性率,又称漏诊率,是指实际有病者而被筛检试验判断定为无病的百分比。它反映了筛检试验漏诊患者的能力。
灵敏度与假阴性率之间为互补关系,灵敏度=1-假阴性率。
2.特异度(specificity) 又称真阴性率,是指将实际无病而被筛检试验正确地判断为无病的百分比。
假阳性率,又称误诊率,是指实际无病者而被筛检试验判断为有病的百分比。
特异度与假阳性率之间为互补关系,特异度=1-假阳性率。
一个理想的筛检试验的灵敏度与特异度最好均为100%,假阴性率和假阳性率均为0。实际上这是一种理想的情况。一般地讲,提高灵敏度就会降低特异度,反之亦然。
灵敏度和特异度是评价试验真实性的两个基本指标,我们理想的筛检试验的灵敏度和特异度均能令人满意,即尽量没有漏诊和误诊,但多数情况下难以达到。灵敏度较高的试验,其特异度往往较低;而特异度较高的试验,灵敏度又随之下降。如果要用一个指标对试验识别患者和非患者的能力做综合评价,可采用正确指数。
3.正确指数 又称约登指数(Youden′s index),是灵敏度与特异度之和减去1,表示筛检方法发现真正患者与非患者的总能力。正确指数=(灵敏度+特异度)-1=1-(假阴性率+假阳性率)(公式1-69)
正确指数的范围为0~1。指数越大,其真实性越高。
知识拓展与自学指导
原发性开角型青光眼的诊断指征
原发性开角型青光眼是一种因眼压升高而导致视神经损伤和视野缺损的眼病。如果一个患者同时具有眼压升高、视盘改变、视野缺损和前房角是宽角等特征时,我们就可以确诊。而只有眼压升高就不能绝对确诊原发性开角型青光眼的指征,原因:一是每个人的眼压昼夜有相当大的波动范围(青光眼患者波动范围相对较大);二是眼压相同的患者,有的人会发生病理性改变,有的人则不会发生改变。因此,高眼压不能作为确诊原发性开角型青光眼的指征,仍需要做其他检查。
(二)可靠性
可靠性又称重复性或精确性,是指在完全相同的条件下重复试验获得相同结果的稳定程度。一个好的筛检试验应当具作相当高的可靠性,其评价指标有:
1.标准差和变异系数 当某试验是作定量测定时,可用标准差和变异系数来表示可靠性。标准差和变异系数的值越小,可靠性越好,精确度越高。反之,可重复性就越差,精密度越低。
2.符合率与Kappa值 符合率是指筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比例。当某筛检试验是作定性测定时,可用符合率来表示可靠性,它是指两次检测结果相同的人数占受试者总数的百分比,又称观察一致率。符合率越高,可靠性越好。用于比较两个医生筛检诊断同一组患者,或同一医生两次筛检诊断同一组患者的结果。
近年来,人们常用Kappa值分析评价两种检验方法和同一种方法两次检测结果的一致性。它表示不同观察者对某一结果判定或同一观察者在不同时间对某一结果判定的一致性强度。考虑了机遇因素对一致性的影响。
Kappa值在0~1之间。一般来讲,Kappa值为0,表明两次判断结果完全是由机遇造成的,0~0.4为一致性差,0.4~0.6为中度,0.6~0.75为高度一致,大于或等于0.75为一致性极好,Kappa值为1,表明两次判断结果完全一致。
知识拓展与自学指导
Kappa值的计算公式
Kappa值=(PA-PC)/(1-PC)
式中,PA为观察的实际一致率PA=∑A/N,∑A为两次观察结果一致的观察数,Ν为总检查人数;PC为期望一致率,也称期望值,即两次检查结果由偶然机会所造成的一致率,PC=∑E/Ν,式中∑E期望两次检查结果一致的观察数,Ν为总检查人数。
3.影响试验可靠性的因素
(1)试验对象的生物学变异:它使同一受试对象在不同时间获得的临床测量值有所波动。如眼压在不同时间内的测量值存在差异。
(2)观察者:由不同测量者之间或同一测量者在不同时间的测量结果的不一致,如受检者的情绪、技术水平、认真程度。
(3)实验室条件:重复测量时,测量仪器不稳定,试验方法本身不稳定、试剂的稳定性等引起的测量误差。如视力表上视标与背景的不合要求的对比度,周围环境控制不好,以及检查距离改变。
(三)效益性
对筛检试验效益的评价可从个体效益和社会效益的生物学、社会经济学效益等方面进行评价。在此仅介绍一个间接反映试验收益的指标,即预测值。
预测值(predictive value)又称诊断价值,是反映应用筛检结果来估计受检者患病和不患病可能性的大小的指标。预测值包括阳性预测值和阴性预测值。
1.阳性预测值(positive predictive value,PPV) 真阳性人数占筛检试验阳性者总数的百分比,反映了筛检试验结果为阳性时受试者患有该病的可能性。
2.阴性预测值(negative predictive value,NPV) 真阴性人数占筛检试验阴性者总数的百分比,反映了筛检试验结果为阴性时受试者没有患该病的可能性。
总体来讲,筛检试验的灵敏度愈高,阴性预测值愈高;筛检试验的特异度愈高,阳性预测值就愈高。筛检试验的阳性预测值并不完全取决于灵敏度和特异度,而是在很大程度上与人群某病的患病率有关。当灵敏度与特异度一定,疾病患病率越高,阳性预测值越大。
因此,临床医护人员在判断一份检验报告阳性结果的临床价值时,需要考虑被检人群的患病率高低,才能做出正确评价。同一筛检试验在不同的医疗部门(如基层门诊部与在专科医院)应用时,其阳性预测值也有很大差别。
四、疾病筛检试验的常见偏倚
1.领先时间偏倚(lead time bias) 领先时间是指从筛检发现到临床诊断发现所能赢得的时间。即通过筛检发现某人患病的时间与到临床确诊的时间之差。筛检试验发现的病例均处于临床前期,其价值和意义就在于在领先时间内对患者做出有效的处理。这段时间越长越好,也就是疾病发现得越早越好。领先时间可改变疾病发展自然史,其结果受病种和病例个体差异影响。而疾病的病程长短和筛检试验发现疾病的能力影响领先时间。领先时间偏倚是指筛检诊断时间和临床诊断时间之差被解释为因筛检而延长的生存时间。也就是说,从表面上延长的生存时间,实际上是筛检导致诊断时间提前所致的偏倚。其关系见图1-14。
2.参与者偏倚 并非所有的人都参加疾病筛检。参与者偏倚是由于参与与不参与筛检试验者某些特征可能存在不同而引起的,使得通过筛检试验发现的病例的预后较临床期确诊的病例的预后好。如文化程度高、卫生保健知识多的人更注意日常保健,生活习惯相对较好,对身体的异常表现警觉性高,医疗依从性较好。这些都会使其筛检到的机会增加,而影响其存活率,产生筛检者要比未筛检者存活的时间长的假象,造成参与者偏倚。
图1-14 领先时间偏倚说明
归纳总结与思考
流行病学(epidemiology)是揭示疾病、伤害、健康和卫生事件在人群中发生、发展和分布现象及其决定因素,提出预防、控制和消灭疾病及促进健康的策略和措施的科学。其研究内容包括:研究疾病、伤害与健康状况的分布,探讨疾病的病因、危险因素与流行因素,制定疾病预防和控制的对策与措施,研究疾病的自然史(natural history),患病概率、死亡概率的预测,用于医疗、卫生、保健服务的决策和评价,评价防治疾病的效果。疾病的分布和病因论与因果推断是流行病学的基本理论。
流行病学研究方法分为观察性研究、实验性研究和理论性研究三大类。其中,以观察性研究和实验性研究为主。观察性研究方法包括描述性研究和分析性研究两大类。
现况调查是开展眼病调查的常用流行病学方法。开展现况调查之前,需做好现况调查的设计,即制订现况调查的总体方案。其内容包括:确定调查地点、确定调查对象、确定样本量、选择抽样方法和判断标准。现况调查的实施要严格工作步骤,控制调查质量,以保证调查结果的可靠性、准确性。
筛检(screening)是运用快速、简便的试验、检查或其他方法,从表面健康的人群中发现哪些可能有病或缺陷、可疑者或具有发生这种疾病的高危的人体。筛检试验的对象是无该病的健康人、可疑有该病但实际无该病的人和确有该病的人。筛检试验要遵循其原则,实施步骤有:选择筛检试验、确定疾病筛检的标准、确定受试对象、确定样本量、整理评价结果、疾病筛检试验的质量控制。从真实性、可靠性和效益性三个方面来评价疾病筛检试验,常用指标包括:灵敏度、假阴性率、特异度、假阳性率、正确指数、标准差和变异系数、符合率与Kappa值、阳性预测值、阴性预测值。
学习检测
1.流行病学在眼视光学领域中有哪些用途?
2.列表比较病例报告、现况调查、病例对照研究和队列研究的概念、特点及步骤?
3.通过认真观察分析以下图表(图1-15至图1-17,表1-33),你都想到什么?
图1-15 2001~2004年不同月份我国结核病例数变化趋势
图1-16 2000年我国结核病不同年龄组感染率
图1-17 2000年我国结核病城乡不同年龄组感染率
表1-33 某地某年不同职业人群近视率
4.制订某市某区白内障患病情况现况调查方案?
5.对眼病的研究何时选择筛检?
6.筛检试验的实践中如何确定灵敏度与特异度?
案例分析:筛检标准不同灵敏度与特异度也会有所改变。若选择眼压升高作为筛检原发性开角型青光眼的标准。据资料显示,正常人的眼压分布范围为10~21mmHg,而青光眼患者的眼压分布为22~27mmHg。即在眼压为22~27mmHg范围中,既有正常眼,也有青光眼。
(1)若我们以27mmHg作为阈值筛选青光眼时,所有非青光眼者都会被认为是正常人,也就是说,这种筛检试验的特异度为100%。而眼压为22~27mmHg的青光眼患者也诊断为无病(阴性结果),这种阴性结果不是真实的,我们称之为假阴性结果。当假阴性率增大时,筛检试验的敏感性会明显下降。
(2)若我们以22mmHg作为阈值筛选青光眼时,所有患有青光眼的患者都会得到阳性结果,即这种筛检试验的灵敏度为100%。而由于正常眼的眼压也会分布在22~27mmHg之间,这些正常眼也会得到阳性结果,但这种结果也是不真实的,我们称之为假阳性结果。假阳性率增大,筛检试验的特异度会明显下降。
由此可知,在选择筛检标准阈值时,一定首先明确筛检试验是以高灵敏度为主还是以高特异度为主,并权衡假阳性和假阴性所造成的后果。对于假阳性者应当进一步诊断试验,如果诊断试验价格昂贵,就会增加医疗费用。这时,我们应当尽可能地降低假阳性率,而选择高特异度的筛检试验。同时也应当考虑到,若筛检的疾病非常重要,一旦漏诊就会发生严重后果时,就应当尽量降低假阴性率,而选择高灵敏度的筛检试验。
实践技能 眼病的流行病学调查实务
【操作目的】
通过对案例资料的学习与讨论,使学生掌握眼病现况调查的内容及意义;熟悉眼病现况调查的研究设计,疾病筛查的特点;能结合眼视光领域的工作实际进行眼病现况调查项目的设计,并组织开展眼病现况调查的实施;会做现场调查工作流程图。
【职业素质】
●培养学生的书面表达能力,综合分析解决问题的能力。
●培养学生沟通能力和团队协助能力。
●培养学生具有按照先进理念和科学方法制订现况调查计划、组织实施的能力和运用适当统计方法进行数据分析能力。
●培养学生逻辑思维能力与严谨认真、实事求是的科研精神和工作态度。
【操作方法】
●教师强调重点,提出相关要求。
●学生以每组3~6人形式进行病例阅读与分析讨论,结合实例提出相应的现况调查实施计划。
●每组选出代表发言交流,并互相评比及教师讲评。
【操作内容与实施】
●教师讲解所分析案例背景。
世界卫生组织是如何开展儿童屈光不正的现况调查?
眼视光学研究中,了解眼的健康状况和眼病在人群中的分布情况,评价特定人群的健康状况,做出卫生决策,现况调查是一种很重要的流行病学研究方法。现以世界卫生组织(world health organization,WHO)所组织的多个国家儿童屈光不正的研究为例说明眼病的现况调查的实施。本研究方案于1998年在中国、尼泊尔、智利实施,以后又在印度的两个地区、南非、马来西亚等地实施,是近年在全球实施的重要的屈光不正流行病学调查项目。
●教师展示案例,讲解现况调查的基本内容,并组织学生讨论。
一、确定现况调查的目的
现况调查的主要目的是:了解目标人群中疾病或健康状况的分布及其特征,分析某些因素与某疾病或健康状况的关系,评价防治疾病与促进健康的对策与措施的效果,开展疾病高危人群监测等。
1.屈光不正现况调查的原因 开展现况调查的首要问题是明确调查目的,何种眼病需要开展现况调查,主要的判断标准是眼病防治和防盲治盲的实际需要。具体来讲:一是该种眼病对公众的眼健康产生重大影响;二是该种眼病无可靠的患病率和在人群中分布特征的信息资料或该眼病存在一些变异因素而又无近几年的可靠的患病率和在人群中分布特征的信息资料;三是该种眼病的病因研究还不明确;四是需要评价该种眼病的防治措施的效果和促进眼健康的对策与措施的效果。
屈光不正作为世界卫生组织在多国开展现况调查的原因有:一是临床证据表明屈光不正不仅是中国,也是国际上儿童最常见的眼病,并对儿童的身心发育、学习生活能力、社会和适应能力都产生重大影响;二是屈光不正已对个人和社会造成了很大的负担,成为公众关注的公共卫生问题,根据调查,中国大学毕业生近视发病率高达70%~90%,小学生35%,中学生50%;三是虽认识到矫正儿童屈光不正的重要性,但长期以来,我们缺乏可靠的屈光不正患病率和其在人群中分布特征的资料,对不同人群中屈光不正的分布,以及不同年龄、性别、种族和用眼卫生中屈光不正患病率差别的了解也不完整。尽管许多国家都有一些屈光不正流行病学调查的资料,但因存在一些变异因素,也就很难比较不同国家的屈光不正患病率。
2.屈光不正现况调查的意义 在WHO的组织下,1998年在中国、尼泊尔和智利进行了“儿童屈光不正研究”。其意义如下。
(1)屈光不正,特别是近视眼,对患者和社会造成了沉重的负担。视力下降常常使学生在学校的表现较差。如近视眼可能对今后人生道路及职业的选择、眼部健康、心理、生活自尊都会造成负面影响。
(2)学龄期儿童是屈光不正的特殊高危险人群。学龄期儿童屈光不正未矫正将对其学习能力和接受教育的潜能产生很大的冲击。
(3)开展现况调查收集屈光不正的患病率资料为制订眼健康规划与措施提供科学依据。
(4)开展屈光不正手术治疗及预测屈光不正手术治疗的经济水平须了解更多更好的屈光不正的患病率资料。
“儿童屈光不正研究”的目的是在全球不同地区进行以人群为基础、横断面和多中心调查,估计不同种族和文化背景条件下的学龄期儿童屈光不正的患病率,为制订开展儿童眼保健的方法措施提供科学依据。
3.不同国家间屈光不正存在的变异因素
(1)诊断屈光不正的标准不一致。有的国家仅以裸眼远视力是否正常作为诊断屈光不正的标准;有的国家分别以屈光度≤-2.50D、≤-0.50D或≤-0.75D作为诊断近视眼的标准;有的国家又分别以≥+0.25D或≥+2.00D作为诊断远视眼的标准。
(2)不同的抽样调查中,采用了不同的抽样方法。
(3)大多数调查缺少以人群为基础的调查,而是在容易选择的人群中选择调查对象,如学生、应征的新兵、眼科门诊的患者等。
(4)不同的调查中,检测屈光不正的方法不同。有些调查滴用了睫状体麻痹剂,进行睫状肌麻痹下的验光,而另一些则未采用。
(5)不同调查选取的人群人口组成不一致。因屈光不正患病率随着年龄和眼轴长度改变而有相当大的变化,故人口的组成将会影响调查的结果。为确定不同种族的儿童中屈光不正的状况和其对公共卫生的意义,促进屈光不正服务设施的发展,应需要更多的有关屈光不正的资料。
二、现况调查的设计
开展现况调查之前,须做好现况调查的设计,即制订现况现调查的总体方案。也就是对调查过程中所涉及的调查目的、研究对象、所需人力、物力和财力等所有问题与事项进行条理化、系统化的合理安排,作为调查实施的依据。现况调查设计是现况调查的关键步骤之一。为保证调查质量,在调查设计阶段须考虑:①应选择具有代表性的人群为基础,而不应以特殊人群为基础;②调查中应采用统一的屈光不正标准;③检查视力时,应在使用睫状肌麻痹剂的条件下检查儿童屈光不正;④从不同年龄、不同性别描述屈光不正的研究结果。
(一)确定调查地点
为反映不同种族和文化背景下的学龄期儿童屈光不正状况,经过世界卫生组织项目专家委员会研究决定,选择中国、智利和尼泊尔这三个文化背景差异较大的国家开展调查。
1.屈光不正调查存在的问题 就中国而言,屈光不正,特别是近视眼的患病率很高。一些学者对中国屈光不正进行了多次患病率调查,但仍存在一些问题。
(1)某些调查不是以具有代表性的人群为基础。大多数调查是以眼科门诊患者为研究对象或者是参加体检的特殊人群。
(2)某些调查判断屈光不正的方法不可靠。一些调查以人群为基础,但用于判断屈光不正的方法不可靠。如一些调查者仅以视力来判断有无屈光不正;有一些研究者进行了屈光检查,但未进行睫状肌麻痹;还有一些调查者仅仅分析了视力异常人的屈光状态,或只分析了日常生活视力正常人的屈光状态。
(3)长期以来,无可靠的屈光不正患病率的调查资料。某些研究者对“以人群为基础”的理解有偏差,即虽然以人群作为调查对象,但没有严格地进行抽样,而是随意地调查了少数几个村或社区的情况,就以此代表某一地区进行分析。因此,长期以来我们无可靠的屈光不正患病率的调查资料。
中国的屈光不正问题受到社会各界的广泛关注,如教育界、公共卫生界、眼科学领域、儿童家长和公众等。为降低屈光不正患病率,已采取了一些措施,如改善学校教室照明及环境卫生条件、减轻学生学习负担、开展健康教育推广眼保健措施等,但都未真正有效地控制屈光不正的发生,降低屈光不正患病率。为此,加强以人群为基础的屈光不正的现况调查,制定眼保健措施,降低屈光不正患病率,提高眼健康水平具有非常的必要性。为保证研究对象的代表性,选择调查地点也很重要。
2.调查地点选择 选择调查地点须考虑的因素:社会经济状况、主要人群的种族组成、研究者对调查地点的了解程度及与当地卫生和其他部门机构熟悉程度、地理位置及环境条件等因素。如中国选择北京顺义区作为儿童屈光不正研究地点。
(1)北京顺义区的社会经济状况在全国属中上水平,代表全国近平均水平,所得结果较易推论我国其他地区。
(2)熟悉掌握北京顺义区人口及其构成情况。
(3)北京顺义区是中国医学科学院眼科研究中心和北京协和医院的防盲治盲基地,顺义区眼科的力量较强,容易配合儿童屈光不正的研究工作。在此开展眼病流行病学调查的基础比较好,有利于提高调查结果的准确性。
(4)当地政府、教育部门、教师和儿童家长非常关心儿童屈光不正的问题,能积极支持配合在顺义区开展儿童屈光不正的调查研究项目。
(二)确定调查对象
在调查地点范围内,根据研究目的,“儿童屈光不正研究”确定的目标人群为儿童(5~15岁)。根据顺义的人口学资料,满足这一条件的儿童占全区总人口的21.7%,约有11万人。平时,其中5~6岁儿童主要在幼儿园,7~12岁儿童主要在小学,13~15岁儿童主要在初中。未上学的儿童占极少部分。
知识拓展与自学指导
“儿童屈光不正研究”年龄下限为5岁,上限为15岁,为什么?
5岁的儿童可接受和能配合研究者完成视力检查;15岁一般为9年义务教育的最后一年,过15岁的儿童可能会到外地就学、务工,要求15岁以上儿童参加本项目的研究非常困难,从而影响检查结果的准确性。请同学们思考:还有其他原因吗?
(三)确定样本量
现况调查可以采用普查或抽样调查的方法实施调查。综合普查与抽样调查的特点、所具有的人力、物力和财力等资源,尤其是研究目的的要求。北京顺义区,“儿童屈光不正研究”采用了抽样调查的方法,其样本量的大小,依据项目二中现况调查样本量估计的影响因素及计算公式,结合本项目收集的资料主要是计数资料,主要研究指标为患病率,样本量估计选择下列公式。
式中,p为预期患病率,可通过查阅文献或预试验获得。经查阅文献,本研究项目选择22%作为15岁儿童屈光不正的预期患病率。
δ为允许误差,通常对结果的精确度要求在95%可信区间下误差不超过20%。本研究项目的允许误差δ=0.22×20%=0.044。则本项目每组样本量为:
样本总量估计:在儿童屈光不正研究中,调查对象5~15岁儿童,以1岁为组距,共有11个年龄组。各组儿童的屈光不正患病率不同。为计算和实施研究的方便,假定5~15岁儿童中屈光不正的患病率是均匀分布,则11个年龄组需要的总样本量为3 740人。
校正样本总量估计:因“儿童屈光不正研究”中,不可能采用单纯随机抽样的方法抽取每个受检者,而是采用整群随机抽样的方法抽取,就需要用抽样作用系数来校正样本量,以便补偿可能发生的抽样效率不高的问题。抽样作用系数可人为根据研究目的、研究结果的精确度、样本代表性等确定。本研究项目人为确定抽样作用系数为1.25,所需样本量为4 675人(3 740×1.25)。
现况调查中无应答率对调查结果的影响不容忽视,因此,在确定样本量时还应当根据预期的不应答率计算应被因数来补偿增加样本量。“儿童屈光不正研究”中,据估计可接受的不应答率最大为10%。则样本量根据应被因数1/(1-0.10)≈1.111所调整,最终确定样本量为5 194人(4 675×1.111)。
(四)选择抽样方法
“儿童屈光不正研究”采用整群随机抽样的方法抽取研究对象。
1.确定基本抽样单位 北京顺义区的基本行政单位是行政村,以其作为基本抽样单位较容易实施。而且能确保研究对象是从自然人群抽取,抽样人群的年龄和性别组成与目标人群相似,符合“以人群为基础”的要求。但是,因顺义区的各村人口数相差很大,大的村人口超过5 000人,小的村人口仅数百人。若以行政村作为基本抽样单位进行单纯随机抽样,就会产生较大的抽样误差。同时,虽然人口数相近的行政村中的调查对象都有相同机会被抽取到样本中,但人口数多的行政村中调查对象要比人口少的行政村中调查对象抽中的机会大。为此,首先将北京顺义全区以行政村为基础重新划分抽样的基本单位,规定人口数约为1 000人,包括5~15岁儿童约为200人作为一个基本抽样单位。人口数为1 000人左右的行政村仍作为一个基本抽样单位;人口大于1 500人的行政村,以居民小组为单位,分为几个基本抽样单位,保证每个基本抽样单位的人口数接近1 000人;而人口数小于500人的小村,则与周围的小村合并为人口数接近1 000人左右的一个基本抽样单位。
2.基本抽样单位排序 将确定的基本抽样单位按照一定次序排列。首先,依据北京顺义全区各乡镇名称的汉语拼音的字母顺序将各乡镇排序;其次,将各乡镇的基本抽样单位按地理位置从东向西、从北向南排序。
3.抽样实施 采用单纯随机抽样的方法,从排序的基本单位中随机抽取若干基本抽样单位作为调查点。
尼泊尔和智利无我国一样的户籍制度,也就不可能采用北京顺义区确定基本抽样单位的方法确定基本抽样单位。他们在确定调查区域后,派检录人员进行实地抽样调查。即将居民区按道路、河流等地理条件标志划分基本抽样单位,然后再以单纯随机抽样的方法抽取调查点。
(五)儿童屈光不正的定义和标准
为便于分析研究,在“儿童屈光不正研究”的项目中,明确屈光不正的定义与标准,以便统一采用。
(1)未矫正视力:指没有进行屈光矫正的裸眼远视力。
(2)戴镜视力:指配有眼镜者在戴用原有眼镜时的远视力。
(3)最好矫正视力:指睫状肌麻痹下经屈光矫正所获得的最好视力。
(4)日常生活视力:指受检者在日常屈光状态下的视力。分以下几种情况:①未戴眼镜的受检者,未矫正视力就是其日常生活视力;②如果已配有眼镜,但不经常戴用者,也以未矫正视力作为其日常生活视力;③已配有眼镜且经常戴用者,则以戴镜视力作为其日常生活视力。
(5)正常视力:双眼未矫正视力大于或等于0.8者为正常视力者。未矫正视力大于或等于0.8的眼为视力正常眼。
(6)低常视力:双眼或单眼未矫正视力小于0.8者为低常视力者。未矫正视力小于0.8的眼为低常视力眼。
(7)等值球镜度:根据视网膜检影、电脑验光或主观验光的结果,等值球镜度等于球镜度数加上二分之一的柱镜度数。
(8)近视眼:指在睫状肌麻痹下等值球镜度数等于或小于-0.50D的眼。近视眼人数包括单眼或双眼为近视眼的人(一眼为近视、另眼为远视或正视的人归入近视眼中)。轻度近视眼指等值球镜度的绝对值在-3.00~-0.50D范围之间者;中度近视眼指等值球镜度绝对值在-6.00~-3.00D范围之间者:高度近视眼指等值球镜度绝对值高于-6.00D者。
(9)远视眼:指在睫状肌麻痹下等值球镜度大于或等于+2.00D的眼。远视眼人数包括双眼为远视眼以及单眼远视眼,另眼为正视眼的人(单眼远视,另眼近视者归入近视眼中),轻度远视眼指等值球镜绝对值在+2.00~+3.00D范围之间者;中度远视眼指等值球镜度绝对值在+3.00~+6.00D范围之间者;高度近视眼指等值球镜度绝对值高于+6.00D者。
(10)屈光不正:近视眼人数和远视眼人数之和为屈光不正的人数。近视眼和远视眼眼数之和为屈光不正眼数。
(11)正视:在睫状肌麻痹下双眼等值球镜度在-0.50~+2.00D范围之间者为正视者,屈光度在此范围内的眼为正视眼。
(12)屈光参差:双眼等值球镜度差值的绝对值屈光度之差≥2.00D时,为屈光参差者。
(13)弱视:单眼或双眼未矫正视力<0.8,最好矫正视力仍<0.8,并排除黄斑部明显器质性病变者为弱视者。未矫正视力<0.8而最好矫正视力仍<0.8,并排除黄斑部明显器质性病变眼为弱视眼。
(14)调节力:调节力是指眼睛既能看清远处,又能看清近处景物的能力。调节是通过眼球同睫状肌、晶状体悬韧带和晶状体来实现的。当注视无限远处的目标时,眼球内睫状肌充分松弛,晶状体悬韧带牵拉着晶状体赤道部,使晶状体变得扁平;当注视目标移近时,睫状肌逐渐收缩,使晶状体悬韧带逐渐放松,晶状体及其固有弹性使之趋向球形,凸度变大,屈光力增强,使近处景物的影像正好落在视网膜上,从而能够看清近处景物。保持好的调节力是护眼的重要方面,多做户外运动,如打球、跑步、体操等,假日往郊外旅游,青山、绿水、阳光、新鲜空气,更是眼睛的守护神,如果能够保持每天运动的好习惯,不仅可以疏解精神、活化细胞,对眼睛而言,更是最理想的保养法。
(15)调节幅度:注视远点时与注视近点的屈光力之差称作调节幅度或绝对调节力、最大调节力。调节幅度(D)=1/近点距离(m)-1/远点距离(m)。
三、现况调查的实施
1.确定调查对象及其检录 检录就是确定受检对象的过程。现场调查之前,向各调查点派出检录队从事检录受检对象的工作。检录时根据调查点的户籍资料进行。
(1)检录的内容:每个儿童的一般资料,如姓名、性别、年龄、住址、所在学校、年级、班级,以及其父母或监护人的姓名、住址、受教育程度、职业、工作单位等。
(2)确定调查对象:被抽取的基本抽样单位中所有家庭中的5~15岁儿童均作为调查对象。但有些需要做特殊处理:离开原居住村已经超过6个月的儿童要排除,而一些虽不在村户口册内,若经学校教师或村主任证实其村内居住超过6个月时,应列为调查对象。
检录工作结束后,按受检对象所在学校重新整理受检者名册,了解受检对象在各学校的分布情况,每个学校各有多少儿童是研究对象,以便在实施调查前做好充分准备,实施调查时很方便找到他们。对于少数未在学校的儿童,可统一安排他们就近参加眼部检查。
2.检查内容和方法 “儿童屈光不正研究”的项目中,实施检查者需要是经过培训的医疗技术人员,且在眼科医生指导下进行眼科检查。检查过程中,检查方法与标准要规范、一致。检查项目如下。
(1)视力检测。测量未矫正视力和最好矫正视力。对配戴眼镜的儿童,还要测量戴镜时视力。测量方法应采用背后照明的logMAR视力表(生产商:美国伊利诺伊州,Villa Park,Precision Vision公司)进行远视力检查。其特点:这种视力表的视标为“E”字形,每行的视标数均为5个,共14行。字母的开口方向以随机数字来确定。各行视标大小顺序从上往下排列,各行视标的大小按几何级数变化。每一行的视标间距与视标大小相等,行间距等于较小一行视标的高度。应用这种视力表可有效地消除“拥挤效应”,使视力检查结果只与视标大小相关。
1)视力检查时的条件:视力检查在室内进行,照度要求为100lx以上。在白天采光良好的室内可以达到这一要求。放置视力表的灯箱由反光的聚乙烯制成,内置日光灯管,使灯箱照度超过150cd/m2。
2)检查顺序及要求:先检查未矫正视力,即如果受检查者配戴眼镜,则先查未矫正视力,再检查戴镜视力。先查右眼,用挡板遮盖左眼。要求受检者坐直上半身,不能眯眼。从视力表由上而下检查,每一行的5个视标全部看对或只看错一个视标时,可进行下一行检查。当受检者在一行视标中看错2个及以上时,不再继续检查,以上一行的记录为视力结果。先在4m远处检查。如果受检者不能辨认最大一行视标时,请他前移到1m远处再以相同的方法检查,所得的结果除以4,即为视力结果。如果在1m远处还不能辨认最高一行字母时,则检查受检眼有无眼前手动、光感等。无眼球或眼球萎缩眼的视力记录为无光感。对于个别智力低下无法配合视力检查的儿童,则如实记录结果。
(2)对于配戴眼镜的儿童,测量所戴眼镜的镜片度数,包括球镜和柱镜度数、散光轴位。
(3)检查眼位:在0.5m和4m远处以遮盖试验和角膜映光法观察眼位。
(4)在2.5倍的放大镜下,检查外眼和眼前节。
(5)滴用睫状肌麻痹剂硫酸环戊通滴眼液1滴,5min后再滴1滴。20min时观察瞳孔大小和对光反应,如果瞳孔直径为6mm以上,再过20min即可进行验光检查。如果瞳孔尚未散大则再滴用硫酸环戊通滴眼液1次,再过20min可进行验光检查。如果滴药3次后瞳孔仍不能散大者不再滴药。所有视网膜检影、电脑自动验光和主观验光均在1h内完成。滴用硫酸环戊通滴眼液后20min起效,40min后达作用高峰,最大睫状肌麻痹作用维持1h,剩余作用持续6~8h。散大的瞳孔持续1~2d可以恢复正常,对儿童的生活、学习影响较小。一般认为其剩余调节作用大于阿托品,但比复方托吡卡胺、后马托品等效果好。该药偶尔可引起口干、恶心等不适,在使用中应当注意。
(6)在半暗室中应用点状光源检影法进行视网膜检影,检影工作距离为1m。检影时嘱受检查者从检查者耳边向前平视5m远处,以放松调节。屈光度等于中和影像所用的透镜度数减去1D。
(7)采用手持电脑验光仪进行自动验光。这种验光仪非常轻便,操作简单,检查快速,可以精确地测量-12D至+12D的球镜度、散光度及散光轴位和角膜曲率。检查者手持验光仪对准受检者瞳孔,验光仪有自动对焦系统,可以判定验光仪位置是否保持水平,与瞳孔距离是否适当。检查者根据验光仪的提示调整位置,同时通过屏幕观察瞳孔,一旦位置合适并能保持1~2s,检查结果可显示在屏幕上,并可由配套的打印机打印出结果。
(8)对于未矫正视力小于0.7的眼进行主观验光。
(9)屈光间质和眼底检查。
(10)对于受检查者确定视力损伤的原因。
3.工作组织和工作人员要求 “儿童屈光不正研究”在WHO的组织下进行,由7位国际知名的眼科流行病学专家组成技术咨询委员会对整个项目进行指导。工作人员由两部分组成,一是项目现场调查实施人员,二是资料的输入与处理人员。
项目现场调查实施人员由两支调查队组成。每支调查队由5名工作人员组成。其中,一名是眼科医生任队长,在现场调查中负责受检查者的眼部检查和电脑验光;两名是眼科医生助理,分别负责视力检查和眼镜度数的测量;一名验光师负责视网膜检影和主观验光;一名助手负责受检对象的核对、现场秩序的维持和资料的初步核对等工作。
资料的输入和处理由专人负责,在技术咨询委员会指导下进行。
4.工作人员的培训和预试验
(1)培训工作人员:在正式现场工作之前,对参加现场工作的人员进行为期1周的培训,目的是使所有工作人员了解“儿童屈光不正研究”项目的意义、目的、方法、详细步骤及各项要求;熟悉各种表格的填写;熟练掌握各种仪器的使用;眼科医生助理熟悉检查视力步骤和标准,眼科医生对常见眼病诊断采用统一的诊断标准;验光师统一视网膜检影、主观验光的方法。
(2)预试验前预备试验:培训结束后,进行为期1d的预试验前预备试验,目的是了解工作流程是否顺畅,实施方案中有无问题,各种仪器的性能是否良好,工作人员是否协同工作,以便及时修改,保证正式调查实施的顺利进行,达到预期目的。
(3)预试验:结束1d的预试验前预备试验后,接着进行为期3d的预试验。其主要目的是通过较大样本中实施完整的试验过程,检验两支调查队的检查结果的一致性、可靠性。检查在275名适龄儿童中进行,重点进行视力检查、眼镜度数测量、视网膜检影和电脑验光结果的比较。预试验结束后,根据预试验存在的问题改进了工作流程,统计人员整理、分析了资料,技术咨询委员会评估认可了预试验工作和一致性检验结果,同意进行正式现场调查工作。
预试验的结果不归入正式现场调查结果中。
5.现场实施现况调查 现场调查工作共持续了两个半月。
(1)设立检查站:检查站通常设在儿童较为集中的学校,调查队每天首先到达一所受检儿童最为集中的学校,借用学校教室设立检查站。一般占用三间教室,其中,一间要求采光良好,用作登记、视力检查和眼镜度数的测量;另外两间则遮蔽门窗作为暗室,其中一间用于眼部检查和电脑验光,另一间进行视网膜检影和主观验光。
(2)实施检查:检查者到现场后,首先由检录员根据检录结果,再次确认受检者。同时检录员从儿童家长或监护人(如学校老师,亲属)处得到儿童参加本研究的同意书或口头同意。然后,组织受检者到事先确定的检查站接受眼部检查,而对于少数不能来检查站接受检查的对象,应安排检查人员登门检查。
(3)工作流程:工作流程为现场工作的依据,见图1-18。现场调查开始,首先由调查队助手核对受检者是否与检录名单相符,核对完成由眼科医生助理测量未矫正视力,若是戴镜儿童则继续测量其戴镜视力和镜片度数。然后,由眼科医生对全部受检儿童进行眼部检查,了解有无斜视和眼前节病变,确定能否接受散瞳,并将受检者分成两部分,一部分需要散瞳,另一部分不需要散瞳。前者,滴用睫状肌麻痹剂后将散瞳满意者平均分成两组,分别为一组先接受视网膜检影,另一组先接受电脑验光,完成后两组互相交换进行。对于散瞳者未矫正视力小于0.8的儿童再进行主观验光,并确定最好矫正视力。最后再由眼科医生检查眼后节,确定视力下降的原因,提出处理意见。后者,不需要散瞳,直接由眼科医生检查眼后节,确定视力下降的原因,提出处理意见。
检查结束,核对记录表是否有误,有问题者复查,复查无误后同无问题者向受检者、老师和家长说明检查结果,并将资料妥善保存,录入与处理,撰写调查报告。
图1-18 现场调查工流程
6.质量控制 现况调查中,保证研究工作的质量才能尽可能使研究结果准确、可靠。具体措施如下。
(1)培训工作人员。
(2)一致性检验:研究过程中进行了多次一致性检验。成立两个调查队同时对一批受检者进行检查,了解两队的检查结果的差异是否在允许的范围内,从而进行一致性检查,及时发现问题进行矫正。北京顺义区“儿童屈光不正研究”项目的预试验中进行了一次一致性检验,共检查了275人。正式现场工作中,每隔1~2周进行一次一致性检验,共安排了5次,分别对51、46、54、33和36人进行检查。同时对两队测量的未矫正视力、视网膜检影、电脑验光的结果进行了比较。检查人员均独立地进行检查,不能参与他人的检查结果。
视力检查、视网膜检影和电脑验光一致性检验,见表1-34。
表1-34 预试验中主要检查项目一致性检验结果
1)视力检查应用加权Kappa法进行检验。其方法:凡两位检查者结果相同的权数为1;结果相差1行的权数为0.75;相差1行以上的权数为0。如果Kappa值等于1,说明两次判断的结果完全一致;如果Kappa值为0,说明两次判断结果完全是由于机遇造成的。通常,如果Kappa值≥0.75,说明两次判断的结果已取得相当满意的一致性;如果Kappa值<0.4,说明两次结果的一致性不够理想。在预试验时,对于两支检查队视力检查结果Kappa值已为0.75,说明两支队视力检查的一致性的程度有增高的趋势。
2)视网膜检影和电脑验光:对两队视网膜检影和电脑验光的结果采用相关分析来了解两者一致性,相关系数均≥0.07,说明一致性的程度是相当高的。
7.资料的录入、处理和分析 资料的录入是否完整、准确,处理与分析方法是否恰当对研究结果的准确性也有重要影响。为妥善安全地处理资料,“儿童屈光不正研究”项目在北京顺义区调查队驻地建立了资料处理点,所有检录资料、预试验资料以及正式现场调查资料由专人应用Epi INFO 6.04版软件输入计算机,建立原始资料库。
每天现场工作结束后,由专人核对检查、收集和保管资料,并随时提交各调查受检率,以便了解现场工作的进展情况。
全部检录和眼部检查资料输入计算机后,应用Stata 5.0版软件进行查错分析,若发现错误后,资料输入人员不得任意改动,须经原检查人员确认后方可改动。对于无法确认或缺失的数据,检查人员尽可能返回调查点进行复检。不能复检的数据如实输入,留待分析时处理。
核查后的资料应用Stata 5.0版软件进行分析。完成资料的分析后,撰写调查报告。
知识拓展与自学指导
某高校新生近视患病率现况调查
1.分组5~6名学生组成一个调研小组。
2.以小组为单位课下自主设计现况研究方案,并开展实施。
3.撰写现况研究报告。
4.根据本项目所学案例修改完善以上问题2和3。
【综合训练与技能提升】
1.讨论思考题:
(1)分析选择研究对象的理由?
(2)开展现况调查应注意哪些问题?
(3)总结现况调查的基本内容及本案例现况调查实施方案。
每组选出代表发言交流,并进行评比矫正。
2.请你制订所在学校学生近视状况现况调查计划。
(段丽菊)
【注释】
[1]1mmHg≈0.13kPa,本书为贴近临床,压力单位均采用“mmHg”。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。