第三节 两组比较的秩和检验
两组比较秩和检验亦称两个独立样本资料的秩和检验(Wilcoxon两样本比较法),适用于两组数值变量资料和两组有序分类变量资料的比较。下面结合实例加以介绍。
(一)方法与步骤
例8-2 测得铅作业工人与非铅作业工人的血铅值(μmol/L),见表8-2,问两组工人的血铅值有无差别?
表8-2 两组工人的血铅值(μmol/L)
(1)建立检验假设
H0:铅作业工人和非铅作业工人血铅值总体分布的位置相同;
H1:铅作业工人和非铅作业工人血铅值总体分布的位置不同;
α=0.05。
(2)求检验统计量T值:将两组数据分别由小到大排队,然后统一编秩。编秩时如遇有原始数据相同时,可分两种情况处理:①相同数据在同一组,如非铅作业组第1、2两个数据皆是0.24,其秩次按位置的顺序记为1、2。②相同数据分在两组,如铅作业和非铅作业组各有一个0.87,应编秩次10、11,均取其平均秩次(10+11)/2=10.5。
分别求两组秩和,以样本含量较小者为n1,其秩和为统计量T。若n1=n2,可取任一组的秩和为T。本例n1=7,n2=10,则T=93.5。
(3)确定P值和作出推断结论:由n1,n2-n1查本书后“附表8-2T界值表”,若T值在界值Tα范围内,则P>α;若T值在界值Tα外,或恰好等于下界值(或上界值),则P≤α。本例n1=7,n2-n1=3,T=93.5,查附表8-2得双侧P<0.05,按α=0.05水准,拒绝H0,接受H1,差别有统计学意义。故可以认为铅作业工人与非铅作业工人的血铅值不同。由于编秩次采用有小到大,因此,平均秩次大的其血铅值高,平均秩次小的其血铅值低。铅作业组的平均秩次为93.5/7=13.36,非铅作业组的平均秩次为59.5/10=5.95,所以,可以认为铅作业工人比非铅作业工人的血铅值高。
如果n1或n2-n1超出附表8-2的范围,可用正态近似法即u检验,按式(8-2)计算u值。
式中:N=n1+n2;0.5为连续性校正数。
式(8-2)是在无相同秩次(tie),即无相同观察值的情况下使用,在相同秩次不多时可得近似值。
当相同秩次较多时,尤其在有序分类资料中,常采用频数表作秩和检验,以各组段的平均秩次代表该组段的所有观察值。故按式(8-2)计算的u偏小,须按式(8-3)校正。
式中:为第j个相同秩次的个数。
例8-3 用甲、乙两种方法治疗小儿多动症,疗效见表8-3第(1)、(2)两栏,问甲、乙两方法的疗效是否相同?
表8-3 两种方法治疗小儿多动症的疗效
(1)建立检验假设
H0:两种方法的总体疗效分布相同;H1:两种方法的总体疗效分布不同。
α=0.05。
(2)求检验统计量u值:由于本例为有序分类资料,为对两组数值进行编秩,需先计算各等级的合计人数,见第(4)栏,再确定各等级的合计例数在两组所有数值中所处的秩次,即秩次范围。如疗效为“近控”者共320人,其秩次范围1~320,这320人属同一等级,不能分高低,故一律以其平均秩次(1+320)/2=160.5代表,仿此得(5)、(6)栏。
再求秩和,分别将第(6)栏乘以(2)、(3)栏人数,相加即得两组各自的秩和,见第(7)、(8)栏,因n1=200,T=52 950。此例n1=200,n2=300,n2-n1=100,已超过“附表8-2T界值表”所列范围,可由公式(8-2)求u值。又由于此资料的相同秩次很多,须按(8-3)式作校正。
(3)确定P值和作出推断结论:uc>1.96,P<0.05,按α=0.05水准,拒绝H0,接受H1,差别有统计学意义。故可以认为两种方法的疗效不同。由于编秩次由好到差,平均秩次低的疗效好,平均秩次高的疗效差,甲法疗效的平均秩次为52 950/200=264.75,乙法疗效的平均秩次为723 000/300=2 410,所以,可以认为乙法的疗效优于甲法。
本例也可用第七章中R×C表χ2检验,但在χ2检验中,各级的秩序任意排列所得χ2值相同,因而判断结果相同。但各级别有强弱之分,不能任意排列,只能从强到弱或从弱到强排列。因此,χ2检验没有考虑等级的强弱信息,而秩和检验考虑了这点,说明秩和检验更适合于单向有序分类资料。
(二)本法的基本思想
如果H0成立,则当n1与n2确定后,样本含量为n1的样本的秩和T值与其平均秩和n1(N+1)/2应相差不大;若相差悬殊,超出了附表8-2中按α水准所列的范围,说明随机抽得现有样本统计量T值的概率P小于α,因而在α水准上拒绝H0。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。