首页 理论教育 统计处理中的常见错误

统计处理中的常见错误

时间:2023-04-19 理论教育 版权反馈
【摘要】:对实验数据进行合理的统计学处理是提高科研质量的必要手段。有些资料未加适当统计处理,不考虑抽样误差而凭表面数字差别就轻易下结论,更多的见于处理方法不恰当。医学论文中常见的错误是多组均数间仍用t检验做循环比较。这是率与构成比两者的误用,此处,应为构成比,而非率,其指在本医院死亡病例中因肝硬化而死者,表示的意思是在各类死亡者中,因肝硬化死亡所占比重。若不符合则作相应的处理。

对实验数据进行合理的统计学处理是提高科研质量的必要手段。随着现代科学的发展,特别是医学统计学、生物医学工程学和电子计算机在医学科研中的应用,广大临床工作者越来越有必要更多地熟悉一些数理统计知识,以便获得可靠的资料,从而得出正确的结论。

在各种医学期刊论文中,对统计学处理与统计指标的合理运用问题,已比过去有所重视,但尚存在不少问题。

1.标准差、标准误的误用 标准差和标准误是两个不同的概念。标准差表示变量值个体间离散情况,而标准误表示样本群体间差异程度,衡量抽样误差大小。两者在临床实际应用中的主要区别在于:标准差用以计算正常值范围,标准误用以估计总体均数的可信区间。在医学论文中这两个指标的应用是很常见的,而达到合理运用尚存在一些问题。例如,在比较两样本统计量时只考虑平均水平(均值),而忽视了离散情况(标准差)和抽样误差(标准误);在正常值研究时,如资料近似正态分布,应当用均值加减t倍标准差(X±tS)来确定95%的正常值范围(t根据样本大小查t值表而定),而有不少论文错用了标准误。

临床正常值确定方法依资料频数分布类型而定,主要有两种:一是均值加减标准差法适用于近似正态分布资料:二是百分位数法,适用任意分布资料。此外,角度资料(如脑血流图、心电图等的角度数据)运用圆形分布法,Poisson分布资料用Poisson分布法,正偏态分布资料用对数正态分布法等来处理。现今全国发表的一些医学论文中,正常值方面的问题也较多。如在“迁延性、慢性肝炎患者植物血凝素皮试应用价值的探讨”一文中写道:“正常人甲组156人……平均值±标准误为15.4±0.4mm(平均值±标准差为15.4±5.6mm)。”那么,正常值是用标准误与标准差哪个统计量来计算的呢?是加减1倍还是2倍标准差(或标准误)呢?作者均未说明。

2.R×C表的处理问题 在临床及动物实验研究中常遇到多组多级频数的比较,统计学中称R×C表资料,论文中不少忽视此类数据的合理统计处理。有些资料未加适当统计处理,不考虑抽样误差而凭表面数字差别就轻易下结论,更多的见于处理方法不恰当。对此类数据可采用χ2检验,但其应用条件为双向无序分类,而且对样本量有要求(理论数小于5者不大于1/5),若不符合应用条件,则应采用超几何概率计算法、秩和检验与等级指数法等。

另外,作两组计数资料比较时,若一组有零反应,即出现0或100%情况时,可用零反应公式处理。

3.t检验与F检验误用 当研究对象不同组别进行比较时,两组均数间比较用t检验,多组均数间比较可用F-Q检验。医学论文中常见的错误是多组均数间仍用t检验做循环比较。

4.率与构成比误用 率与构成比是两个不同的、论文中使用十分普遍的概念,但亦存在诸多不合理应用与表达问题。主要有两点:概念不清和两者的误用。例如:有论文中表述,“近几年通过本医院肺癌病人治疗情况的观察,肺癌死亡率30%。”这是率的概念混乱,应为病死率,而非死亡率。又如有论文中写到,“对本医院近几年死亡病例分析显示,肝硬化病死率15%。”这是率与构成比两者的误用,此处,应为构成比,而非率,其指在本医院死亡病例中因肝硬化而死者,表示的意思是在各类死亡者中,因肝硬化死亡所占比重。

5.不做标化处理直接比较问题 比较两个或多个总的频率指标时,若两组或多组对象内部构成存在差别且足以影响结论时,应使用率的标准化法加以校正,如直接比较必然会出现错误结论。该法是在某种统一标准构成条件下进行率的对比的方法。如不同地区的某病死亡率、患病率、发病率,不同医院某病的病死率、治愈率、病床周转率等相互比较,作标准化处理后再作比较,才能正确地对比其率的高低。

6.不考虑资料的应用条件 各种统计分析方法都有其适应条件,在选用统计方法时,应严格把握,考虑所分析的资料是否符合其条件。计量资料在计算均数或显著性检验时,其基本条件是正态分布、方差齐性,可通过图示或检验(正态性检验、方差分析)看是否符合这基本条件。若不符合则作相应的处理。计算集中趋势指标可使用中位数法(用于离散分布)或几何均数(对数正态分布)。做统计学检验可通过数据转换或者改非参数检验。

计数资料各种方法均有其自身的适应条件,χ2检验基本条件是某一事件概率不会太小,若发生概率太低,则改用小概率事件显著性检验。如河水中细菌数的测定、某人群恶性肿瘤发生频率的调查等。常用方法有二项分布、泊松分布、精确概率检验。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈