首页 百科知识 医学期刊编辑应重视论文中统计学审查

医学期刊编辑应重视论文中统计学审查

时间:2023-02-27 百科知识 版权反馈
【摘要】:以《中华临床感染病杂志》为例,从科研设计、统计学描述,统计方法选择和结果解释方面分析常见的统计学错误,希望编辑在工作中,主动学习统计学知识,努力提高对稿件的统计学审查能力。可见,医学论文中存在的统计学错误非常普遍且严重,影响了论文的学术性及可读性。编辑作为期刊质量的“把关人”,应重视统计学审查。本文主要以《中华临床感染病杂志》为例,结合工作中的体会,谈谈医学期刊编辑实务中常见的统计学错误及对策。
医学期刊编辑应重视论文中统计学审查_中国科技期刊新挑战:第九届中国科技期刊发展论坛论文集

医学期刊编辑应重视论文中统计学审查

彭 芳1董燕萍2*金建华1余 方1

(1.《中华临床感染病杂志》编辑部浙江杭州310003;2.《国际肝胆胰疾病杂志》编辑部浙江杭州310003)

作者单位:彭芳,浙江大学医学院附属第一医院期刊中心《中华临床感染病杂志》责任编辑

通信作者:董燕萍,浙医一院期刊中心主任

摘 要:统计学使用的正确与否直接关乎期刊的稿件质量,然而目前审稿及编校中,发现统计学使用存在较多问题。以《中华临床感染病杂志》为例,从科研设计、统计学描述,统计方法选择和结果解释方面分析常见的统计学错误,希望编辑在工作中,主动学习统计学知识,努力提高对稿件的统计学审查能力。

关键词:统计学;科研设计;编辑;医学期刊

质量是期刊的灵魂,是期刊赖以生存的基石,论文质量的评价主要包括科学性、创新性和实用性。统计学方法的正确选择和使用是医学论文具有科学性和可靠性的重要保证[1]。然而编辑在审稿、改稿过程中,将更多的精力放在规范、文字和格式的编排上,专家审稿时,通常是围绕其学术价值进行分析、点评,很少有专家对稿件中统计学存在的问题提出全面的意见。2012年,中华医学会系列杂志专家组在对496篇文章进行统计学审读时发现,科研设计错误36处(7.3%),样本质量错误45处(9.1%),统计描述错误38处(7.7%),统计方法及分析错误78处(15.7%),结论及解释错误15处(3.0%)[2]。可见,医学论文中存在的统计学错误非常普遍且严重,影响了论文的学术性及可读性。编辑作为期刊质量的“把关人”,应重视统计学审查。本文主要以《中华临床感染病杂志》为例,结合工作中的体会,谈谈医学期刊编辑实务中常见的统计学错误及对策。

1 医学期刊中常见统计学错误释疑

1.1 科研设计错误

科研设计是实施科学研究的第一步,关系着医学研究工作的成败,合理的科研设计加上正确的统计学方法才能保证论文的学术价值,科研设计需要遵循四项基本原则:随机、对照、重复、均衡[3-4]。但现实是,研究者常违背四原则,使得科研设计或多或少存在缺陷。稿件中最常见的是作者在收集资料和分组时,未交代分组是否随机;或未说明随机的方法,只是笼统的将病例随机分组;又或者是将随意分组替代随机分组。例如,比较抗病毒药物对慢性乙型肝炎的疗效,有些作者按照患者入院的先后顺序进行分组,没有考虑到按就诊的先后顺序分组可能会受病情轻重等非实验因素影响,导致两组患者病情轻重有较大差异,即便治疗后的各组指标具有统计学差异,也很难得出哪种药物疗效更好的结论。未设对照组也是科研中常犯的错误,比如评价某种技术对基因位点的检出率,有些作者未设立金标准,比较两种检测方法的敏感性,特异性,阳性预测值及阴性预测值等,直接由检出率得出:此方法快速、简便、准确、易行,结论没有说服力。临床上,由于人力、物力、财力的限制,使得收集的样本量有限;另一方面,因研究处理因素对研究对象的影响,又须将这些有限的样本进行分组,最后导致每组的样本量达不到研究所需的要求,即使后面的统计方法选择正确,结论的可靠性也不强。编辑在处理这类稿件时,要判断样本量是否能支持后续的统计学分析,如果样本量太小,建议作者收集足够的样本进行再研究。此外,在强调“随机、对照、重复”原则时,要重视均衡原则的重要性。然而很多作者在对研究对象进行分组时,容易忽视年龄、性别、体重、病程和季节性等非实验因素的影响,有些疾病如肝癌的发生,中老年人、男性、饮酒和有家族史等常为易感因素,作者应考虑这些因素的作用。

1.2 统计描述和方法错误

1.2.1 统计描述错误[5]

在医学研究中,很多作者花了大量精力去收集资料,整理数据,但在距离真相只有一步之遥的时候,却因不懂统计学或误用统计学而与真相失之交臂。有些作者一开始就对资料的类型判断错误,看到带有“率”的资料就认为是定性资料。然而,有些指标虽用百分率表示,其实得出的是具体数据,应该视为定量资料,比如研究外周血T淋巴细胞亚群的分布,即使用(A+B)%表示,也应作为定量资料处理。更多情况下,作者未能用正确的形式表示研究资料的类型:例如对于定量资料,在未交代数据是否符合正态分布的情况下,用-x±S表示,而用-x±S表示正态分布的数据,未说明方差齐性就用方差分析;对偏态分布的数据用方差分析或t检验;在判断统计学意义时未给出检验水准;对于例数太少(<20)的资料用率(百分比)表示。甚至有些作者不给出统计方法描述,直接给出P值,让编辑去判断所用的统计学方法。

在选择统计学方法时,常见的是把t检验作为定量资料的万能工具,把χ2检验作为定性资料的万能工具。在研究相关分析时,把两个毫无关系的变量放在一起研究,降低了研究结论的可信度[6]

1.2.2 t检验和方差分析误用

编辑在审稿时发现,作者最喜欢用的便是t检验,对呈偏态分布的数据用t检验;需要用方差分析的用t检验(单因素多水平的比较,重复测量的资料,析因分析资料等)。其实t检验的应用条件极其有限,在资料满足独立性、正态分布和方差齐性时,只适合单组设计和单因素两水平设计(配对设计和成组设计),且配对设计和成组设计的t检验也不同[7]。对单因素k水平设计(k≥3)和多因素设计的定量资料应用方差分析。对单因素多水平设计,应先做单因素方差分析,当拒绝假设检验后,说明多个样本总体均数不相等或不全相等,再根据研究目的选用LSD或SNK进行两两比较,如果不进行方差分析就比较两样本均数,不仅破坏了资料的整体性,降低了资料的利用率,更增加了假阳性错误的概率。对多因素设计根据资料类型选择相应的方差分析,以《中华临床感染病杂志》稿件为例,最常见的错误是对重复测量资料和析因设计资料滥用统计学方法。例如,对慢性乙型肝炎患者给予一种或几种抗病毒药物后,在不同时间点对每个受试对象重复观察和记录反映肝功能的指标(ALT和AST),这是一类重复测量的资料,应该用重复测量方差分析,但很多作者把这类资料当单因素多水平处理,用t检验对不同组别、不同时间点的两组数据进行比较,或者用多因素方差分析处理,增加了犯Ⅰ类错误的概率。研究两种药物(A和B)对宫颈HPV持续性感染的治疗效果,常见作者把研究对象分为对照组、药物A组和药物A+药物B组,用t检验或单因素方差处理。仔细分析可知,该资料涉及两个因素:A药(用与不用),B药(用与不用)。除了研究各自的疗效外,还要研究它们的交互作用,因此属于多因素的交叉分组设计,可以用两因素析因设计的方差分析。

1.2.3 χ2检验误用

从χ2检验的定义可知,χ2检验分析的是各行上频数分布是否相同,即说明各总体或构成比之间是否有差别,不适合等级资料,配对设计、相关性分析及生存率分析,并且χ2检验对样本量(n)也有要求,当n≥40且T≥5时,可用一般χ2检验,当n≥40但1≤T≤5时,用连续性校正公式,当n<40或T<1时,用Fisher确切概率[8]。对于四格表资料,χ2检验一般用来分析横断面研究,如果资料为病例—对照和队列研究,除计算χ2值外,若P值<0.05时,还须计算优势比(OR)值或相对危险度(RR)值,运用Mante1-Haensze1卡方检验,比较总体OR或RR值与1之间的差别是否有统计学意义。临床上,评价不同检测技术对疾病的诊断价值,例如比较结核分枝杆菌感染T细胞斑点试验(T-SPOT)和痰培养(金标准)对结核分枝杆菌的检出率,如果是比较两种方法(配对设计)不一致部分频数之间的差别是否有统计学意义,选择McNemar卡方检验,若是比较两种检测方法的一致性,用Kappa一致性检验。对于多行×多列表资料,误用χ2检验的情况更加严重,例如比较多个样本率是否有差异时,常见的错误有:只给出总的χ2值,直接进行两两比较给出多个χ2值,未对检验水准α进行校正。总χ2值有意义,只能说明多组间频数分布存在差异,至于是哪两组存在差异还需进一步作两两比较,并根据比较的次数对检验水准α进行校正。如果研究的目的是分析两个分类变量间有无关联及其程度,除计算χ2值外,还要计算Pearson列联系数。当研究多种药物对疾病的治疗效果(单项有序),按照治愈、显效、好转、无效进行观察,可选用秩和检验,Ridit分析以及有序变量的Logistic回归分析;如观察药物治疗疾病过程中病程与疗效的关系(双向有序属性不同),可选用Spearman秩相关、Kenda11秩相关等研究二者的相关性,若是评价两种指标的一致性(双向有序属性相同),用Kappa一致检验。所以,对研究资料,要清楚资料的性质和研究目的,而不是对所有的列联表一律用χ2检验。

1.2.4 对统计结果的解释

讨论中常要对统计学值进行解释,最常见的是对P值的解释,例如当P<0.05时,认为差异有统计学意义,当P值>0.05时,则无统计学意义。但是,大多数作者在对P值做解释时,常用“有差异”、“有显著差异”等表述,认为P值越小,差异越显著。其实,P值反映的是统计学上的意义,并不能说明生物学上的重要性,按所取的检验水准,P<0.01与P<0.05相比,只能说明前者由处理因素导致差异的可能性比后者大,但不能说明前者差异性大于后者[9]。现在很多统计软件能给出确切的P值,例如P=0.049和P=0.051,同样是小概率事件,前者拒绝H0,后者不拒绝H0。而实际应用中,对这两种情况的解释要谨慎,例如样本量的大小、是否存在偏倚因素等,切不可以0.05为临界值,轻率作出有或无统计学意义的结论。另外,即便结论有统计学意义,临床上未必有意义。例如研究两种抗病毒药物A和B对降低ALT水平的影响,如果A治疗后ALT水平比B多下降5U/L(P<0.05),是否说明A药比B药更有效?P<0.05,只能说明两种药物降低ALT水平的差别<5U/L的概率<0.05。但由于样本量、抽样误差、测量方法等都可能导致这种差别,因此临床上很难认为这种差异有实际意义。另外常见的错误是混淆相关(关联)性和因果关系,作者在讨论数据时,往往希望得到事物之间的因果联系,所以一旦得出数据之间有相关性,就认为是因果联系。例如,转氨酶升高与病毒性肝炎有关,但二者之间并无因果关系,药物性肝炎和酒精肝均能引起转氨酶升高;有些作者常由P<0.05,得出两变量密切相关的结论,P<0.05只能说明二者有相关性,至于相关程度需要根据相关系数r判断。

2 编辑应重视统计学审查

医学论文中科研设计和统计学方法使用正确与否直接影响着论文学术价值的可信度,编辑作为期刊质量的把关人,应重视对稿件中统计学的审核[10]。编辑可从以下方面减少稿件中统计学出错率:(1)来稿先进行初审,除了对文章的学术价值、先进性和医学伦理进行评估外,还要审查统计学是否存在问题,如果科研设计存在明显错误导致文章无法修改,编辑部就可退稿,如果只是些细枝末节的问题,应让作者完善后再送审,切不可直接把稿件外审,否则,不仅浪费专家的时间,更影响期刊的声誉;(2)注重知识的积累,要想对统计学运用自如,并非一朝一夕,应在日常审稿中对稿件中常见的统计学错误进行归纳、整理,收集成册,定期翻阅,当再次遇到同样的问题,解决起来就得心应手了。另外,编辑在工作之余应自学统计学知识,条件允许的话参加相关的培训班能取到事半功倍的效果;(3)选择统计学专家担任杂志编委,有些文章实验设计和统计方法较复杂,因此审稿时务必请统计学专家把关,仔细研读专家的审稿意见,看看哪些问题是自己在审稿时没有发现的,并多向专家请教、学习。

总之,医学编辑对统计学方面审查工作与稿件质量息息相关,编辑要不断提高统计学审查能力,要能独当一面,从科研设计、数据收集、统计描述、方法选择、统计图表、结果解释等方面进行全面审核,尽量将统计学错误降到最低,使刊出的文章具有科学性、可靠性和实用性,从而不断提升期刊的学术质量。

参考文献

[1]鲁立,傅万明,李风华,等.医学论文统计学问题的编辑审查[J].编辑学报,2006,18(5):337-338.

[2]中华医学会杂志社总编室.中华医学会系列杂志2012年质量评估报告[J].杂志工作通讯,2013:9.

[3]李霞,张印朋,闫苏平,等.科研设计与统计学在医学论文中的问题与对策[J].中国综合临床,2008,24:399-400.

[4]肖丽娟.从编辑角度谈医学论文写作中的统计学应用问题[J].苏州大学学报:工科版,2006,26(5):90-92.

[5]邱芬,曾令霞,国荣.统计学审查在医学论文审稿中的必要性[J].中国科技期刊研究,2011,22:574-576.

[6]章新生,姚仁斌,刘璐,等.医学稿件中常见统计学方法误用辨析[J].蚌埠医学院学报,2011,36(6):653-656.

[7]胡良平,刘惠刚.医学论文中定量资料统计分析方面的错误辨析与释疑[J].中西医结合学报,2007,5(4):481-484.

[8]郑巧玲,何以平.医学论文中常见误用χ2检验的案例分析[J].编辑学报,2004,16(3).

[9]李光伟.统计学意义与临床意义距离有多远?——医学文献中统计分析结果解读需仔细[J].中华内分泌代谢杂志,2006,22(1):1-3.

[10]杨湘华,尚磊,徐勇勇.重视统计学在科技论文中的正确应用[J].中华医学写作杂志,2004,13:1081-1083.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈