医学期刊送审论文统计学问题分析
本文为论文分享,仁创编译致力为大家分享更多更好的高质量论文资讯,方便大家学些参考。同时大家也欢迎大家通过转载的方式进行分享,让更多的人能够观看学习,从中获得经验和灵感,小编将为大家提供最新论文资讯。
医学科研论文大多涉及数据收集和统计分析,正确合适的数据统计分析方法,才可能保证科研结果的正确性。虽然论文撰写的国际规范对数据统计学分析有明确的要求,科研人员也学习过医学统计学,但如何正确选择统计分析方法,准确描述统计分析结果,仍然是很多科研人员比较困惑的问题。有些作者在论文中误用、错用统计学方法,直接影响研究结果的可信度,导致论文质量不高或者结论错误[1-3]。本文对某杂志2014年至2015年度送审论文中的统计学问题进行分析,旨在帮助作者避免类似的错误,提升科研论文质量。
资料与方法
一、数据来源数据来源于2014年至2015年某杂志送审的论文及审稿记录。207篇论文被纳入分析,其中2014年度112篇,2015年度95篇。二、分析方法采用EXCEl文档,记录每篇论文的如下信息。(1)文章的稿件编号、第一作者姓名、论文题目。(2)数据的一致性方面:摘要与正文之间、描述与统计图表之间、统计表之间、分组与合计之间的样本量一致性;亚组分析与整体之间、前后描述之间、描述与统计图表之间、统计表之间、统计表图之间、摘要与统计图表之间、摘要与正文之间、结果与讨论之间的结果一致性。(3)数据资料统计描述方面:是否涉及相对数计算,选择的相对数指标是否正确,计算相对数分母选择是否正确,相对数是否正确;是否涉及平均指标与变异指标,平均数是否正确,标准差是否正确,是否只有均数无标准差,是否明显偏态分布使用均数等。(4)组间比较差异性分析方面:是否涉及χ2检验,分析方法是否正确,统计量是否正确,P值是否正确;是否涉及两组计量资料差异性分析,分析方法是否正确,统计量是否正确,P值是否正确;是否涉及多组计量资料差异性分析,分析方法是否正确,统计量是否正确,P值是否正确;是否涉及秩和检验,统计量是否正确,P值是否正确。(5)线性相关回归分析方面:是否涉及线性相关回归分析,相关分析方法是否正确,有无将不同组别数据混在一起做相关、非正态分布使用线性相关系数r值、线性相关与等级相关混淆、散点图呈曲线关系使用直线回归分析、文献报道曲线关系采用直线回归分析;相关系数r值与P值的关系是否正确,线性回归模型拟合结果是否正确。(6)多因素模型拟合方面:是否涉及多因素Logistic回归模型,OR与回归系数β的关系是否正确,OR95%CI与P值的关系是否正确,OR与95%CI的关系是否正确,回归系数β检验统计量是否正确,检验统计量与P值的关系是否正确,是否将多分类因素说明为分类因素,是否使用逐步回归筛选自变量。三、统计学方法数据采用SPSS18.0统计学软件进行统计分析,结果采用[n(%)]形式表示。
结果
一、数据的一致性问题207篇送审论文中,样本量前后不一致论文31篇(14.98%),其中摘要与正文例数不一致2篇(0.97%)、描述与统计图表间例数不一致16篇(7.73%)、统计表间例数不一致2篇(0.97%)、分组与合计的例数不一致13篇(6.28%)。1篇文章摘要与正文例数不一致、描述与统计图表间例数不一致;1篇文章摘要与正文例数不一致、分组与合计的例数不一致。207篇送审论文中,结果前后不一致论文17篇(8.21%),其中亚组分析与合计间结果不一致5篇(2.42%)、前后描述结果不一致2篇(0.97%)、描述与图表间结果不一致4篇(1.93%)、统计表间结果不一致2篇(0.97%)、统计表图间结果不一致1篇(0.48%)、摘要与图表间结果不一致1篇(0.48%)、摘要与正文间结果不一致3篇(1.45%)、结果与讨论间结果不一致1篇(0.48%)。1篇文章描述与图表间结果不一致、摘要与图表结果不一致;1篇文章描述与图表间结果不一致、摘要与正文结果不一致。二、数据资料统计描述问题涉及相对数计算的论文157篇(75.85%)。相对数指标选择不正确5篇(3.18%),计算相对数分母选择不正确2篇(1.27%),相对数计算结果不正确18篇(11.46%)。涉及平均指标与变异指标的论文153篇(73.91%)。平均数计算错误3篇(1.96%),标准差计算错误3篇(1.96%),只有均数无标准差4篇(2.61%),明显偏态分布使用均数10篇(6.53%),没有描述资料是否服从正态分布直接使用均数与标准差140篇(91.50%)。三、组间比较差异性分析问题涉及χ2检验的论文149篇(71.98%)。χ2检验分析方法不正确3篇(2.01%),χ2检验统计量不正确25篇(16.78%),χ2检验P值不正确28篇(18.79%)。涉及两组计量资料差异性分析的论文121篇(58.45%)。两组比较分析方法不正确20篇(16.53%),两组比较统计量计算不正确19篇(15.70%),两组比较P值不正确20篇(16.53%)。涉及多组计量资料差异性分析的论文34篇(16.43%)。使用方差分析21篇(61.76%),使用秩和检验16篇(47.06%),多组比较使用t检验10篇(29.41%),方差不齐使用方差分析4篇(11.76%),多组比较统计量计算不正确3篇(8.82%),多组比较P值不正确3篇(8.82%)。四、线性相关回归分析问题涉及线性相关回归分析51篇(24.64%)。简单相关回归分析方法不正确15篇(29.41%),其中将不同组别数据混在一起做相关分析4篇(7.84%),直线相关分析与等级相关分析混淆4篇(7.84%),线性回归模型错误3篇(5.88%),非正态分布使用直线相关分析1篇(1.96%),散点图呈曲线使用直线分析1篇(1.96%),文献报道曲线关系采用直线分析1篇(1.96%),自变量赋值有问题1篇(1.96%);线性相关系数r值与P值矛盾1篇(1.96%)。五、多因素模型拟合问题涉及多因素Logistic回归模型的论文46篇(22.22%)。OR与回归系数β的数据关系矛盾11篇(23.91%),OR与95%CI的数据关系矛盾9篇(19.57%),OR95%CI与P值的数据关系矛盾7篇(15.22%),OR95%CI错误6篇(13.04%),未使用逐步回归筛选自变量5篇(10.87%),回归系数β检验统计量计算错误4篇(8.70%),检验统计量与P值的数据关系矛盾4篇(8.70%),多分类因素未说明为分类因素的1篇(2.17%)。
讨论
论文数据正确是科研论文撰写的基本要求。207篇送审论文中,发现14.98%的论文样本量前后不一致,8.21%的论文结果前后不一致。如某作者在“HPV感染与早期宫颈鳞癌”临床研究中报告共纳入因宫颈鳞癌行广泛子宫全切及盆腔淋巴结清扫患者186例。表1显示低分化18例、中分化146例、高分化22例,而表2低分化13例、中分化117例、高分化54例,两个统计表的例数不一致。再如某作者在“口服水化方案预防门诊高危人群对比剂肾病”临床研究,文章描述74例患者年龄(63.79±8.81)岁,又描述常规水化组年龄(56.88±12.82)岁,强化水化组(62.87±5.38)岁,简易水化组年龄(58.12±10.97)岁。总均数应为三组均数的加权平均数。显然三个组年龄的均数都低于总均数63.79,数据前后不一致,年龄均数肯定有错误。如果一篇论文前后例数都不一致,或者前后结果都不一致,说明作者没有认真核对科研数据,论文撰写后没有认真检查,科研作风不够严谨。因此,作者要对文章中涉及的同一组数据,看其前后是否一致,结果分析是否与图表中的数据一致,摘要中的数据是否与正文一致[4-5]。正确规范地表达研究结果是对科研论文的基本要求。数据资料统计描述,应根据研究的意义与数据的特征,计算合适的统计指标,并且确保计算结果的正确性。对于计数资料,要反映某事件或现象发生的程度应计算强度相对数(率),反映各部分在全体中所占的比重应计算结构相对数(构成比、百分比)。对于计量资料,左右对称、高峰在中间的正态分布或者均匀分布的数据,通常计算算术均数与标准差,采用均数与标准差(x±s)的形式表达;而左右不对称、高峰在一侧的偏态分布数据,通常计算中位数和四分位数,采用“中位数(第一四分位数,第三四分位数)”的形式表示[6-7]。分析发现,涉及相对数计算的157篇论文中,11.46%的论文相对数计算错误。涉及平均指标与变异指标的153篇论文中,91.50%的论文没有描述资料是否服从正态分布直接使用均数与标准差,6.53%的论文明显偏态分布仍使用均数与标准差。如数据的标准差s超过均数了,仍使用“均数与标准差”形式表达是错误的[7]。如果计算的统计指标不正确或者统计指标计算错误,得到的统计分析结果就可能是错误的。作者应注意统计描述是否符合统计学要求。数据资料差异性分析,应根据研究设计及数据分布确定统计分析方法。如两组设计计量资料差异性分析,数据服从正态分布、方差齐性使用两组独立样本t检验,不服从正态分布或者方差不齐采用两组秩和检验;配对设计差异性分析,数据服从正态分布使用配对样本t检验,不服从正态分布使用符号秩检验。多组计量资料差异性分析,数据服从正态分布、方差齐性使用方差分析,不服从正态分布或者方差不齐使用秩和检验[8]。分析发现,涉及两组计量资料差异性分析的121篇论文中,16.53%的论文非正态分布或者方差不齐使用t检验。涉及多组计量资料差异性分析的34篇论文中,29.41%的论文多组均数比较使用t检验,11.76%的论文方差不齐使用方差分析。尼玛欧珠等[9]的表1、表2、表3的统计量有问题。表1研究组45例,治疗8d后的创伤面积为(27.12±11.08)cm2,对照组45例,治疗8d后的创伤面积为(44.17±13.62)cm2,经检验t=6.514,而表中的统计量t=14.297;表2研究组治疗8d后总有效率为97.78%,对照组为64.44%,经检验χ2=16.317,而表中的统计量χ2=5.187;表3研究组植皮术后感染率为0例,对照组3例,经检验χ2=3.103,P=0.078,而表中的统计量χ2=4.156,P<0.05。周亮等[10]的表1显示,s-rTMS组12例,m-rTMS组10例,治疗后HAMD评分差异显著(25.76±1.48vs.25.20±2.04,P<0.05),SDS评分差异显著(65.08±2.15vs.63.30±1.95,P<0.05)。经检验HAMD评分、SDS评分均无显著差异(t=0.746,P=0.465;t=2.016,P=0.057)。郭金强等[11]表1的14个P值中13个是错误的,7个指标的结论相反。如果统计分析方法不正确,得到的统计分析结论就可能是错误的。作者应注意统计分析方法是否正确。多因素回归分析要求作者正确选择统计分析模型,准确描述统计分析结果。分析发现涉及多因素Logistic回归模型的46篇论文中,23.91%的论文OR与β数据关系矛盾,19.57%的论文OR与95%CI数据关系矛盾,15.22%的论文OR95%CI与P值数据关系矛盾。如某作者在“重度烧伤患者合并念珠菌血症的相关因素分析”中描述“性别、年龄、手术后胃肠道并发症是重度烧伤患者合并念珠菌血症的独立危险因素(P<0.05)”,性别OR=5.02,95%CI=1.22~23.70;年龄的OR=0.88,95%CI=0.91~1.00。原文中败血症组女性占40.0%,非败血症组女性占39.5%,两组女性占比基本一致,性别不应该是危险因素,性别OR=5.02让人怀疑;年龄的OR=0.88,小于OR95%CI的下限,OR与95%CI数据关系矛盾。胡颖等[12]的表3多因素分析的Waldχ2、P与回归系数、标准误的数据矛盾。何佳虹等[13]表7的OR与95%CI数据有错误。因此,多因素回归分析时,作者应注意统计分析模型是否正确,最好使用统计分析软件的结果。论文统计分析方法不正确,数据表达不规范,将直接影响研究结果的可信度。建议:(1)强化作者的统计学意识,重视论文撰写中的统计学问题,确保论文数据的一致性、统计描述指标的正确性、统计推断方法的正确性和统计分析模型的正确性,增加优质稿源;(2)医学期刊编辑应加强统计学知识学习,提升论文统计学错误的识别能力,把好论文初审关;(3)邀请统计学专家参与医学论文的审稿工作,把好统计审查关,以确保论文的科学性和真实性。
如果论文成为了您职业学业晋升道路上的拦路虎,请您联系仁创编译,我们会为您提供一站式学术服务解决方案。不管您是有SCI论文翻译、润色,还是其他学术编译需求您都可以放心交给我们。致力于科研一站式服务,包含国内普刊中心发表服务,SCI论文润色、翻译,专利申请,专著出版挂名等等。