首页 >资讯
“315” 专题报道:医学领域的学术造假
发布时间:2026/03/15

相较于社会科学、数学等领域,医学领域的学术不端对人类健康福祉构成更严重、更直接的威胁。有研究显示,被撤稿研究纳入受试者超 28,000 人,九千多名患者接受相关治疗;而引用撤稿论文的研究纳入受试者超 40 万人,七万多名患者接受相关治疗。

 

也有部分研究者与医药行业形成利益共同体,刻意伪造数据、虚假宣传药物疗效以欺诈消费者。

 

撤稿观察数据库研究结果显示,2012~2021 年中国医学论文撤稿占比最高,达 38.15%;基于一款新的机器学习筛查工具显示,对于癌症研究论文,来自中国机构的作者占疑似“工厂论文”(批量生产的低质量研究论文)总量的绝大多数(36%)。

 

对于罕见病科研,由于患者数量少,研究样本有限,部分研究者可能通过伪造/篡改数据或夸大结果来迎合结论,以获取研究经费或学术声誉。而且罕见病的发病机制多样,实验重复性差,造假行为较难被及时发现,为学术不端提供了空间。

 

尽管我国政府已认识到生理学与医学领域学术不端的严重性,出台多项政策明确学术诚信规范,但科研机构在学术不端治理中存在明显短板。

 

中国医学领域的学术打假之路,依然任重道远......

 

文献1. 中国生理与医学领域学术不端:趋势与挑战

 

作者:Bo Yin, 等

 

摘要

 

尽管我国已建立学术不端治理政策体系,但在全球范围内,中国仍是生理与医学领域论文撤稿率最高的国家之一。

 

为阐明该领域学术不端的演变特征与类型,并为完善制度规范、强化科研机构治理责任提供理论依据,本研究整理了 2000—2023 年中国内地8823 篇撤稿论文,并按照科研机构类型、所属地区、期刊影响因子、JCR 学科分区及学术不端界定标准进行分类统计。

 

2016 年以来,相关撤稿率持续处于高位,达 0.3%。结果显示,高等院校在科研活动中占据主体地位,其撤稿论文占全国总量的 83%(n = 7293)。重点高校的撤稿率显著低于普通高校,其中位撤稿率分别为  0.12% 与 0.39%(P = 0.0003);但重点高校从发表到撤稿的间隔时间更长,中位时长分别为 1.95 年与 1.84 年(P < 0.0001)。

 

因学术不端导致的论文撤稿率存在显著地区差异,且撤稿论文的合作模式具有鲜明地域特征。中国学术不端中的科研扭曲行为(scientific distortion)占比呈显著上升趋势,从 2005 年的 20% 升至 2017 年以来的 70%。

 

上述结果表明,政策规制与制度完善可成为学术不端治理的重要抓手。

 

鉴于省份与科研机构间存在显著差距,且撤稿论文合作模式存在地域差异,建议由省级主管部门牵头,进一步压实机构治理责任。与科研扭曲相关的学术不端高发,可能严重损害国际社会对中国科研的信任。

 

引言

 

学术不端是阻碍科学信任与发展的关键障碍,是违背科研诚信、学术规范与科研伦理的严重行为。撤稿论文的数量及其背后原因,是衡量学术不端的客观指标。

 

2010 年数据显示,生理学与医学领域论文发表量最多,撤稿数量与撤稿比例也位居首位(Grieneisen & Zhang, 2012)。2000—2023 年,临床与生命科学成为学术不端撤稿的高发领域,在 SCI、SSCI、ESCI 数据库中撤稿总量达 12,565 篇,撤稿率为 8.9%(Li & Shen, 2024)。

 

相较于社会科学、数学、物理学等领域,生理学与医学领域的学术不端对人类健康福祉构成更严重、更直接的威胁。有研究显示,被撤稿研究纳入受试者超 28,000 人,9,189 名患者接受相关治疗;而引用撤稿论文的研究纳入受试者超 40 万人,70,501 名患者接受相关治疗(Steen, 2011)。

 

基础医学领域的学术不端,如心脏干细胞研究(He et al., 2020)、阿尔茨海默病 β淀粉样蛋白研究(Piller, 2022),已引发严重学术问题,甚至可能将科研引向错误方向。

 

此外,根据美国 NIH 发布的总统财政年度预算概况,2023 年其年度经费达 486 亿美元,占联邦基础研究经费的 50% 以上。1992—2012 年,由 NIH 资助的撤稿论文平均耗费资金近 40 万美元(Stern et al., 2014)。

 

更有甚者,部分研究者与医药行业形成利益共同体,刻意伪造数据、虚假宣传药物疗效以欺诈消费者(Henry et al., 2005; Ichikawa & Clayton, 2016)。

 

生理学与医学领域的学术不端危害极大:可能引发不良健康后果,阻碍疾病防治技术进步,造成政府与个人巨额财产损失,误导科研方向,并滋生数据造假、消费欺诈等失德行为。

 

撤稿观察数据库(Retraction Watch database)研究结果显示,2012—2021 年中国医学论文撤稿占比最高,达 38.15%(Shi, 2020)。2004—2022 年,共识别出 1,182 篇来自论文工厂的撤稿,且论文工厂撤稿作者几乎均来自中国科研机构(CandalPedreira et al., 2022; Else & Van Noorden, 2021)。

 

尽管外界对学术不端泛滥存在普遍印象,但中国政府始终致力于维护科研诚信(Tang et al., 2023)。2007—2016 年,我国出台多项政策明确学术诚信规范(Yu et al., 2022),并逐步构建学术不端治理政策体系(He et al., 2023)。

 

但有研究指出,此类学术不端治理政策未能有效落地(Gow & Sun, 2020),科研诚信信息公开(Wang & Zhu, 2023)、科研数据管理(Wu & Sun, 2023)等多项法定举措未能及时推行。此外,知情同意意识不足、同意流程不统一、科研伦理教育欠缺等问题突出(Qin et al., 2024),表明机构治理责任落实不到位,是我国学术不端问题的重要成因。

 

我国学术不端治理政策可分为政府层面与科研机构层面(Tang, 2019)。政府层面的学术不端治理机制,主要包括界定不端行为、提出原则性指导意见、明确研究者法律责任与不端行为调查流程,具体执行则交由科研机构落实(Wu & Sun, 2023; Yin, 2020)。

 

该框架下,政府政策侧重惩戒实施学术不端的个人。2018 年,国家发改委等 41 个部门联合印发《关于对科研领域相关失信责任主体实施联合惩戒的合作备忘录》,将惩戒范围延伸至学术领域之外:存在学术不端的研究者,可能被限制银行贷款、开办企业及报考公职等,但该政策未追究科研机构在学术不端治理中的失职责任(Zeng & Resnik, 2010)。

 

同时,科研机构面临的学术成果压力,使其更倾向于向研究者施压、优先保障论文产出以满足评价标准,而非关注研究过程、履行学术不端治理责任(Zhang & Wang, 2024)。

 

2017 年,国际肿瘤与生物标志物学会旗下期刊 Tumor Biology 一次性撤稿近百篇中国作者医学论文,引发我国政府对学术不端的高度关注(Normile, 2017)。次年,中共中央办公厅、国务院办公厅印发《关于进一步加强科研诚信建设的若干意见》这一关键文件。2021 年,国家卫健会、科技部、国家中医药管理局联合发布《医学科研诚信和相关行为规范》。

 

尽管我国政府已认识到生理学与医学领域学术不端的严重性,但相关规范仍沿用传统两级治理模式,缺少针对科研机构层面的专项政策。而现有研究显示,科研机构在学术不端治理中存在明显短板:重点治理的机构类型、机构干预路径、治理强化紧迫性等关键问题尚未得到系统研究。

 

本研究通过梳理我国大陆地区生理学与医学领域撤稿行为的性质与分类,总结该领域学术不端的特征,以期为制定强化科研机构治理责任的相关标准提供理论依据,为未来学术不端治理提供有力支撑。

 

 

https://link.springer.com/article/10.1007/s10805-025-09694-0

 

 

 

文献2. 近一成癌症研究论文被标记为疑似造假

 

作者:Mariella Bodemeier Loayza Careaga

 

一款新的机器学习工具揭示了癌症研究领域虚假论文的泛滥程度,也显示该领域对论文工厂具有极高的 “吸引力”。

 

在过去二十年里,学术文献中充斥着由营利性机构 —— 也就是论文工厂—— 批量生产的低质量研究论文。据估算,疑似论文工厂产出的稿件占学术期刊投稿量的 2% 到 46%;2023 年,生物医学研究中问题论文的比例已接近 6%。

 

为了快速批量生产论文,论文工厂通常使用固定模板,这使得这些文章呈现出共同特征:文本与排版高度相似、对假说和实验设计的描述流于表面、图片篡改或重复使用、试剂信息描述错误等。这些 “生产套路” 虽然提高了论文工厂的产出效率,却也留下了独特 “指纹”,科研诚信研究者可以借此识别并标记疑似工厂论文。

 

在今年早些时候发表于《英格兰医学杂志》(The BMJ)的一项研究中,由澳大利亚昆士兰科技大学统计学家阿德里安・巴尼特(Adrian Barnett)带领的科研团队开发了一款新的机器学习工具,用于筛查癌症研究文献并识别疑似论文工厂产物。

 

研究团队发现,经该工具检测,近 10% 的癌症研究文献可能来自论文工厂。这一比例高于生物医学领域的整体估算水平,表明癌症研究是这类造假机构的主要目标。

 

并未参与该研究的巴西坎皮纳斯大学博士后、数字取证科学家若昂・菲利佩・卡德内图(João Phillipe Cardenuto)评价道:“我们针对这一问题的解决方案本就很少,致力于设计解决方案的研究者更是寥寥无几,因此这项工作意义重大。”

 

 

图:在接受筛查的 260 万篇癌症相关论文中,近 10%(261,245 篇)的摘要和标题存在文本特征,显示其可能出自论文工厂。

 

为了识别出疑似工厂论文,巴尼特及其团队开发了一款基于机器学习的工具,通过提取文本特征,并与已撤稿的论文工厂文章进行比对。此前研究已表明,文本模板可用于训练机器学习模型以识别工厂论文,但该方法从未在癌症研究领域得到验证。

 

“遗憾的是,癌症领域确实成了这类论文的重灾区。” 巴尼特解释道,“一方面,癌症研究自带学术光环,相关期刊数量庞大;另一方面,基础研究更容易成为论文工厂的目标,因为编造数据相对更容易。”

 

研究团队将分析重点放在论文摘要和标题上,因为这些内容最易获取。他们利用撤稿观察数据库中标记为论文工厂来源的文章训练模型,并通过学术诚信调查人员整理的公开问题论文清单验证工具效果。在性能测试中,该机器学习工具识别问题论文的准确率约为 90%。

 

随后,研究者用该工具筛查了 1999 至 2024 年间发表的 260 万篇癌症研究论文。结果显示,有261,245 篇(约占总量的 10%)与已撤稿的论文工厂文章存在文本特征相似性。

 

尽管被标记的比例已相当高,但巴尼特表示,这一数字仍可能被低估。因为论文工厂这些年不断升级技术,而模型只能识别特定模板。“真实比例是否真的是 10%,我们无法确定。实际数量可能更高,因为我们只检测了一类模板。如果工厂使用更复杂的其他模板,就会被漏掉。”

 

这些疑似造假论文在部分癌种中尤为集中:胃癌(22%)、骨癌(21%)、肝癌(20%)。研究团队还发现,顶刊中被标记论文的比例持续上升,说明论文工厂并不只瞄准低影响因子期刊,也提示影响因子或许不能作为研究质量的可靠指标。

 

该机器学习筛查工具同时显示,来自中国机构的作者占疑似工厂论文总量的绝大多数(36%),这与此前关于造假论文来源的研究结论一致。不过卡德内图也指出,尽管研究者已尝试通过语言平衡训练数据集,但中国研究者占比过高仍可能给模型带来偏差:工具可能学到的是中国学者常用的写作范式,而非与造假论文相关的特征。

 

巴尼特表示,这款新筛查工具主要面向学术出版商设计,但他也希望它能让论文工厂问题受到更多关注,提升研究者的警惕意识。“很遗憾,如今大家在阅读或审稿时,都必须把这一点纳入考量。”

 

 

 

https://www.the-scientist.com/nearly-ten-percent-of-cancer-papers-flagged-as-potentially-fake-74185

 

罕见之路,你我同行。欢迎大家加入罕研社读者交流群: