综述揭示已发表生物医学论文中虚假参考文献比例持续上升

图丨Pexels
据CIDRAP网站5月9日消息,近日发表于《柳叶刀》的一项系统综述显示,在已发表生物医学论文的9710万条经核查参考文献中,有4046条很可能为虚假文献;2023年至2025年期间,造假比例飙升12倍。评论人士称这一发现令人不安,凸显出提升科研诚信的迫切性。
哥伦比亚大学研究人员利用人工智能(AI)搭建了一套参考文献自动化核查系统,对2023年1月至2026年2月PubMed Central开放获取子集的250万篇学术论文、1.26亿条结构化参考文献开展审计。
针对每条待核查参考文献,研究团队从PubMed与Crossref获取其标注标识对应的书目记录,与被引论文标注的元数据进行比对,并采用文本相似度评分。被标记的参考文献会经过多轮筛选,以减少误报结果。
筛选完成后,再通过PubMed、Crossref、OpenAlex与Google Scholar进行最终核验。在任一数据库均检索不到的参考文献被认定为伪造;能检索到但标识不匹配的则归为引用错误。该自动化参考文献核查系统的精准度达91%。
研究作者写道:“伪造参考文献(标注标题对应无真实出版物的引用)可能源于论文工厂、学术不端行为,或是不加甄别地使用AI写作工具。”
他们补充道:“大语言模型(LLM)会生成看似合理实则虚构的参考文献,这是其公认缺陷;已有研究估算,生物医学领域由大语言模型生成的参考文献中,30%—69%为伪造。”
在9710万条经核查参考文献中,共发现4046条伪造引用,分布于2810篇论文。2023年,约每2828篇论文中就有1篇含至少1条虚假参考文献;2025年升至每458篇中有1篇;2026年前7周更是达到每277篇中有1篇。造假率从2023年每万篇约4例,飙升至2025年末每万篇51.3例,2026年初达每万篇56.9例,整体增幅超12倍。
例如,某开源肿瘤学期刊2025年发表的一篇关于输尿管回肠吻合(尿流改道)技术的论文中,30条经核查参考文献中60%为编造。作者写道:“每条伪造参考文献都精准贴合论文狭窄的外科主题,署名均为真实泌尿科医生,标注出版年份为2023或2024年。”
研究团队还发现了与论文工厂(售卖虚假或低质量稿件的商业机构)相符的特征。例如,2025年某外科期刊中,有11篇论文均以同两位作者为核心合著者,涉及CRISPR(基因编辑)诊断、AI引导纳米疫苗、肠道微生物组生物标志物等领域,共出现15条伪造参考文献。
受影响的2564篇论文中,91%仅含1至2条伪造引用,246篇含至少3条。综述类论文的造假率比其他类型高57%(每万篇16.7例 vs 10.6例)。
研究人员表示,2024年伪造引用激增,与大语言模型广泛应用后的出版滞后期相吻合;论文工厂活跃度上升、期刊索引规则变化等也可能是助推因素。
“大语言模型于2022年末至2023年普及,投稿至发表周期通常为100—200天,”他们写道,“因此大语言模型辅助撰写的论文从2024年中期开始集中出现在PubMed Central。”
作者指出,本次识别出的虚假引用并无明显错误,主题针对性强、格式规范、署名为真实研究者、出版年份合理。
“系统综述显示,医学期刊论文中约四分之一的参考文献存在错误,这证实参考文献核查尚未成为同行评审的常规环节。”他们写道。
研究团队建议:出版商应在同行评审前的投稿流程中嵌入自动化参考文献核查;索引机构为论文记录添加诚信元数据,方便下游使用者评估引用可靠性。
出版商还应回溯筛查已发表论文,若虚假引用影响论文结论,需发布更正或撤稿声明。最后,应在主流科研诚信数据库中将伪造参考文献设为独立类别,以便系统追踪与问责。
“当参考文献指向不存在的研究时,其声称支撑的证据也纯属虚构,”他们总结道,“常态化自动化核查可在伪造引用进入发表记录前堵住这一漏洞。”
第一作者马克西姆·托帕兹(Maxim Topaz)表示,临床医生与临床指南制定者无法判断其所依赖的证据是否真实存在。“医疗专业人员依据临床指南制定治疗决策,这一发现直接关系到患者安全。”
波士顿大学霍华德·鲍赫纳(Howard Bauchner)与华盛顿大学弗雷德里克·里瓦拉(Frederick Rivara)在同期评论中称,这一趋势令人不安,呼吁作者对整篇稿件(包括参考文献)承担责任。“当前全球各国公众对科学的信任度似乎持续下滑,亟须加大力度提升科研诚信。”他们写道。
资料来源丨CIDRAP
本文由生物安全情报网编译,仅用于学术分享,转载请注明出处
阅读原文献请点击“阅读原文”
