屡禁不止的“论文工厂”继续出口造假论文。
近日,发表在FEBS Letters上的一篇文章揭露了这家论文工厂最初的真相。2018年以来,经过笔者对多篇论文的调查发现,可能有上千篇论文来自论文工厂。
作者指出了论文工厂造假论文的八个特点:具有相似的文本和结构;可能存在假冒模板,图像资料会在不同文章中重复使用;原始数据图像来源于不同模块的排列组合;引用文献与内容无关;不同作者从同一台电脑投稿……
“论文工厂”中的假论文:八大典型特征
2018年初,《欧洲生化学会联合会学报》(FEBS)出版社、德国海德堡大学生物化学中心编辑贾娜·克里斯托弗发现了一种令人不安的潜在欺诈类型。一些论文稿件可能会按照一个模板显示造假数据,这表明“论文工厂”的存在:销售假冒科学论文稿件的非法组织。
据笔者调查,2018年以来,可能有数千论文来自论文工厂。
一个由诚信研究分析师、科学家、期刊编辑和记者组成的国际团队发现,论文工厂的服务可能包括数据编造、贩卖作者位次、伪造同行评议和引用计划等,通常这些稿件在很多方面都很相似,往往顺利通过同行评议,被很好地引用。
论文工厂对文献和后续研究有多大影响尚不清楚。在过去的两年里,大量可能来自生命科学领域造论文工厂的论文已经被撤回。今年1月,英国皇家化学会一次性撤回68篇中国医院作者的论文,其中大部分来自著名高校或其附属医院。尽管如此,仍有数以千计的此类论文有待确定。
据报道,在伊朗和俄罗斯都有论文工厂在运营。除了生命科学领域的论文,还涉及人文社会科学、计算机科学和工程等领域。
克里斯托弗指出,对于那些可能来自一位论文工厂的论文手稿,其指示性特征包括:
1.与其他论文/稿件的相似度;
2.与其他论文/稿件在面板构成与组织、注释体例、图表格式等方面的相似性;
3.公式化的标题和结构;
4.杂志社的稿件投稿系统将稿件标记为不同作者从同一台电脑投稿;
5.作者使用商业和非学术邮箱;
6.作者ORCID ID(开放研究员、投稿者身份码)缺失或为空;
7.参考文献列表包含无明显理由的无关论文引用;
8.使用作者推荐的审稿人时,审稿时间极短,审稿结果为肯定。
案例解读
案例1:论文工厂或假冒模板
论文工厂好像有论文模板。在几篇不相关的论文中,文本、表格和图形的整体布局和设计非常相似。其图像数据重用,不仅有蛋白印迹、显微照片等,还包括表格、散点图、条形图、偶数图等。
图1显示了2018年10月发表在《皇家学会开放生物学》上的两篇无关文章的重复图像和具体数字,分别用蓝色和紫色方框标记,来自不同的作者,这两篇文章都于2020年7月撤回。
图1来自欧洲生化学会联合会快报(下同)
案例2:引文与内容无关
可能来自论文工厂的论文也会互相引用,增加了可信度。
在最近提交给FEBS的一篇论文手稿中,描述了miRNA、靶点及其在特定疾病中的作用。参考文献表中引用了几篇文献,但这些文献中既没有miRNA、靶点,也没有相关的疾病机制。这显示了这些论文纯粹是为了引用而列出的。
克里斯托弗仔细查看了四篇被引用的论文后发现,每篇文章都包含了一个与新提交的论文质稿件中的一个图形值相同的条形图,但标签不同,图案和颜色也有所改变,如图2所示。这四篇文章分别来自中国不同医院的不同作者,发表在两种期刊上。克里斯托弗等人及时提醒他们。
图2
案例3:原始数据图像的背景和内容可以任意组合
对于克里斯托弗等人检测论文工厂论文来说,围绕图表的原始数据制定强有力的规范至关重要。
克里斯托弗等人还观察到Western blotting的原始数据经常被操纵或完全捏造。据介绍,生成式对抗网(一种基于人工智能的图像合成技术)可以通过计算机生成外观极其逼真的蛋白质印迹,制造出人们通常所说的“深度假货”。
图3显示了最近撤回的一篇论文的“原始数据”,这篇论文是在克里斯托弗为其他期刊做了一项调查后撤回的。在PS中打开图像数据文件显示,在每一幅图像中,这些条带与背景处于不同的层次,即不同线条的条带可以与假背景任意组合,可以生成25幅分别代表不同实验的图像。在这种情况下,由于原作者没有合并这两层,所以可以追溯清楚。
图3
案例4:需要原始数据时,论文工厂现发
2018年,FEBS出版社的两种期刊收到了12份论文工厂的投稿:论文张图像中显示的蛋白质印迹的背景噪声在多张图片甚至多篇稿件中是相同的。这些稿件在短短几周内分2-3批提交。后来,在被FEBS出版社拒绝后,这12篇文章被发表在了其他期刊上。
这些文章后来被列入“蝌蚪论文工厂”名单,由著名学术“打假人”伊丽莎白·比克列出,近600篇带有模板背景的呈现特征性蛋白质印迹的论文被鉴定出来。虽然这些图片看起来很相似,但不清楚这些论文是否都来自一家或多家论文工厂。
这些例子表明,在缺乏真实数据的情况下,论文工厂可能需要生产图像,以便向期刊提供原始数据。
案例5:7篇论文同时出现低级错误
2020年,克里斯托弗受命帮助调查发表在FEBS以外期刊上的大量论文。在被调查并最终撤回的论文中,克里斯托弗注意到,几篇无关论文作者提供的Western blot原始数据相似,数据呈现和排列等要素非常相似。这些论文的作者互不重叠,相互之间也没有隶属关系。
图5显示了这6篇论文的原始数据图像,与同时提交给FEBS出版社的一篇论文的Western blotting原始数据呈现方式相同。这七项研究并无关联,但它们的原始数据都有相同的布局:三个并排重复,每个压印版中心的条形位置相似,所有图像的右上角都是数字化裁剪出来的。
图4(A,B)原始Western印迹资料。(C)为同时提交给FEBS的论文的原始数据进行免疫印迹。
值得注意的是,所有图像的右上角都被数字剪掉了。
在Western blotting中,通常的做法是将X光片的一角剪掉,以确定显影后胶片的方向。这是物理的,就是用剪刀剪掉。
然而,在这些例子中,裁剪是数字完成的。可以想象,这是为了让图像看起来真实而故意做的,但如果不使用X光胶片成像,使用数字成像,绝对没有理由这么做。