自引是一种反映科学研究连续性的学术方法。但是如果你玩得太大,就会有问题。西班牙萨拉曼卡大学的计算机科学家胡安·曼努埃尔·科尔查多(Juan Manuel Corchado)最近因过度自引而成为公众批评的对象。
2022年初,WRWU世界大学排名(Webometrics Rankings of World Universities)发布了西班牙科研人员排名。这份榜单由西班牙最大的公共研究机构高等科学研究委员会(CSIC)牵头,在国内颇具权威性。
Cochado 以 105 的 H 指数和 38,806 次的引用在该国超过 100,000 名研究人员中脱颖而出,排名第 145 位。
胡安·曼努埃尔·科尔查多
这是一个令人印象深刻的成就。没想到,一个直接的问题瞬间打破了这一切:有人指出,在 Cochado 论文的近 39,000 次引用中,其中许多来自他自己的贡献。
引用自己的研究成果?看来这是增加被引次数和H-index的一种“方式”。
然而,这真的可行吗?
自引用和过度引用的支持场景
算上 Cochado 的论文,“自引”并不少见。
例如,一篇名为“IoT and Blockchain for Smart Cities”的会议摘要共有 322 篇参考文献,其中 44 篇是您自己的论文。在关于2021年第二届教育技术人工智能国际会议(AIET)的文章中,有不少参考文献与上述会议摘要完全相同,而且两次会议的主题明显不同。
“Cochado的自引率高达22%!”西班牙格拉纳达大学信息科统计科查多论文后科学家和文献计量学家 Alberto Martín-Martín 揭示了 Cochado 高引用率背后的“真相”。
根据 Martin 的统计,在 Cochado 整个研究的近 39,000 次引用中,约有 8,400 次来自他自己在 Google Scholar 上的论文。考虑到并非所有论文都被 Google Scholar 收录,因此这些数据可能不够准确。
Martin 还发现,一些研究人员在引用 Cochado 的论文时存在过度引用的问题。 Telefonica 的 Arturo Perez Pulido 就是其中之一。迄今为止,他已引用 Cochado 的论文近 4000 次,占 Cochado 总被引次数的 10%。个别文章的一些参考文献甚至仅来自 Cochado。
至于过度引用问题,由于谷歌学术等网站门槛低,目前还没有解决办法。 “任何人都可以轻松地将包含引文的文章上传到知识库,而这些引文可以指向任何论文。”以类似的方式,Martin 说,任何人都可以从任何论文中复制粘贴,并将复制而来的内容作为自己的原创性上传到 ResearchGate 和其他网站。
ResearchGate 是一个面向全球研究人员的研究社交网站,科学家可以在这里分享研究成果、学术著作,并参与研究论坛或兴趣小组。
争议仍在继续
那么为什么 Cochado 如此痴迷于追求高引用率呢?这让马丁很困惑。
“在意大利等国家,研究人员是根据他们个人文章的引用情况进行评估的,但在西班牙,期刊影响因子是主要因素,”马丁说。也就是说,如果文章没有发表在影响因子高的期刊上,那么无论 Cochado 的文章被引用率多么高,对他的个人评价都没有多大贡献。
当回缩手表当被问及此事时,科查多声称他的手臂骨折了,反应迟钝。此后,他没有再作出任何回应。
英国医学杂志研究诚信部主任 Simone Ragavooloo 指出,像 Cochado 这样的“自引”在学术界绝非独一无二,而是一种普遍现象。
然而,这种行为的基本原理仍然存在争议。 “虽然我讨厌称这种行为可疑或有害,但这些研究人员似乎并不理解科学文献中引用和归属的真正目的,”拉加沃洛说。
布拉格查尔斯大学的 Petr Heneberg 认为适当的“自引”并没有错。比如一个人的被引包括1300次自引,听起来有些夸张,但如果他的总被引次数是13656,那么他的自引率还在10%的可接受范围内,再多一点也没关系。
根据 2019 年的一项研究,基于大约 100,000 名研究人员的数据,自引率中位数为 12.7%。 Cochado 22% 的自引率明显高于平均水平。再加上其他学者 10% 的过度引用,可疑引用总数为 32%。
然而,科查多并不是最“疯狂”的自我引用者。在同一研究的另一组数据中,大约 100,000 名研究人员中至少有 250 名超过 50% 的引用来自他们自己或他们的合著者。
与这些科学家相比,科查多似乎还有余地,但真正令人惊讶的是他的论文数量。 Henberg 发现 Cochado 近年来发表的论文很多,比如 2021 年发表了 25 篇论文,但这并不是很多。 2009年,Cochado合着论文603篇,平均每天1.6篇,令人难以置信!
大量的垃圾学术论文,加上极高的可疑引用率,让 Cochado 一举脱颖而出。
加西亚(尼古拉斯·罗比格拉纳达大学的社会科学家 nson Garcia 撰写并发表了一篇研究论文,说明在 Google Scholar 上操纵引用并质疑这一趋势是多么容易。后来,甚至有研究人员联系他,询问如何提高论文的引用率,但 Garcia 没有回复。 “但过了一会儿,我发现他做到了,”他说。
以量取胜的由来
“这种行为的危害程度,实际上取决于谷歌学术等工具在学术评价中的重要性。”添加说。
他见过很多研究人员沉迷于“自引”,无法自拔。至于有多少是出于纯粹的嚣张,有多少是为了增加引用量,还是两者兼而有之?他没有办法知道。
“自引”现象的泛滥反映了西班牙学术界过分关注研究人员个人文献计量指标的严重问题。
在欧洲国家中,西班牙的学术评价体系可以说是独树一帜。因为它有一个专注于国家层面的评估系统,用于评估个人绩效。这给政府带来了如此沉重的负担,以至于它不得不依靠文献计量指标来减轻学术评估的工作量。
随着时间的推移,这会损害西班牙学术评估的质量。