提交前我都会核对每一条参考文献——这是我的具体工作流程
十多年来,我一直在同行评审期刊上发表论文。我的研究领域涵盖计算语言学、农业AI以及跨学科工作,涉及数十个子领域。我的参考文献列表通常有50-80条。通过痛苦的经验,我认识到,一个错误的参考文献就可能导致出版延误数周。
三年前,一篇我花了六个月时间撰写的稿件被一份Q1期刊直接退稿。原因并非方法论或研究发现,而是参考文献列表中有两条参考文献的DOI不匹配。其中一条的出版年份有误,另一条则指向了一篇完全不同的论文。编辑的批注直截了当:“请核实所有参考文献并重新提交。”
那次退稿让我损失了一个修改周期,而且由于在此期间另一个团队发表了类似的研究结果,我可能也因此失去了优先权。从那时起,我在提交前都会核对每一条参考文献,无一例外。以下是我建立的工作流程。
参考文献错误为何比你想象的更常见
大多数研究人员认为他们的参考文献列表是正确的,因为他们使用了引文管理工具。Zotero、Mendeley、EndNote——这些工具在组织参考文献方面表现出色,但它们并非万无一失。
常见的错误产生方式:
引文管理工具同步问题。 你从Google Scholar导入一篇论文,但元数据略有错误——缺少中间名首字母、期刊名称缩写与出版商官方名称不符、预印本年份而非出版年份。引文管理工具存储了它接收到的信息,但并未进行验证。
共同作者贡献。 在多作者论文中,不同的人会添加参考文献。一位博士后凭记忆粘贴了一篇引文。一位合作者使用了不同的引文管理工具,其元数据来源也不同。一名学生添加了ChatGPT建议的参考文献——其中一些参考文献根本不存在。
手稿之间的复制粘贴。 你从一份基金申请书或之前的论文中重复使用了文献综述部分。这些参考文献在原始语境中是正确的,但现在可能DOI已失效、论文已被撤回,或者格式与新的目标期刊不符。
AI写作辅助。 即使你不使用AI生成参考文献,你可能也会用它来帮助起草包含内文引用的段落。AI有时会悄无声息地修改引文——改变年份、替换作者姓名——这些修改乍一看似乎是正确的。
我自己在手稿或评审过的论文中都遇到过这些问题。它们并非粗心的表现;它们是现代多工具、多作者写作工作流程的症状。
我的提交前参考文献核查工作流程
我为每一篇手稿都执行此操作,通常在提交前两天完成。而不是提交前一晚——我也吸取了那个教训。
步骤1:将参考文献列表导出为纯文本
我将手稿中的完整参考文献列表复制到一个干净的文本文件中。没有格式,没有嵌入的Zotero字段——只有每条参考文献的原始文本,就像它将出现在提交的PDF中一样。
为什么是纯文本?因为我想检查审稿人看到的内容,而不是我的引文管理工具认为存在的内容。如果Zotero和导出的参考文献列表之间存在同步错误,这个步骤就能发现它。
步骤2:自动化DOI和元数据验证
我将整个参考文献列表粘贴到Citely的引文检查器中。该工具会解析每条参考文献,在CrossRef中查找DOI,并逐字段比较元数据——作者姓名、标题、期刊、年份、卷号、页码。

对于一个包含60条参考文献的列表,此步骤通常不到一分钟。它可以发现:
- 无法解析的DOI(伪造或输入错误)
- 解析到与描述不符的论文的DOI
- 错误的出版年份(我见过的最常见的错误)
- 作者姓名不匹配
- 期刊名称不一致
平均而言,我在每篇手稿中会发现2-4个问题。并非因为我粗心——而是因为现代学术写作流程有太多可能出错的地方,人工检查无法发现所有问题。
步骤3:人工审查标记的参考文献
自动化检查会标记需要注意的参考文献。对于每个标记的项目,我都会:
- 在浏览器中打开DOI链接,查看它实际指向哪篇论文
- 比较我打算引用的论文与DOI解析到的论文
- 修正差异——通常是通过修正年份、更新DOI或完全替换参考文献
大多数修正都是微不足道的——错误的年份、缺少的页码。但每年总有一两次,我发现一条完全无法验证的参考文献。这篇论文似乎根本不存在。这总是可以追溯到共同作者在没有检查的情况下,从AI工具添加了参考文献。我们现在对此有实验室政策。
步骤4:检查已撤回的论文
此步骤与DOI验证是分开的。一篇论文可能拥有有效的DOI和正确的元数据,但仍然可能已被撤回。
我针对Retraction Watch核查我最重要的参考文献——那些我的论点所依赖的参考文献。对于完整列表,我检查CrossRef的元数据,其中包含许多出版商的撤回通知。
引用一篇已撤回的论文不仅令人尴尬;在某些领域,它可能导致编辑对你自身工作的完整性产生担忧。
步骤5:根据目标期刊验证格式
这是枯燥的步骤,但编辑们很在意。每本期刊都有自己的参考文献样式——作者姓名格式、期刊缩写规则、DOI显示格式、“et al.”的使用阈值。
我将3-4条参考文献与期刊已发表的论文进行比较,以确保我的格式匹配。如果期刊使用缩写期刊名称,我检查每个缩写是否遵循ISO 4标准(或期刊指定的任何标准)。
我没有为此步骤使用自动化工具——我发现通过目测与最新一期进行匹配更快。但我知道有些同事在这里使用Scribbr或类似的格式检查器。
6:通读内文引用
最后一步:我通读手稿,并检查每个内文引用(Smith et al., 2024)是否与参考文献列表中的条目匹配,反之亦然。孤立的引用——参考文献列表中列出但从未在正文中引用的参考文献——是审稿人的危险信号。正文中引用但未出现在参考文献列表中的情况也是如此。
如果你正确使用文字处理器的引用工具,大多数文字处理器都会标记这些不匹配项。但是,如果你对引用进行了任何手动编辑(我总是因为格式原因不得不这样做),此步骤可以发现软件遗漏的内容。
这需要多长时间
对于一篇包含50-70条参考文献的典型手稿:
| 步骤 | 时间 |
|---|---|
| 导出和准备 | 5分钟 |
| 自动化验证 (Citely) | 1-2分钟 |
| 人工审查标记项 | 10-20分钟 |
| 撤回检查 | 5-10分钟 |
| 格式验证 | 15-20分钟 |
| 内文引用交叉检查 | 10-15分钟 |
| 总计 | 45-75分钟 |
大约一个小时的工作。与因直接退稿而损失的数周或数月相比,这个计算显而易见。
在我开始使用自动化工具进行步骤2之前,仅人工DOI验证就需要2-3小时。手动在doi.org上检查每个DOI,将元数据与CrossRef记录进行比较,记录差异——这很彻底但不可持续。自动化步骤将整个工作流程从半天缩短到大约一小时。
我告诉我的研究生的内容
我管理一个研究实验室,每个提交论文的学生都要接受参考文献验证培训。规则很简单:
-
绝不要提交未经验证的参考文献的论文。 即使是研讨会论文也不行。甚至预印本也不行。你的名字在上面。
-
如果你使用AI辅助撰写论文的任何部分,请将每条参考文献验证两次。 AI工具会生成看似合理的引文,引用真实的作者和期刊,但会错误地组合它们。这些混合引文几乎不可能通过肉眼发现。
-
在给我看手稿之前,将完整的参考文献列表通过自动化检查器运行。 我不应该成为发现DOI错误的人——这在2026年是一个已解决的问题。
-
保持你的引文管理工具干净。 导入参考文献时,请对照出版商页面验证元数据。在导入时这样做,每条参考文献只需30秒。在截止日期前修复一个混乱的库需要更长时间。
-
不要引用你没有读过的论文。 这听起来很明显,但用“听起来相关”的论文来充实参考文献列表的诱惑是真实存在的,尤其是对于文献综述部分。如果你无法总结论文的主要论点,就不要引用它。
关于多作者手稿的说明
参考文献验证问题随着作者数量的增加而呈指数级恶化。在一篇有来自三个机构的五位共同作者的论文中,每个人可能使用不同的引文管理工具、不同的元数据来源以及不同的AI工具使用习惯。
对于我们的多作者项目,以下方法有效:
- 一个人负责参考文献列表。 通常是通讯作者或管理手稿文件的人。所有参考文献的添加都通过他们。
- 参考文献验证在最终版本组装完成后进行,而不是在每个单独的贡献之后。检查中间草稿是浪费精力。
- 我们在提交前与所有共同作者分享Citely验证报告,以便每个人都可以审查标记的项目并确认他们的贡献是干净的。
多年来我发现的常见错误
为了让您了解参考文献验证在实践中实际发现了什么:
年份错误(最常见)。 一篇2023年的论文被引用为2024年,反之亦然。通常是由于在线优先和印刷出版日期之间的混淆造成的。使用“提前访问”出版的期刊尤其容易出现这种情况。
作者姓名替换。 “Kim, J.”而不是“Kim, S.”——一个首字母的差异。当引文管理工具从不同来源(CrossRef、Google Scholar、PubMed)提取元数据,而这些来源记录作者姓名不同时,就会发生这种情况。
期刊名称不匹配。 “Journal of Machine Learning Research”与“Journal of Machine Learning”——接近但不完全相同的期刊。第二个不存在。这是经典的AI幻觉模式。
DOI指向错误的论文。 DOI有效,但属于同一期刊中的另一篇论文。通常是由于复制粘贴错误,其中一个参考文献的DOI被意外分配给另一个参考文献。
引用已撤回的论文而未通知。 我曾两次发现引用了在我们将其添加到参考文献列表后被撤回的论文。在这两种情况下,撤回都发生在写作期间,我们没有注意到。
主要收获
- 参考文献错误在现代学术写作中普遍存在——多作者工作流程、引文管理工具同步问题和AI写作工具都会引入难以手动发现的错误。
- 对于一篇包含60条参考文献的论文,系统的提交前参考文献检查大约需要一小时,可以防止因直接退稿而导致的数周延误。
- 像Citely这样的自动化验证工具通过批量比较参考文献与CrossRef记录,将人工DOI检查步骤从数小时缩短到数分钟。
- 最常见的错误是错误的出版年份、作者姓名替换和期刊名称不匹配——所有这些都可以通过自动化元数据比较来检测。
- 对于多作者论文,指定一个人负责参考文献列表,并在最终版本组装完成后进行验证。