引用核查101:CrossRef、DOI以及如何识别虚假引用

Citely Teamon 8 hours ago

引用核查是确认参考文献列表中的条目指向真实、已发表的学术著作,并且其元数据准确无误的过程。它依赖于两个大多数研究人员日常使用却不完全理解的系统:DOI和CrossRef。如果你曾点击论文中的DOI链接并跳转到出版商网站,那么你已经同时使用了这两个系统。本指南将解释这些系统的工作原理、它们在识别虚假引用方面的重要性,以及如何手动或借助自动化工具来核查任何参考文献列表。

DOI到底是什么?

DOI(Digital Object Identifier,数字对象标识符)是分配给已发表作品的永久标识符。可以把它想象成论文的“社会安全号码”。一旦分配,DOI永不改变,即使出版商将论文转移到新的URL。

DOI的格式如下:10.1038/nature12373

其结构包含一些信息:

  • 10 — DOI目录指示符(始终为10)
  • 1038 — 注册机构代码(此代码属于Nature Publishing Group)
  • /nature12373 — 后缀,由出版商分配

当你解析一个DOI(通过访问https://doi.org/10.1038/nature12373)时,DOI系统会查找该论文当前所在的地址并将其重定向到那里。

DOI为何对核查至关重要

由于DOI是与元数据(作者姓名、标题、期刊、年份、卷、页码)一同注册的,你可以将任何引用与其DOI记录进行比对,以查看详细信息是否匹配。这是引用核查的基础。

如果DOI在注册表中不存在,则该引用要么是伪造的,要么包含拼写错误。如果它存在但元数据与引用中的信息不符,那么你得到的是一个“嵌合体引用”——一个由不同论文部分拼凑而成的引用。

什么是CrossRef?

CrossRef是一个非营利性注册机构,维护着全球最大的DOI元数据数据库。截至2026年,CrossRef收录了来自20,000多家出版商的超过1.5亿篇学术著作的元数据。

当出版商向CrossRef注册一篇新论文时,他们会提交:

  • DOI
  • 标题
  • 作者姓名
  • 期刊名称
  • 卷、期和页码
  • 出版日期
  • 论文引用的参考文献(针对参与的出版商)

CrossRef通过公共API提供这些元数据的查询服务。任何人都可以查询DOI并获取官方记录。这也是大多数引用核查工具(包括Citely)的动力来源。

CrossRef并非唯一的注册机构

有几个DOI注册机构:

  • CrossRef — 期刊文章、会议论文、书籍(规模最大)
  • DataCite — 数据集、软件和其他研究成果
  • mEDRA — 主要面向欧洲出版商
  • ISTIC — 中国学术出版物

大多数引用核查工具会首先查询CrossRef,因为它涵盖了绝大多数期刊文章。但以DataCite注册机构代码开头的DOI(数据集常见)在CrossRef数据库中是找不到的——这并不意味着该引用是假的。

引用核查分步指南

以下是完整的核查流程,无论你是手动操作还是理解自动化工具的工作原理:

步骤1:提取DOI

如果参考文献中包含DOI,请提取它。常见格式有:

  • https://doi.org/10.1038/nature12373
  • doi: 10.1038/nature12373
  • DOI 10.1038/nature12373

如果未列出DOI,你需要通过标题和作者进行搜索(步骤1b)。

步骤1b:按标题搜索

当没有DOI时,请在以下平台搜索确切的论文标题:

  1. CrossRef搜索
  2. Google Scholar(使用引号)
  3. PubMed(针对生物医学论文)

如果标题在所有这三个平台都返回零结果,那么这篇论文很可能不存在。

步骤2:解析DOI

访问https://doi.org/[你的DOI]。可能出现三种结果:

  • 解析到论文 → DOI有效。继续执行步骤3。
  • “DOI未找到”错误 → DOI不存在。该引用是伪造的或包含拼写错误。
  • 解析到不同的论文 → DOI属于不同的出版物。这是一个嵌合体引用。

步骤3:比对元数据

这是大多数手动核查的不足之处——人们在步骤2就停止了,并认为一个能解析的DOI意味着引用是正确的。你需要比对:

字段你的引用显示CrossRef记录显示匹配?
作者Smith, J. & Lee, K.Smith, J. & Lee, K.
年份20242023
标题"Deep learning for...""Deep learning for..."
期刊Nature MethodsNature Methods
2120

在这个例子中,DOI解析成功,论文真实存在,但年份和卷号是错误的。这是AI生成参考文献中的常见模式——模型找到了真实的论文,但混淆了细节。

步骤4:检查撤回或更正

即使所有信息都匹配,也要检查论文是否已被撤回或更正:

  • Retraction Watch上搜索
  • 检查CrossRef元数据中是否有“撤回”或“更正”类型的条目
  • 在出版商网站上查找相关通知

手动核查 vs. 自动化核查

手动核查

优点:你可以看到所有细节,能够发现上下文层面的问题,并培养研究素养。 缺点:每条参考文献需要2-3分钟。对于一篇包含40条参考文献的论文,这将花费80-120分钟。

使用Citely进行自动化核查

Citely的Citation Checker会自动对你参考文献列表中的每条引用执行步骤1-3。粘贴你的参考文献,它将查询CrossRef数据库,解析DOI,比对元数据字段,并标记差异。

使用Citely进行引用核查

优点:在几秒钟内核查整个参考文献列表。能发现手动抽查会遗漏的元数据不匹配问题。 缺点:尚不能(未来可能)检查撤回状态,也无法评估你是否在上下文中恰当地引用了来源。

实际建议:使用Citely进行批量核查,然后手动审查它标记的任何参考文献,以及未在CrossRef中索引的来源(书籍、政府报告、网站)的参考文献。

常见核查场景

“DOI有效但标题略有不同”

这通常意味着引用是真实的,但标题被转述或截断了。检查其余的元数据——如果作者、年份和期刊都匹配,那很可能只是格式问题。将标题修改为与官方记录一致。

“未找到DOI且标题搜索结果为零”

这是伪造引用的强烈信号。在断定它是假的之前,尝试搜索第一作者的姓名加上标题中的几个关键词。如果仍然一无所获,则应删除并替换该参考文献。

“DOI解析到一篇完全不同的论文”

这是嵌合体模式。DOI属于一篇真实的论文,但它不是你的参考文献中描述的那篇。该引用需要完全替换——要么找到你打算引用的论文的正确DOI,要么找到你已列出的DOI所对应的正确引用。

“CrossRef显示论文但作者不同”

这在AI生成的参考文献中很常见,模型会替换作者姓名。将作者修正为与CrossRef记录一致。

关键要点

  • DOI是学术著作的永久标识符,与元数据一同注册,可用于对照官方记录进行核查。
  • CrossRef维护着超过1.5亿条DOI记录,是引用核查工具使用的主要数据库。
  • 完整的核查需要四个步骤:提取DOI、解析DOI、逐字段比对元数据,并检查是否撤回。
  • 仅凭一个能解析的DOI并不能说明引用是正确的——你必须交叉核对元数据(作者、年份、标题、期刊)。
  • 像Citely这样的自动化工具可以在几秒钟内处理整个参考文献列表的步骤1-3,但仍需要手动审查撤回情况和非DOI来源。

👉 免费核查你的引用与CrossRef数据是否一致