假引用无处不在——2026年如何识别它们

Citely Teamon 8 hours ago

如果你曾将AI生成的参考文献列表粘贴到Google学术搜索中却一无所获,那么你已经遇到过假引用了。这个问题比大多数研究人员意识到的要严重:多项研究表明,大型语言模型生成的参考文献中,有25%到40%是伪造的,其中包含虚构的作者姓名、听起来 plausible 的期刊名称,以及指向空无一物的DOI。2026年,随着AI写作助手嵌入到从本科论文到拨款提案的每一个工作流程中,假引用已成为学术诚信失败最常见的形式——不是因为研究人员有意欺骗,而是因为他们信任那些自信地生成无稽之谈的工具。

AI为何会生成虚假参考文献

大型语言模型不会从数据库中检索信息。它们预测序列中下一个 plausible 的标记。当被要求提供引用时,模型会生成一段“看起来像”参考文献的文本——第一作者的姓氏、年份、期刊名称、卷号——而不会检查这些信息是否真的对应于真实的出版物。

这就是为什么AI伪造的参考文献如此难以肉眼识别。它们遵循正确的格式约定。作者姓名是该领域的真实研究人员。期刊名称也存在。但具体的组合——那个作者、那个标题、那个期刊、那个年份——却是虚构的。

三种假引用类型

并非所有伪造的参考文献都相同。了解其变体有助于你识别它们:

1. 完全虚构的论文 最明显的类型。标题、作者、期刊和DOI都是凭空生成的。这些最容易被发现——在CrossRef或Google学术搜索上快速查找会一无所获。

2. 混合引用(Chimera references) 模型将不同论文的真实元素组合在一起:真实的作者姓名、真实的期刊名称,但具体的论文并不存在。这些很危险,因为单个组成部分是真实的。你可能会验证作者在该期刊上发表过文章,然后就此打住。

3. 扭曲的引用 真实的论文存在,但AI弄错了年份、拼错了标题或分配了错误的DOI。参考文献“几乎”与真实的出版物匹配,这使得它成为在没有系统验证的情况下最难检测的类型。

伪造引用的五个危险信号

在使用任何工具之前,请训练你的眼睛注意这些模式:

1. DOI无法解析。 复制DOI并粘贴到doi.org。如果出现“DOI not found”错误,则该引用是假的或DOI有误。这一项检查就能发现大约60%的伪造参考文献。

2. 标题在Google学术搜索中没有结果。 真实的论文会留下痕迹——在Google学术搜索、Semantic Scholar、PubMed或机构存储库中。如果引用的标题在所有这些来源中都没有结果,那么它几乎肯定不存在。

3. 整齐的出版年份。 AI模型在生成参考文献时,略微倾向于选择整齐的年份(2020、2015、2010)。如果你的参考文献列表中整齐年份的出版物异常集中,请优先检查这些。

4. 完美得可疑的相关性。 真实的文献综述会包含一些略微相关的来源。如果列表中的每一条参考文献都与你的主题完美匹配关键词,这表明模型是为了符合提示而生成它们,而不是反映实际文献。

5. 作者字段不匹配。 在Google学术搜索或ORCID上查找第一作者。如果他们是真实的学者,但从事完全不同的领域,那么模型很可能借用了他们的名字。

如何手动验证引用

手动过程有效,但很慢:

  1. 复制DOI → 粘贴到doi.org → 检查是否解析
  2. 如果没有给出DOI,请在Google学术搜索中用引号精确搜索标题
  3. 将作者姓名、年份、期刊和卷号与解析出的记录进行交叉核对
  4. 为确保万无一失,在出版商网站上检查该论文

对于单个引用,这需要2-3分钟。对于一篇期刊文章中常见的40个参考文献列表,你将需要超过两个小时的验证工作。

自动化假引用检测

这正是Citely的Citation Checker旨在解决的问题。你粘贴参考文献列表,它会针对CrossRef包含1.5亿多条学术记录的数据库运行每一条引用,检查DOI是否存在、元数据是否匹配,并标记任何无法验证的内容。

Citely Citation Checker in action

与手动检查的关键区别在于覆盖范围:该工具同时检查所有字段——作者、标题、期刊、年份、卷号、DOI——与CrossRef记录进行比对,从而捕获手动快速抽查会遗漏的混合引用和扭曲引用。

假引用混入的后果

后果取决于具体情况,但没有一个是好的:

  • 学生论文:学术诚信违规,即使伪造并非故意。大多数大学现在将AI伪造的引用视为与抄袭相同。
  • 期刊投稿:直接拒稿。编辑们越来越多地在同行评审开始前使用自动化工具验证参考文献列表。
  • 拨款提案:发现不存在参考文献的评审员会质疑整个提案的严谨性。
  • 已发表论文:勘误或撤回。自2024年以来,Retraction Watch数据库追踪到因“伪造参考文献”而撤稿的通知数量急剧增加。

2026年的实用工作流程

以下是保持参考文献列表干净的有效方法:

  1. 如果你想使用AI写作,但绝不要直接信任AI生成的参考文献。 将它们视为建议,而非来源。
  2. 在提交前验证每一条引用。 使用Citely在几秒钟内批量检查你的完整列表,而不是手动逐一检查。
  3. 优先选择你真正阅读过的参考文献。 如果你无法总结一篇论文的论点,请重新考虑它是否应该出现在你的参考文献列表中。
  4. 保持你的参考文献管理器更新。 从出版商数据库中提取的Zotero、Mendeley或EndNote条目默认包含经过验证的元数据。

关键要点

  • AI语言模型生成的参考文献中有25-40%是伪造的,包括看起来真实的DOI和作者姓名
  • 假引用有三种形式:完全虚构、混合(混合真实元素)和扭曲(真实论文但元数据错误)
  • 最快的单项检查是DOI解析——将DOI粘贴到doi.org并查看是否解析
  • 手动验证完整的参考文献列表需要2小时以上;像Citely这样的自动化工具可将其缩短至几秒钟
  • 2026年,假引用会带来真实的后果:学术诚信违规、直接拒稿和撤稿

👉 立即免费检查你的引用