Apr 12, 2026
阅读约 6 分钟
更新于 Apr 12, 2026

AI引用幻觉:是什么、为何发生以及如何预防

AI工具会生成看起来真实的虚假学术参考文献。本指南解释了三种引用幻觉类型,展示了如何检测它们,并提供了一个实用的预防工作流程。

Citely Team
发布于 a day ago

当大型语言模型生成引用时,它不会查询数据库。它会根据训练数据中的模式来预测引用应该是什么样子。结果是文本遵循完美的格式约定——一个看似合理的作者姓名、一个真实的期刊名称、一个结构正确的DOI——但却指向一篇不存在的论文。

这就是引用幻觉,它是当今学术写作中增长最快的诚信风险。

什么是引用幻觉?

引用幻觉是指AI工具生成了一个看似合法的参考文献,但它不对应任何真实的已发表作品。术语“幻觉”来源于更广泛的AI研究社区,它描述了任何流畅、自信但事实错误的输出。

在学术参考文献的背景下,幻觉尤其危险,因为其输出与真实引用的格式和约定高度相似。人类读者——即使是经验丰富的研究人员——乍一看也可能发现不了幻觉引用中的任何问题。

三种幻觉引用类型

并非所有虚假引用都是一样的。了解其变体有助于您知道要寻找什么以及哪种检测方法适用于每种类型。

类型1:完全捏造的参考文献

整个引用都是虚构的——标题、作者、期刊、年份和DOI。没有任何组成部分对应真实的出版物。这是最容易检测的类型:在CrossRef、PubMed或Google Scholar上搜索会返回零结果。

示例: "Zhang, W., & Roberts, T. (2024). Adaptive neural frameworks for multilingual sentiment analysis. Journal of Computational Linguistics, 48(3), 112-128."

这看起来很完美。但没有这篇标题的论文存在。该期刊存在,但第48卷第3期不包含这篇文章。作者是真实的研究人员,但从未合著过任何东西。

类型2:嵌合体参考文献

AI将不同论文中的真实元素组合成一个虚构的引用。作者姓名是真实的,并在引用的期刊上发表过文章。期刊和卷号也是真实的。但具体的论文——那个作者、那个标题、那个期号——却不存在。

这种类型很危险,因为部分验证会成功。您可以确认作者是真实的。您可以确认期刊是真实的。您甚至可能发现作者在该期刊上发表过文章。但具体的论文是虚构的。

类型3:扭曲的参考文献

一篇真实的论文存在,但AI弄错了一个或多个细节——出版年份差一年,合著者姓名拼写错误,或者DOI有一个数字被调换了。该参考文献几乎与真实的出版物匹配,这使得它在没有系统验证的情况下最难检测。

为什么AI工具会产生引用幻觉

大型语言模型没有论文数据库。它们不会“查找”任何东西。它们根据统计模式生成序列中的下一个token。

当您要求提供某个主题的引用时,模型会生成符合“关于[主题]的引用”模式的文本。它会利用:

  • 在与该主题相关的训练数据中经常出现的作者姓名
  • 与该领域相关的期刊名称
  • 落在合理范围内的年份
  • 遵循标准前缀/后缀结构的DOI格式

每个元素在统计上都是合理的。但由于每个元素都是独立生成的,所以组合起来通常是虚构的。

这与搜索引擎返回错误结果有着根本区别。搜索引擎检索真实文档,但可能会错误地对其进行排名。LLM生成的是从未存在过的文档。

这个问题有多普遍?

研究结果各不相同,但共识令人担忧:

  • 当被要求提供学术参考文献而没有明确的检索工具时,GPT-4在大约25-35%的情况下会生成捏造的引用
  • 带有检索增强生成(RAG)的模型会减少但不能消除这个问题——根据领域不同,捏造率估计为5-15%
  • 医学和法律领域出现更高的幻觉率,因为引用格式更标准化,使得捏造更难与现实区分

对于晦涩的主题(模型训练数据较少),幻觉率更高;对于知名论文(模型多次见过实际引用),幻觉率更低。

如何检测幻觉引用

方法1:DOI验证

复制DOI并在doi.org上解析。如果出现“DOI not found”错误,则该引用是捏造的或DOI有误。这可以可靠地捕获类型1幻觉。

局限性: 无法捕获类型2或类型3,因为DOI可能接近真实的DOI,或者没有提供DOI。

方法2:标题搜索

在Google Scholar、CrossRef或Semantic Scholar上搜索确切的论文标题(带引号)。零结果强烈表明是捏造的。

局限性: 一些真实论文并非在所有地方都被索引,特别是会议论文、工作论文和非英语期刊的论文。

方法3:自动化批量验证

将您的整个参考文献列表粘贴到Citely的Citation Checker中。该工具会解析每个参考文献,查询CrossRef和其他数据库,并逐字段比较元数据。

Automated citation verification

这是检查整个参考文献列表最有效的方法。它通过验证完整的引用——不仅仅是独立的DOI或标题,而是作者、标题、期刊、年份和DOI的组合——来捕获所有三种类型的幻觉。

方法4:作者出版物列表

在Google Scholar或ORCID上查找第一作者。检查特定论文是否出现在他们的出版物列表中。这可以捕获类型2嵌合体参考文献,即作者是真实的但论文不存在。

预防工作流程

最好的方法是首先防止幻觉引用进入您的手稿:

  1. 切勿在未经验证的情况下使用AI生成的引用。 将每个AI建议的参考文献视为未经证实,直到您确认它存在。

  2. 将AI用于发现,而非引用。 询问AI“关于[主题]的关键论文是什么?”是可以的——但随后您应该自己在Google Scholar或您的图书馆数据库中搜索这些论文。将AI的建议用作搜索词,而不是引用。

  3. 在最后验证,而不是边写边验证。 编写完整个手稿后,一次性批量验证所有参考文献会更有效率,而不是在添加每个引用时进行检查。

  4. 标记AI辅助的部分。 如果您使用AI辅助起草了任何部分,请对这些参考文献进行额外审查。AI贡献的部分最有可能包含幻觉引用。

  5. 提交前使用专用验证工具。 在最终提交前,通过自动化检查器运行您的完整参考文献列表。

关键要点

  • 引用幻觉是指AI生成的参考文献看起来真实,但对应着不存在的论文——它影响了25-35%的AI生成引用
  • 存在三种类型:完全捏造(最容易发现)、结合真实元素的嵌合体参考文献(危险,因为部分检查会通过),以及带有小错误的扭曲引用(最难检测)
  • LLM不会从数据库中检索引用——它们生成统计上合理的文本,这就是为什么虚假引用的每个组成部分看起来都正确,而组合却是虚构的
  • DOI验证可以捕获最明显的虚假引用,但只有自动化批量检查才能通过将完整引用与数据库记录进行比较,可靠地检测所有三种类型
  • 预防比检测更有效:将AI用于文献发现,然后在将其包含在手稿中之前独立验证每个建议的参考文献

验证您的参考文献 → citely.ai/citation-checker