Apr 13, 2026
阅读约 6 分钟
更新于 Apr 13, 2026

为什么AI工具会“幻觉”学术参考文献?

AI工具能生成看似完美的引文,但这些引文可能不准确、不完整甚至完全虚构。本文将解释ChatGPT、Claude和Gemini为何会“幻觉”参考文献,以及研究人员应如何应对。

Dr. Sarah Chen
发布于 2 days ago

AI工具在生成流畅、看似学术的文本方面表现出色。

这正是它们的引文如此具有误导性的原因。

当ChatGPT、Claude或Gemini给你一个参考文献时,它通常以最危险的形式呈现:自信、精炼且看似合理。引文看起来很完整,听起来很学术,并且完美地融入了段落。

但外表并不能代表可靠性。

如果你使用AI辅助写作,你需要理解一个简单的原则:格式良好的引文并不能证明其来源真实存在。

简而言之

AI工具会“幻觉”学术参考文献,因为它们被训练来生成看似合理的文本,而不是针对实时学术数据库验证每一个标题、作者、DOI和期刊条目。

这就是为什么一个引文听起来很精确,但实际上却是错误的。

证据表明

这不仅仅是工具供应商的产品抱怨。

这个问题已从多个角度得到证实:

所以,当我们谈论“幻觉参考文献”时,我们描述的是一种有据可查的行为模式,而不仅仅是孤立的用户挫败感。

为什么AI引文让人觉得可信?

AI工具擅长生成学术写作的表面特征

  • 引文结构
  • 作者格式
  • 期刊风格的措辞
  • 合理的出版年份
  • 专业术语

这种流畅性制造了一种虚假的安全感。用户常常会认为:

  • “它看起来很学术,所以它一定存在。”
  • “DOI格式看起来是对的,所以它一定是真的。”
  • “标题听起来很具体,所以它一定来自一篇论文。”

这正是陷阱所在。

这些系统被优化来生成看似合理的语言,而不是作为书目真相引擎来运作。

核心可靠性问题

可靠性问题不仅仅是“有时会犯错”。

更深层的问题是,AI工具可以生成听起来权威的文本,即使其底层参考文献是:

  • 虚构的
  • 不完整的
  • 由多篇真实论文合并而成的
  • 与其本应支持的主张脱节的

这意味着你不能仅凭自信或润色程度来判断其可靠性。

最常见的引文失败模式

1. 不存在的论文

整个引文都是凭空捏造的。标题可能听起来很真实,但实际上没有这样的论文存在。

2. 真实论文的元数据错误

存在一篇相关的真实论文,但引文给出了错误的:

  • 年份
  • 作者列表
  • 标题措辞
  • 期刊
  • DOI

3. 看似真实但无支持的参考文献

这种情况更微妙。来源可能存在,但它实际上不支持你段落中的主张。

例如,ChatGPT可能会引用一篇真实的综述文章来支持一个非常具体的数值主张,而该论文从未提及此主张。

4. 混合来源引文

模型将多个来源的细节混合成一个看起来整洁的参考文献。

这也是AI生成的引文难以通过肉眼发现的原因之一。每个部分都可能让人觉得熟悉,但整个引文仍然是错误的。

为什么这会在学术工作中发生?

学术提示鼓励精确性。用户会要求:

  • 经过同行评审的来源
  • APA格式的参考文献
  • 某年之后发表的文章
  • 支持特定主张的来源

这促使模型生成在结构上满足提示的参考文献,即使它实际上无法检索到正确的论文。

换句话说,你的请求越“像引文”,这种“幻觉”就越具有说服力。

为什么这比格式错误更严重?

不可靠的引文不仅仅是书目混乱的问题。

它会影响整个论证的可信度。

如果审稿人检查一篇参考文献,发现它不存在,他们可能会合理地问:

  • 这篇论文中还有哪些内容未经验证?
  • 主张本身是否经过核实?
  • 作者是否真正阅读了引用的文献?

这就是为什么即使论文的主要思想本身是可靠的,引文的可靠性也至关重要。

AI生成引文何时风险最大?

在以下情况下,你应特别谨慎:

从零开始写作

如果你使用AI工具同时生成主张和引文,你增加了两者都未经核实的可能性。

跨领域写作

当用户跨学科或在不熟悉的文献中写作时,他们不太可能发现虚假参考文献。

在截止日期压力下工作

匆忙的用户更有可能轻信一份精美的参考文献列表。

协作写作

在团队协作流程中,一个人可能会认为另一个人已经核实了参考文献。这就是虚假引文如何存活到最终草稿的原因。

如何避免盲目信任AI参考文献?

答案不是“永不使用AI”。

答案是:将其用于草稿支持,但将写作辅助引文验证分开。

以下是更安全的工作流程:

步骤1:将AI参考文献视为线索,而非最终参考文献

AI生成的引文可以为你提供一个主题方向、一个可能的作者或一个搜索线索。但这并不能使其成为最终的书目条目。

步骤2:验证参考文献

检查:

  • 标题是否存在
  • DOI是否可解析
  • 元数据是否匹配
  • 来源是否确实支持该主张

3. 用真实来源替换不受支持的来源

如果引文是虚假的或薄弱的,请使用该主张来寻找真实的论文,而不是试图挽救虚假的参考文献。

当您有一个句子或主张但没有原始论文时,Citely的Source Finder在这里非常有用。

使用Source Finder追溯真实的支撑来源

步骤4:批量检查完整书目

提交前,通过Citely的Citation Checker运行完整的参考文献列表。

使用Citation Checker审查AI生成的参考文献

这是捕捉以下问题的实用方法:

  • 虚假引文
  • 不完整引文
  • 作者不匹配
  • 错误年份
  • 从AI工作流程复制的可疑条目

AI草稿与可靠参考文献工作流程对比

工作流程优点缺点
向AI工具寻求参考文献快速启动参考文献可能虚假或无支持
手动Google Scholar检查适用于少量来源缓慢且重复
DOI + 元数据验证准确对于大量列表仍需手动
Citely Citation Checker + Source Finder最适合真实的验证工作流程仍需最终人工判断

研究人员和学生更好的准则

如果你只记住一条规则,那就是:

切勿仅仅因为AI提供了引文就提交。只有在验证后才提交。

这一准则保护了:

  • 你的信誉
  • 你的书目
  • 你的合著者
  • 你的出版流程

关键要点

  • AI生成的引文并非总是可靠,因为流畅的引文格式与经过验证的书目真相不同。
  • 主要风险包括虚构的论文、扭曲的元数据、无支持的主张和混合来源的参考文献。
  • 学术提示通常会产生更具说服力的“幻觉”,因为它们促使模型生成类似引文的输出。
  • 安全的工作流程是:将AI参考文献视为线索,然后在使用前进行验证。
  • 结合主张追溯和引文检查的工作流程是提交前清理AI辅助草稿最实用的方法。

👉 在这里验证AI生成的参考文献:citely.ai/citation-checker