Apr 13, 2026

阅读约 6 分钟

更新于 Apr 13, 2026

为什么AI工具会“幻觉”学术参考文献？

AI工具能生成看似完美的引文，但这些引文可能不准确、不完整甚至完全虚构。本文将解释ChatGPT、Claude和Gemini为何会“幻觉”参考文献，以及研究人员应如何应对。

Dr. Sarah Chen

发布于 2 months ago

AI工具在生成流畅、看似学术的文本方面表现出色。

这正是它们的引文如此具有误导性的原因。

当ChatGPT、Claude或Gemini给你一个参考文献时，它通常以最危险的形式呈现：自信、精炼且看似合理。引文看起来很完整，听起来很学术，并且完美地融入了段落。

但外表并不能代表可靠性。

如果你使用AI辅助写作，你需要理解一个简单的原则：格式良好的引文并不能证明其来源真实存在。

简而言之

AI工具会“幻觉”学术参考文献，因为它们被训练来生成看似合理的文本，而不是针对实时学术数据库验证每一个标题、作者、DOI和期刊条目。

这就是为什么一个引文听起来很精确，但实际上却是错误的。

证据表明

这不仅仅是工具供应商的产品抱怨。

这个问题已从多个角度得到证实：

一篇2023年的《科学报告》论文分析了ChatGPT生成的虚构和错误书目引文。
一项2024年的跨学科研究评估了学术写作流程中引文和DOI的准确性。
南加州大学图书馆关于生成式AI局限性的指南明确警告，大型语言模型（LLMs）可能会“幻觉”虚构的引文、出版物和其他研究信息。

所以，当我们谈论“幻觉参考文献”时，我们描述的是一种有据可查的行为模式，而不仅仅是孤立的用户挫败感。

为什么AI引文让人觉得可信？

AI工具擅长生成学术写作的表面特征：

引文结构
作者格式
期刊风格的措辞
合理的出版年份
专业术语

这种流畅性制造了一种虚假的安全感。用户常常会认为：

“它看起来很学术，所以它一定存在。”
“DOI格式看起来是对的，所以它一定是真的。”
“标题听起来很具体，所以它一定来自一篇论文。”

这正是陷阱所在。

这些系统被优化来生成看似合理的语言，而不是作为书目真相引擎来运作。

核心可靠性问题

可靠性问题不仅仅是“有时会犯错”。

更深层的问题是，AI工具可以生成听起来权威的文本，即使其底层参考文献是：

虚构的
不完整的
由多篇真实论文合并而成的
与其本应支持的主张脱节的

这意味着你不能仅凭自信或润色程度来判断其可靠性。

最常见的引文失败模式

1. 不存在的论文

整个引文都是凭空捏造的。标题可能听起来很真实，但实际上没有这样的论文存在。

2. 真实论文的元数据错误

存在一篇相关的真实论文，但引文给出了错误的：

年份
作者列表
标题措辞
期刊
DOI

3. 看似真实但无支持的参考文献

这种情况更微妙。来源可能存在，但它实际上不支持你段落中的主张。

例如，ChatGPT可能会引用一篇真实的综述文章来支持一个非常具体的数值主张，而该论文从未提及此主张。

4. 混合来源引文

模型将多个来源的细节混合成一个看起来整洁的参考文献。

这也是AI生成的引文难以通过肉眼发现的原因之一。每个部分都可能让人觉得熟悉，但整个引文仍然是错误的。

为什么这会在学术工作中发生？

学术提示鼓励精确性。用户会要求：

经过同行评审的来源
APA格式的参考文献
某年之后发表的文章
支持特定主张的来源

这促使模型生成在结构上满足提示的参考文献，即使它实际上无法检索到正确的论文。

换句话说，你的请求越“像引文”，这种“幻觉”就越具有说服力。

为什么这比格式错误更严重？

不可靠的引文不仅仅是书目混乱的问题。

它会影响整个论证的可信度。

如果审稿人检查一篇参考文献，发现它不存在，他们可能会合理地问：

这篇论文中还有哪些内容未经验证？
主张本身是否经过核实？
作者是否真正阅读了引用的文献？

这就是为什么即使论文的主要思想本身是可靠的，引文的可靠性也至关重要。

AI生成引文何时风险最大？

在以下情况下，你应特别谨慎：

从零开始写作

如果你使用AI工具同时生成主张和引文，你增加了两者都未经核实的可能性。

跨领域写作

当用户跨学科或在不熟悉的文献中写作时，他们不太可能发现虚假参考文献。

在截止日期压力下工作

匆忙的用户更有可能轻信一份精美的参考文献列表。

协作写作

在团队协作流程中，一个人可能会认为另一个人已经核实了参考文献。这就是虚假引文如何存活到最终草稿的原因。

如何避免盲目信任AI参考文献？

答案不是“永不使用AI”。

答案是：将其用于草稿支持，但将写作辅助与引文验证分开。

以下是更安全的工作流程：

步骤1：将AI参考文献视为线索，而非最终参考文献

AI生成的引文可以为你提供一个主题方向、一个可能的作者或一个搜索线索。但这并不能使其成为最终的书目条目。

步骤2：验证参考文献

检查：

标题是否存在
DOI是否可解析
元数据是否匹配
来源是否确实支持该主张

3. 用真实来源替换不受支持的来源

如果引文是虚假的或薄弱的，请使用该主张来寻找真实的论文，而不是试图挽救虚假的参考文献。

当您有一个句子或主张但没有原始论文时，Citely的Source Finder在这里非常有用。

使用Source Finder追溯真实的支撑来源

步骤4：批量检查完整书目

提交前，通过Citely的Citation Checker运行完整的参考文献列表。

使用Citation Checker审查AI生成的参考文献

这是捕捉以下问题的实用方法：

虚假引文
不完整引文
作者不匹配
错误年份
从AI工作流程复制的可疑条目

AI草稿与可靠参考文献工作流程对比

工作流程	优点	缺点
向AI工具寻求参考文献	快速启动	参考文献可能虚假或无支持
手动Google Scholar检查	适用于少量来源	缓慢且重复
DOI + 元数据验证	准确	对于大量列表仍需手动
Citely Citation Checker + Source Finder	最适合真实的验证工作流程	仍需最终人工判断

研究人员和学生更好的准则

如果你只记住一条规则，那就是：

切勿仅仅因为AI提供了引文就提交。只有在验证后才提交。

这一准则保护了：

你的信誉
你的书目
你的合著者
你的出版流程

关键要点

AI生成的引文并非总是可靠，因为流畅的引文格式与经过验证的书目真相不同。
主要风险包括虚构的论文、扭曲的元数据、无支持的主张和混合来源的参考文献。
学术提示通常会产生更具说服力的“幻觉”，因为它们促使模型生成类似引文的输出。
安全的工作流程是：将AI参考文献视为线索，然后在使用前进行验证。
结合主张追溯和引文检查的工作流程是提交前清理AI辅助草稿最实用的方法。

👉 在这里验证AI生成的参考文献：citely.ai/citation-checker ✨

继续阅读你关心的主题。