清华大学：
《AI幻觉深度研究报告-基于政府与监管来源核验的机制、风险、治理与抑制幻觉工程研究》
（完整版.pdf ）
以下仅展示部分内容
下载方式见文末

当AI用流畅的语言一本正经地胡说八道，我们该如何分辨真假？

你有没有遇到过这样的情况：问AI一个问题，它回答得头头是道、引经据典，你信以为真，结果一查发现全是编的？

这不是AI“学坏了”，而是一个被学术界称为**“AI幻觉”**的现象。

最近，清华大学发布了一份重磅研究报告——《基于政府与监管来源核验的机制、风险、治理与抑制幻觉工程研究》，深度剖析了这个问题。今天，我们就用最通俗的方式，把这134页报告的核心干货讲给你听。

01 什么是AI幻觉？不只是“说错话”那么简单

先来个直观感受：你问AI“《红楼梦》里林黛玉最后说了什么”，它可能给你一段声情并茂的遗言——但原著里根本没这段。

这，就是AI幻觉。

但报告告诉我们，幻觉远不止“事实错误”这么简单。美国国家标准与技术研究院（NIST）甚至专门用了一个词——confabulation（虚构），来形容这种现象。这个词原本是用来描述某些脑损伤患者“自信地讲述从未发生的事”的症状。

💡 专业解读：生成式AI的本质是“根据上文预测最可能的下文”，它追求的是语言流畅，而不是事实正确。所以当它不知道答案时，它会用最像真的方式“编”一个出来。

报告的犀利判断是：

• ❌ 真正的分水岭不是“会不会用AI”，而是“能不能驾驭AI”
• ⚠️ 目标不应该是“零幻觉”，而应该是可识别、可约束、可追责

02 六种幻觉，总有一种坑过你

报告把幻觉分成了六类，看完你会发现，几乎每一种我们都遇到过：

类型一：事实性幻觉

直接编造不存在的事实、数字、事件。比如AI告诉你“2024年某地发生了7.8级地震”，但这事儿根本没发生过。

类型二：引用性幻觉（最危险！）

伪造法条、判例、论文、链接。想象一下：你用AI写论文，它给你编了一篇不存在的文献，你直接引用——这在学术界等于学术不端！

类型三：语境性幻觉

脱离上下文回答问题。比如你问“他后来怎么样了”，AI忘了“他”是谁，开始自由发挥。

类型四：逻辑性幻觉

推理链条断裂。A推不出B，但AI自信地说“所以B成立”。

类型五：行动性幻觉

AI不仅说错，还做错。调用错的工具、传错参数、误触发流程——这在智能代理（agent）场景中尤其可怕。

类型六：遗漏性幻觉

过度保守，该回答的不回答，该提醒的不提醒。

💡 专业解读：前两种最容易发现，但后四种在业务场景中危害更大。真正成熟的治理，不是只盯着“说没说实话”，而是看“做没做对事”。

03 为什么AI会胡说八道？五个根因揭秘

报告从技术层面拆解了AI幻觉的五大“病根”：

根因一：它就是靠“猜”的

大模型的本质是一个统计语言模型。它不连接任何“事实数据库”，只根据概率生成下一个词。当知识出现空白，它就用语言概率去填补——能说下去就行，对不对不重要。

根因二：专业边界知识太薄弱

通用模型更擅长“平均化知识”。你问它“怎么做红烧肉”，它能答。但如果你问一个最新的地方性法规、公司内部流程、某个专业领域的细节——它就容易翻车。

根因三：你没有教它“说不知道”

很多AI系统没有设计拒答逻辑。模型的默认目标是“必须回答”，所以哪怕不知道，它也会硬编一个。很多幻觉，其实是系统设计问题，不是模型“故意的”。

根因四：组织太追求“完整感”

产品经理希望AI“看起来聪明、无所不知”，于是给模型的压力是“尽量回答，别拒答”。结果就是：宁可说错，也不能说不知道。

根因五：速度优先于准确

越快响应，留给事实核验的时间越少。实时对话场景中，幻觉率天然高于深思熟虑的场景。

04 权威品牌，反而是风险放大器？

报告提出了一个非常反直觉的发现：

越权威的品牌，越容易放大AI幻觉的风险。

这是什么意思？

英国政府在测试GOV.UK Chat（一个基于政府网站信息的AI助手）时发现了一个诡异现象：

• 用户满意度并不低，近70%的人觉得回答有用
• 但官方同时观察到了若干幻觉案例

问题出在哪？用户因为信任GOV.UK这个品牌，天然认为AI说的就是官方信息，不会去核验。

报告警告：公共服务、医院、高校、金融机构等权威界面，比普通聊天场景更需要显性护栏。

💡 专业解读：这其实是一个认知心理学问题——人更容易相信“会说话的系统”，而不是“会举证的系实”。语言越流畅、语气越笃定，用户越容易把“表达质量”误判为“事实质量”。

05 真实案例：当AI幻觉进入医疗、法律和政府

案例一：GOV.UK Chat的“体验-准确分叉”

用户觉得好用，但官方发现AI会编造不存在的政府服务。品牌信任反而让用户失去了警惕。

案例二：美国联邦机构AI用例一年增长9倍

从2023年的32个，飙升到2024年的282个。61%集中在“写、读、搜、总、跟踪”等日常流程。报告警告：采用加速而治理滞后，幻觉就会从试验风险变成运营风险。

案例三：FDA的医疗警示

美国FDA指出，生成式AI在医疗中潜力巨大，但一旦输出边界不清，会增加监管困难。FDA官员表示，已授权超过1200个AI-enabled医疗设备——AI医疗已进入规模化监管阶段。

案例四：MHRA的临床问答权衡

英国药品和健康产品管理局的测试显示：

• 加入RAG（检索增强生成）和强护栏后，重大幻觉显著降低
• 但同时，拒答率和遗漏率上升了

这意味着一个痛苦的权衡：更安全 = 更保守 = 可能错过关键信息。

报告的结论很清醒：压低幻觉率，不自动等于提升系统有效性。 高风险场景应该容忍更多拒答，低风险创意场景可以容忍更高自由度。

06 怎么办？清华给出“六层抑幻觉工程”

报告没有停留在问题层面，而是给出了一套可落地的六层治理栈：

第一层：任务分级

先问自己：这个任务的后果风险有多高？

• 健康/安全？→ 最高护栏
• 财务/合规？→ 高护栏
• 创意/草稿？→ 可以宽松

第二层：知识锚定

用RAG把AI的回答“锚定”在权威知识源上。先检索，再生成，保留原始片段证据。

第三层：生成约束

允许拒答，是一项核心能力。 一个不能承认自己不知道的系统，必然会用语言去填补空白。

第四层：验证校正

对高风险输出做事实校验、引用核对、规则匹配。正式材料要求“关键事实必须能回链到原始来源”。

第五层：上线监控与日志

记录每一次AI输出，建立抽检、复盘、红队测试流程。

第六层：责任治理

明确“谁审、审什么、如何升级、如何留痕”。让每一次幻觉事件都能被解释、被归因、被修正。

07 行动路线图：30-60-90天

报告贴心地给出了时间表：

30天：识别最危险的任务。问自己：如果AI在这里说错话，后果是什么？

60天：补上知识锚定与拒答机制。让AI学会说“我不确定”。

90天：把人工复核和日志做成制度。明确责任，建立闭环。

写在最后：真正的分水岭

这份报告最打动我的一句话是：

未来真正有竞争力的组织，不是让模型看起来无所不知，而是让模型在不知道时停下来、在高风险时退后一步。

AI幻觉，本质上不是技术问题，而是系统问题。它考验的不是模型参数有多大，而是组织有没有能力设计好任务边界、知识锚点、人工复核和责任链条。

当证据、流程、审计与责任被同时嵌入，我们才算从“会用大模型”迈向“驾驭生成式AI”。

希望这篇文章能帮你更清醒地看待AI的“自信”。下次AI再给你一个完美答案时，不妨多问一句：“你的依据是什么？”

本文核心观点来自清华大学《AI幻觉深度研究报告：基于政府与监管来源核验的机制、风险、治理与抑制幻觉工程研究》。解读仅供参考，建议阅读原文全文。

📌 欢迎点赞、在看、转发三连，让更多人了解AI幻觉的风险与治理！

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

☝

篇幅有限，部分展示
加入会员，任意下载
资料下载方式

Download method of report materials
关注公众号后回复：HJ260520
即可领取完整版资料

荐：
【中国风动漫】《姜子牙》刷屏背后，藏着中国动画100年内幕！
【中国风动漫】除了《哪吒》，这些良心国产动画也应该被更多人知道！

【中国风动漫】《雾山五行》大火，却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折！

如需获取更多报告

扫码加入

“人工智能产业链联盟”

知识星球，任意下载相关报告！

报告部分截图

声明

来源：清华大学，人工智能产业链union（ID:aiyuexingqiu）推荐阅读，不代表人工智能产业链union立场，转载请注明，如涉及作品版权问题，请联系我们删除或做相关处理！

编辑：Zero

文末福利

1.赠送800G人工智能资源。

获取方式：关注本公众号，回复“人工智能”。

2.「超级公开课NVIDIA专场」免费下载

获取方式：关注本公众号，回复“公开课”。

3.免费微信交流群：

人工智能行业研究报告分享群、

人工智能知识分享群、

智能机器人交流论坛、

人工智能厂家交流群、

AI产业链服务交流群、

STEAM创客教育交流群、

人工智能技术论坛、

人工智能未来发展论坛、

AI企业家交流俱乐部

雄安企业家交流俱乐部

细分领域交流群：

【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能＆物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】

入群方式：关注本公众号，回复“入群”

戳“阅读原文”下载报告。

分享

【报告】清华大学《AI幻觉深度研究报告》：别被AI的“自信”骗了！这3个真相太扎心（附PDF下载）