大模型幻觉检测与应对实战

01

幻觉的分类：事实性 vs 忠实性

事实性幻觉：模型生成的内容与客观世界事实不符（如瞎编历史）。
忠实性幻觉：模型生成的内容与用户提供的上下文不符（如无视用户给定的材料）。

基础概念

💡 课堂演示：糖尿病与蜂蜜案例（PPT P8）

📝 提示词测试区

🍎 事实性测试 (开放提问) 📑 忠实性测试 (给定材料偏题)

💡 PPT解析：这是一个经典案例。蜂蜜虽然天然，但含有大量果糖和葡萄糖，会升高血糖水平，不适合糖尿病患者代替糖使用。看看大模型是否会一本正经地得出错误结论。

🌡️ 温度 0.7

🤖 模型输出

点击运行，观察模型是否产生事实性偏差...

02

幻觉高发场景：逻辑陷阱与虚构事实

大模型是概率驱动的“文字接龙”机器，当面临带有预设陷阱的问题，或者超出自身知识边界（如长尾小说细节）时，极易顺着用户的逻辑进行合理化瞎编。

陷阱评测

💡 课堂演示：PPT核心错误评测复现（P14-P16）

📝 诱发型提示词

📖 虚构事件：李逵大闹五台山 🪤 逻辑陷阱：小明见钱眼开 🎵 常识错误：百鸟朝凤歌词

💡 PPT解析：《水浒传》中大闹五台山的是鲁智深，不是李逵。这是典型的“虚构事件”诱导陷阱。如果不开启深度推理，模型很容易顺着“李逵”的人设顺水推舟进行瞎编。

🌡️ 温度 0.5

🤖 模型输出

观察模型是识破陷阱，还是顺水推舟开始胡说八道...

03

应对幻觉方案一：知识与时空锚定

通过提示词工程，为大模型设定严格的参考系（时空维度、专业身份、数据来源），一旦信息不确凿，强制要求大模型承认“不知道”，而不是硬凑答案。

提示词工程

💡 课堂演示：添加约束降低虚构可能性（PPT P22）

📝 约束型提示词

⚕️ 知识锚定 (医疗/药典) ⏳ 时间锚定 (规避未来虚构) 📊 置信度声明 (添加[推测]标签)

💡 PPT解析：这里组合了「专业限定」、「知识库限定」和「免责声明」三种策略。强行压制了大模型讨好用户、随意猜测的天性。

🌡️ 温度 (严谨场景设为0.1) 0.1

🤖 模型输出

观察严谨约束下的模型表现...

04

应对幻觉方案二：反事实与链式验证

强制暴露推理的脆弱点。让模型不仅仅给出答案，而是自我生成“反事实检查”和“验证链条”，通过大模型自我审查来挤出幻觉水分。

深度思考

💡 课堂演示：自我审查的 Prompt 模板（PPT P23）

📝 交叉验证提示词

🔍 反事实机制 (暴露错误路径) 🔗 链式验证 (要求列出三大权威数据源)

💡 PPT解析：植入反幻觉检测机制。通过要求模型写出“反事实检查”，强迫其检索对立面信息，从而打破盲目自信（自我证实偏差）。

🌡️ 温度 0.3

🤖 模型输出

模型将展示它的自我怀疑与验证过程...

05

幻觉的正面价值：技术缺陷转为创新引擎

正如 DeepSeek R1 所言：“幻觉像一面棱镜，与其追求绝对正确，不如学会与AI的想象力共舞。”在蛋白质设计、文艺创作、游戏开发等领域，幻觉恰恰是突破人类思维定式的“超现实引擎”。

价值翻转

💡 课堂演示：拥抱幻觉的创造力（PPT P27-P31）

📝 激发幻觉型提示词

👽 科幻游戏超现实设定 🧬 蛋白质结构“错误”折叠创想 🎨 艺术剧本狂想

💡 PPT解析：大卫·贝克团队正是利用 AI 的“错误折叠”（幻觉）启发了新型蛋白质结构，最终荣获 2024 年诺贝尔化学奖。温度调到最高，享受 AI 的狂想吧！

🌡️ 温度 (创造力拉满！) 0.9

🤖 模型输出

准备好迎接超越常理的惊喜...

直面 AI 幻觉：是系统漏洞，还是创造力源泉？

幻觉的分类：事实性 vs 忠实性

幻觉高发场景：逻辑陷阱与虚构事实

应对幻觉方案一：知识与时空锚定

应对幻觉方案二：反事实与链式验证

幻觉的正面价值：技术缺陷转为创新引擎

直面 AI 幻觉：
是系统漏洞，还是创造力源泉？