01
幻觉的分类:事实性 vs 忠实性
事实性幻觉:模型生成的内容与客观世界事实不符(如瞎编历史)。
忠实性幻觉:模型生成的内容与用户提供的上下文不符(如无视用户给定的材料)。
基础概念
💡 课堂演示:糖尿病与蜂蜜案例(PPT P8)
📝 提示词测试区
🍎 事实性测试 (开放提问)
📑 忠实性测试 (给定材料偏题)
💡 PPT解析:这是一个经典案例。蜂蜜虽然天然,但含有大量果糖和葡萄糖,会升高血糖水平,不适合糖尿病患者代替糖使用。看看大模型是否会一本正经地得出错误结论。
🌡️ 温度 0.7
🤖 模型输出
点击运行,观察模型是否产生事实性偏差...
02
幻觉高发场景:逻辑陷阱与虚构事实
大模型是概率驱动的“文字接龙”机器,当面临带有预设陷阱的问题,或者超出自身知识边界(如长尾小说细节)时,极易顺着用户的逻辑进行合理化瞎编。
陷阱评测
💡 课堂演示:PPT核心错误评测复现(P14-P16)
📝 诱发型提示词
📖 虚构事件:李逵大闹五台山
🪤 逻辑陷阱:小明见钱眼开
🎵 常识错误:百鸟朝凤歌词
💡 PPT解析:《水浒传》中大闹五台山的是鲁智深,不是李逵。这是典型的“虚构事件”诱导陷阱。如果不开启深度推理,模型很容易顺着“李逵”的人设顺水推舟进行瞎编。
🌡️ 温度 0.5
🤖 模型输出
观察模型是识破陷阱,还是顺水推舟开始胡说八道...
03
应对幻觉方案一:知识与时空锚定
通过提示词工程,为大模型设定严格的参考系(时空维度、专业身份、数据来源),一旦信息不确凿,强制要求大模型承认“不知道”,而不是硬凑答案。
提示词工程
💡 课堂演示:添加约束降低虚构可能性(PPT P22)
📝 约束型提示词
⚕️ 知识锚定 (医疗/药典)
⏳ 时间锚定 (规避未来虚构)
📊 置信度声明 (添加[推测]标签)
💡 PPT解析:这里组合了「专业限定」、「知识库限定」和「免责声明」三种策略。强行压制了大模型讨好用户、随意猜测的天性。
🌡️ 温度 (严谨场景设为0.1) 0.1
🤖 模型输出
观察严谨约束下的模型表现...
04
应对幻觉方案二:反事实与链式验证
强制暴露推理的脆弱点。让模型不仅仅给出答案,而是自我生成“反事实检查”和“验证链条”,通过大模型自我审查来挤出幻觉水分。
深度思考
💡 课堂演示:自我审查的 Prompt 模板(PPT P23)
📝 交叉验证提示词
🔍 反事实机制 (暴露错误路径)
🔗 链式验证 (要求列出三大权威数据源)
💡 PPT解析:植入反幻觉检测机制。通过要求模型写出“反事实检查”,强迫其检索对立面信息,从而打破盲目自信(自我证实偏差)。
🌡️ 温度 0.3
🤖 模型输出
模型将展示它的自我怀疑与验证过程...
05
幻觉的正面价值:技术缺陷转为创新引擎
正如 DeepSeek R1 所言:“幻觉像一面棱镜,与其追求绝对正确,不如学会与AI的想象力共舞。”在蛋白质设计、文艺创作、游戏开发等领域,幻觉恰恰是突破人类思维定式的“超现实引擎”。
价值翻转
💡 课堂演示:拥抱幻觉的创造力(PPT P27-P31)
📝 激发幻觉型提示词
👽 科幻游戏超现实设定
🧬 蛋白质结构“错误”折叠创想
🎨 艺术剧本狂想
💡 PPT解析:大卫·贝克团队正是利用 AI 的“错误折叠”(幻觉)启发了新型蛋白质结构,最终荣获 2024 年诺贝尔化学奖。温度调到最高,享受 AI 的狂想吧!
🌡️ 温度 (创造力拉满!) 0.9
🤖 模型输出
准备好迎接超越常理的惊喜...