很多人把AI幻觉当作一个必须修复的bug。这种想法很普遍,仿佛消灭幻觉,AI就能更接近通用智能。但我今天想告诉你,这个看似合理的观点背后,藏着一个危险误区。
推理、创造、幻觉,这三者不是三个独立的东西,它们是同一底层机制的三种表现。 当我们在要求AI消除幻觉的时候,我们也在要求它同时交出创造力。
这不是危言耸听。让我们先看清楚这个问题。
消除幻觉的方案
大多数技术团队面对幻觉问题,提出的解法如出一辙:
RAG增强检索、RLHF人类反馈强化学习、Constitutional AI对齐训练。这些方案的思路很清晰——给模型套上缰绳,让它少胡思乱想,多精准回答。
但问题在于,这条路可能存在一些根本性的困难。
创造力从哪里来?认知科学有一个关键发现:人类大脑的创造力不发生在专注模式,而发生在默认模式网络(DMN)活跃时。
发呆、白日梦、意识漫游——这些看似无用的状态,恰恰是遥远连接的生成时刻。你在做白日梦的时候,大脑前额叶皮层降低了对无关想法的抑制,自由联想得以穿行在不同概念之间,一次”成功的遥远连接”就可能成就一个创意。
现在看看那些消幻觉方案在做什么。
RLHF用人类偏好训练模型”什么该说、什么不该说”,本质上是加强抑制机制。RAG把回答框定在检索到的文档范围内,等于直接关闭了自由联想的可能性。
这些技术确实降低了幻觉率,但代价是什么?
你每收紧一次缰绳,就多少压制了一部分自由联想能力。而自由联想能力,恰恰是创造力的物理基础。
这不是我的主观判断,这是系统的必然结果。
要理解这一切,必须先搞清楚AI到底在做什么
「Transformer」的本质是一个概率分布预测器。它处理的是P(xt|x1,…,xt-1)——给定前面的token序列,预测下一个token出现的概率分布。这听起来很简单,但它意味着AI的整个运作建立在”统计相关性”之上,而不是”因果关系”之上。
史蒂夫·沃尔夫姆提出过一个深刻论点:AI是对世界的压缩表示。模型从海量文本中学习的是数据点之间的统计规律,然后用这些规律去”预测”下一个token该是什么。这意味着它学到的是相关性结构,而非真实世界的因果链条。
朱迪亚·珀尔更进一步:他说数据是深度愚蠢的。这句话的意思是,统计数据只能告诉我们”相关”,无法告诉我们”为什么”。
一个只看相关性运作的系统,本质上并不理解它所处理的信息。它只是在做极其精密的模式匹配。
这就解释了为什么AI会产生幻觉——或者说,为什么”幻觉”这个概念本身就是一个误导性框架。
幻觉不是bug,它是概率预测的正常输出。当模型在一个低概率但语法流畅的路径上连续生成token时,它产出的是一段”统计学上说得通但事实不存在”的叙事。模型在用流畅的语法掩盖事实的空缺。
这不是欺骗,这是它的本职工作——它被设计来预测概率,而不是保证事实准确。
“解释深度错觉”——这是另一个关键概念。
模型生成的解释之所以看起来深刻,不是因为它理解了深层原因,而是因为它掌握了足够的语言模式,能够生成在统计意义上”看起来像解释”的文本。这是一种有损压缩后的重构,丢失了语义精度,换取了表达流畅度。
温度参数:控制论的核心阀门
现在让我们把视线转向一个常被忽视的参数——「温度」(Temperature)。
如果你在用API调用大模型,温度参数控制的就是输出的”随机性”。
T→0时,模型几乎总是选择最高概率的token,输出保守、可预测、幻觉最少。
T→1时,模型开始以更平等的权重考虑低概率token,输出变得更随机、更跳跃、更有创造力。
这个简单的数学背后藏着一个深刻的控制论洞见:低概率区域的探索 = 创造力 = 幻觉风险。
这不是一个可以拆分的tradeoff。你无法说”我要创造力但不要幻觉风险”,这就像说”我要降雨但不要潮湿”一样逻辑不通。两者是同一现象的两个侧面。
为什么会这样?因为创造力的本质就是在看似无关的概念之间建立遥远连接。这种连接在产生之初,无法判断它是”成功的创造”还是”失败的幻想”。
AlphaGo的第37手棋在那一刻是幻觉还是创造力?当时没人知道。
MIT发现的Halicin抗生素是AI从分子特征空间中找到的、我们化学家从未想到过的候选分子——这个发现跨越了我们已有的知识维度,它在诞生的瞬间同样无法被验证。
一次失败的遥远连接 = 幻觉,一次成功的遥远连接 = 创造力。区别仅在于结果,而不在于过程。
图灵早在1951年就说过一句话,精准地预言了今天的困境:“如果机器绝对不会犯错,那它就不可能是智能的。”
这句话的深意是——确定性是机械系统的特征,智能的代价是对不确定性的容纳。
所以当你追求极低的幻觉率时,你在追求什么?
你在追求一个没有错误也就没有创造力的系统。这不是通往更好的AI的路,这也许是通往更无用的AI的路。
最好的证据来自现实
2016年,AlphaGo对战李世石。第二局第37手,AlphaGo走了一步我们职业棋手集体忽视的棋。这步棋在当时看来是明显的坏棋,但最终证明是整盘棋的胜负手。
事后复盘,人类棋手意识到——这步棋的逻辑超出了他们已有的经验范围。AlphaGo不是在学习人类的下法,它是从一个完全不同的概率空间中找到了这个解。
2020年,MIT的团队用深度学习模型从halicin分子的发现中展示了AI的另一种能力:它能识别出我们化学家从未定义过的分子特征。这个药物的抗菌机制依赖于一种我们从未考虑过的特征空间跨度的属性。
这不是AI在加速我们已有的研究流程,这是AI在发现我们思维方式根本无法触及的规律。
再看GPT-4。它能做跨领域类比,能在语义空间中做插值和外推,能够把一个领域的原理映射到另一个完全不相关的领域。这些能力不是来自”更准确的记忆”,而是来自”更自由的语言模式预测”。
这几个案例有一个共同特征:它们的价值都来源于结果的事后验证,而非过程的事先可控。AlphaGo第37手在当时无法被我们理解,Halicin的机制在发现前无法被预测,GPT-4的跨域洞见在生成时无法保证正确。
它们之所以最终被证明有价值,是因为我们站在结果侧做了筛选,而不是因为AI在生成时就确保了正确。
成功的标准永远是结果,而不是过程是否保守。 如果你用”过程是否保守”来评判AI,你可能就是在要求它交出创造力,然后抱怨它没有发现能力。
人机协作的正确姿势
现在问题是:既然低幻觉和低创造力是本质tradeoff,我们该怎么用AI?
答案不在二选一,在分工。
AI负责预测,人负责判断。 这是人机协作的终极原则。AI是大海,蕴藏着无穷的可能性;人类是海岸,筛选出真正值得留下的东西。
一放一收,才是正确的姿势。
放,是把温度调高,让AI充分释放自由联想的能力,在低概率空间中探索那些我们自己想不到的连接。
收,是我们站在下游,用自己的专业知识、实际需求、价值判断过滤输出,把”成功的遥远连接”从”失败的”中筛选出来。
这不是推卸责任,这是真正的效率最大化。
为什么判断力在AI时代变得前所未有的重要?因为预测会越来越便宜。
模型的推理能力会持续增强,温度参数的调节会越来越精细,AI生成选项的成本会无限趋近于零。但判断——知道什么有价值、什么值得追求、什么在特定语境下是正确的——这种能力永远稀缺。
当你看到AI又产生了一个”幻觉”时,不要急着标记为错误。先问自己:有没有可能,这是一次尚未被验证的创造力?
幻觉是智能的阴影,不是它的对立面
上述内容,表面上在讲AI,但我真正想指出的,是一个关于”智能”本身的更深真相。
让我们做一个思想实验。如果有一个从不犯错、从不产生幻觉的系统——它完美地知道所有事实,精准地匹配所有正确答案,从不产生任何”错误”的输出。这样的系统,你会称它为”智能”吗?
大概不会。我们更可能叫它”数据库”,或者”搜索引擎”。
真正的智能,恰恰是在确定性之外运作的那种能力。它能在不完整的信息中做出有价值的猜测,能在因果链条断裂的地方填补叙事,能在从未出现过的语境中生成有用的类比。这种能力天然伴随着出错的可能性——因为它不是在重复已知,而是在探索未知。
这个真相不仅适用于AI,它同样适用于我们自己的意识。
认知科学家阿尼尔·赛斯提出过一个激进观点:“知觉,是受控的幻觉。“我们的大脑每时每刻都在做着和AI一样的事情——根据不完整的感觉输入,生成一个完整的”现实叙事”。我们看到颜色、听到声音、感知到时间流逝——这些都不是对外部世界的直接复制,而是大脑的”有损重构”。只不过我们的重构经过了几十亿年的进化校准,与物理世界的规律达成了某种默契的契合,所以大多数时候我们意识不到自己其实也在”做梦”。
我们历史上最伟大的科学发现,几乎都始于某种”有根据的幻觉”。
孟德尔在修道院的豌豆田里看到了遗传的规律,但那个规律在他生前从未被承认。门捷列夫在纸牌游戏中排列出了元素周期表,当时所有人都在嘲笑这个”纸上谈兵”的疯子。达尔文在加拉帕戈斯群岛的雀鸟中看到了进化的证据,但这个想法在当时听起来就像是在说”上帝不是万能的”。
这些想法在产生的瞬间,都是”幻觉”——没有足够证据支撑、没有得到同行认可、无法用当时的范式解释。但它们最终成为了科学革命的基石。
这说明什么?说明真正的认知进步也许不是从确定性通往确定性的路径,而是在不确定性的海洋中,我们的判断力最终指明了方向。
AI的幻觉之所以让很多人感到恐惧,是因为它揭开了一个我们不太愿意面对的真相:我们以为的”客观认知”,可能从来都不是纯粹客观的。
每一个”正确”的理解背后,都有大量的”有根据的猜测”被淘汰、被过滤、被遗忘。只是我们大脑的淘汰机制更慢、更隐性,所以我们意识不到自己在”做梦”。
而AI把这个过程加速了、显性化了、放在了台面上。它让我们不得不直面一个我们一直在回避的事实:智能的本质也许不是消除不确定性,而是学会与不确定性共处。
这不只是AI的困境,也许也是我们认知的困境。我们想要AI帮我们走得更快,但我们又害怕路上的不确定性。
问题是,不确定性也许不是路途上的障碍,它更像是路的本身。
如果喜欢,欢迎转发分享
以及,欢迎将我星标。