关闭广告

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者2026-01-23 00:00:01279人阅读


当你向ChatGPT询问某位哲学家的出生日期时,它总是信心满满地给出答案,哪怕这个答案完全错误。这种现象被研究者称为「幻觉」,就像AI患了妄想症,总是编造一些听起来很有道理但实际上完全错误的信息。来自加州圣迭戈RA软件公司的理查德·阿克曼和保加利亚索菲亚大学的西蒙·埃马努伊洛夫在2025年发表的这项研究,提出了一个革命性的解决方案——「许可证神谕」系统。

这项研究发表在2025年的学术期刊上,研究者通过设计一种全新的架构,让AI在回答问题前必须先检验自己的答案是否正确,就像给AI装上了一个严格的「事实核查员」。研究团队在实验中取得了惊人的成果:传统方法只能达到56.7%的准确判断率,而他们的系统达到了完美的100%准确率,完全消除了虚假答案的产生。

研究者首先深入分析了AI产生幻觉的根本原因。在他们之前发表的研究《大型语言模型是如何被设计来产生幻觉的》中,研究团队指出,这个问题并非来自训练数据不足或模型调优不当,而是源于变换器架构本身的局限性。变换器模型就像一个只会模仿的学生,它能够生成语法正确、听起来合理的句子,但缺乏验证这些句子是否符合事实的能力。研究者将这种现象比作「平面语义空间」,在这个空间中

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

法国空中交通管制员罢工 30万旅客受影响

极目新闻 浏览 2289 07-04

10万元内搭载激光雷达智驾,长安启源全新Q05头一个

帮宁工作室 浏览 264 11-25

15.8万全尺寸人形抱回家!逐际动力让具身机器人也有经济适用款

量子位 浏览 4520 07-31

微博寻夫4年后,丽人丽妆“前老板娘”收1.7亿分手费成股东!

野马财经 浏览 481 08-23

在OpenAI工作,是一种怎样的体验?

华尔街见闻官方 浏览 1874 07-17

超300倍就清零!超高位科技股突然暴跌,中芯国际重挫7%

深蓝财经 浏览 363 10-11

美联储分歧又现:有人称关税对通胀影响不会持久,有人预计影响到明年

华尔街见闻官方 浏览 10672 07-11

白宫:10万美元的新H-1B签证费不适用于现有持有人

参考消息 浏览 401 09-21

WAIC首日,这些AI领域的重磅嘉宾们传递出哪些信号?

国际金融报 浏览 5352 07-27

“无人机风波”下俄白启动联合军演

环球网资讯 浏览 435 09-12

里沙利松:踢日本要展现出与踢韩国一样的强度

懂球帝 浏览 330 10-14

"吉林一号"拍台湾影像 岛内:影像越清晰"斩首"越精准

澎湃新闻 浏览 311 11-09

全员交社保了,奶茶店会不会迎来大面积倒闭潮?

快刀财经 浏览 5067 08-10

轴距加长 广汽丰田雷凌L上市售12.98万起

网易汽车 浏览 260 12-24

男子半夜经常听到楼上怪声:屋里没人居住 持续半年多

极目新闻 浏览 470 09-26

男网又一35岁老将退役,德约科维奇动情告别老友

网球之家 浏览 9566 07-29

珍酒李渡亮3招缓压,吴向东能否坐稳“贵州首富”?

密探财经 浏览 446 09-11

《小城大事》大结局:李秋萍和杜涛的缘,在月海续写上且圆满

肆季娱乐 浏览 309 01-20

从灶台到屏幕:一位餐饮老炮的抖音破局之路

餐饮老板内参 浏览 533 08-26

萧华让没钱球迷看集锦!美网友炸锅:要么掏钱 要么吃残羹剩饭?

直播吧 浏览 382 09-11

桂林银行网点开到居民家里?

财经众议院 浏览 238 02-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11