关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者2026-02-04 00:00:01265人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普到访美联储总部 要求鲍威尔降息

财联社 浏览 6539 07-25

高管减持、股东跑路、产品爆炸:上市公司的“中年危机”

诗与星空 浏览 390 10-16

哥伦比亚媒体:利物浦、曼城、尤文关注29岁水晶宫后卫穆尼奥斯

直播吧 浏览 1029 07-22

37岁董晴能意外翻红,因为踩中了“隐形规则”

简读视觉 浏览 1292 07-17

福特领睿心动版上市 国补后售8.38万元/配备8155芯片

太平洋汽车 浏览 526 06-02

监管重锤4200万!上海银行内控“黑洞”为何补不上

闺蜜财经 浏览 5258 08-11

"被家暴16次"女子:前婆婆被撤销上诉 对方应返还91万

扬子晚报 浏览 2435 07-18

林心如回应陈妍希想让小海豚当儿媳妇

扒虾侃娱 浏览 370 10-02

申花2战柔佛全败!亚冠客场5年不胜,东亚区排第10,延续4魔咒

奥拜尔 浏览 297 11-06

杜兰特谈28年洛杉矶奥运会:很乐意参加,必须保持高水平状态

懂球帝 浏览 248 02-24

次节觉醒,杨瀚森半场8中3得9分6板1助3帽3失误,正负值-3

懂球帝 浏览 297 11-17

全新岚图知音8月底正式上市,配置基本封顶,预售价22万起

SUV大百科 浏览 456 08-15

完成阿森纳一线队首秀,15岁小将道曼:很自豪,这才刚刚开始

懂球帝 浏览 9040 07-26

吉利全球全域安全中心发布 领克900完成碰撞测试

太平洋汽车 浏览 215 12-14

智己LS8官图发布:5米车长增程动力 理想L8怕了吗

大李说车 浏览 254 01-25

俄罗斯:西方派往乌克兰的士兵都是"合法打击目标"

看看新闻Knews 浏览 239 01-12

东方甄选登记卫生巾作品著作权

大象新闻 浏览 9237 07-28

3岁女童被生父及其情人虐死 生父被判无期

极目新闻 浏览 554 08-23

一起复出?美记:绿军愿给利拉德多年合同 塔图姆一直积极招募他

直播吧 浏览 2356 07-14

索尼计划出售通信芯片部门:价值3亿美元,半导体重点放在图像传感器领域

超能网 浏览 5575 07-30

什克:穆里尼奥是伟大的教练;如果薪水合适我当时会留在国米

懂球帝 浏览 439 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11