关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2026-02-02 12:00:01260人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全球数百美军高级将领突然被召回 特朗普发声

环球网资讯 浏览 407 09-26

演技炸裂,今年奥斯卡影帝,直接给他得了

独立鱼 浏览 251 02-04

博主:刘军在江苏任职期间和周军关系很好,两人相互接盘球员

懂球帝 浏览 9134 07-30

两部门征求意见:辅助驾驶不能当自动驾驶

央视新闻客户端 浏览 5646 08-14

上海集成电路产业版图再落一子,长电科技今天在沪投产

上观新闻 浏览 227 03-11

12度小酒+威士忌,“低度酒之王”业绩失速能解吗?

尺度商业 浏览 7763 08-10

致敬经典,夏威夷一画家在涂鸦墙画出科比08奥运噤声庆祝造型

懂球帝 浏览 456 08-26

TA:布莱顿后卫卡欣将租借加盟伯明翰,为期一个赛季

懂球帝 浏览 1730 07-25

突传大消息!超级反转,来袭?

券商中国 浏览 527 08-11

女人年纪大了,千万别穿紧身裤和运动鞋,这样打扮更高级得体

静儿时尚达人 浏览 2189 07-31

汪东城回应不结婚:曾以结婚目的交往,却在不知情下当“第三者”

扒虾侃娱 浏览 10682 07-24

巴萨将发布国家德比特别版球衣,致敬2005年客场3-0战胜皇马

直播吧 浏览 1665 07-29

媒体:华盛顿一声枪响后 美英两个老人握手较劲八秒

新民周刊 浏览 137 04-29

美媒评21世纪七大奖项:詹姆斯获三项大奖 马刺成员赢得其余四项

罗说NBA 浏览 433 08-20

孙宏斌逃出生天

创业家 浏览 332 10-28

百亿量化先锋信弘天禾:AI驱动,管理赋能,勇夺多个榜单第一!

私募排排网 浏览 7663 08-07

特朗普突然抛出30%的关税 被逼入墙角的欧盟又"软"了

澎湃新闻 浏览 2791 07-15

媒体人:新赛季CBA俱乐部杯计划特邀四支NBL球队参加

懂球帝 浏览 455 09-09

更换平面化设计 马自达全新品牌LOGO发布

车质网 浏览 277 11-03

最新公告!恒泰证券正式更名为金融街证券

券商中国 浏览 451 09-10

冯琳:直言“主持人这碗饭其实不那么稳定”

晓今娱 浏览 3485 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11