关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2026-02-02 12:00:01265人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

天花板砸落致17岁店员身亡,茉莉奶白回应!所在商场曾被罚款……

国际金融报 浏览 568 08-19

中国银行原副行长林景臻被查,今年1月辞任,后一度被传失联

红星资本局 浏览 443 09-10

国货统治全球:正在爆发的AI硬件市场

诗与星空 浏览 299 01-18

美股芯片股深夜狂飙,英伟达涨超6%,ARM、美光科技、闪迪创新高

21世纪经济报道 浏览 64 06-02

美日印澳4国大使北京会谈 不到24小时印度向中国示好

南宫一二 浏览 280 01-02

动物纹回潮,那很狂野了

时尚COSMO 浏览 286 01-11

小儿子拜师少林寺 邹市明称3个儿子没有一个子承父业

环球网资讯 浏览 362 10-31

今日热点:ador或将拒绝newjeans另外三人回归#;徐晟津就星辰大海睡觉道歉……

伊周潮流 浏览 288 11-15

“假发大王”瑞贝卡被立案,4月底才因相关问题被行政监管

每日经济新闻 浏览 1510 07-26

世运会非奥项目“破圈” 小众运动激活体育新消费

中国商报 浏览 6071 08-10

今年春天最美搭配:西装+半裙,怎么穿都好看!

LinkFashion 浏览 221 02-26

德容:梅西曾是我的偶像,对我来说他是史上最佳

懂球帝 浏览 379 10-18

温州鞋王急抛百亿疫苗帝国

网易财经 浏览 2058 07-18

跳票八年,特斯拉Roadster仍在路上

爱范儿 浏览 8866 07-30

美职联本轮最佳阵:孙兴慜连续第二周入选,山根视来在列

懂球帝 浏览 488 08-26

赵睿:小组赛结束了一切都从零开始,淘汰赛大家要更加专注

懂球帝 浏览 8931 08-10

俄军在苏梅、库皮扬斯克、红军城三线突破

浏览 1856 07-14

我没疯!赵露思直播自证清白,4亿违约金压顶,她能逆天翻盘么?

梦涵影娱 浏览 1234 08-05

北京送走周琦陈盈骏范子铭之一才能引进赵睿 新疆去年追过陈盈骏

直播吧 浏览 490 08-26

天猫上线空调国补专场 宣布启动“南空北调”

网易科技报道 浏览 4758 07-18

十年间 火箭军武器装备实现跨越式发展

环球网资讯 浏览 263 12-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11