关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02374人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

开拓者队记点评杨瀚森:20岁就会指挥交通了 非常好的信号!

直播吧 浏览 3289 07-12

有银行今年降了七次!存款利率又双叒下调

21世纪经济报道 浏览 277 10-21

16个外甥一顿吃200个水饺 重庆"宇宙舅舅"发声

极目新闻 浏览 499 08-28

高考611分女生体检不合格恐无法入学 辽宁省残联回应

极目新闻 浏览 6922 06-26

疑似黄燕铭闭门观点流出:银行接近尾声,创新药或像过去10年新能源

金石随笔 浏览 9200 08-10

今年丢人了……

越女事务所 浏览 355 08-21

“沸腾了”!突破30万,AI、机器人彻底火了!

中国基金报 浏览 6004 07-29

最近最火的,是这只狼?

仙女事件簿 浏览 190 01-18

宋仲基蹭前妻热度失败!新剧收视跌破新低,宣传期频繁提二婚妻子

萌神木木 浏览 238 10-01

摊牌!俄罗斯要放开手脚大干,乌克兰终于变天

浏览 9264 07-14

马斯切拉诺:我们本场比赛被对手压制,我很担心伤病希望尽量避免

直播吧 浏览 814 07-17

罗永浩直播放话:让西贝享受西门子待遇

中国基金报 浏览 309 09-15

驻韩美军一“死神”无人机失控坠海 9月才被部署在朝鲜半岛

红星新闻 浏览 205 11-26

小吧译言家 双10号驾到!库尼亚与姆贝莫将如何重塑曼联战术体系

直播吧 浏览 5550 07-29

女子遭家暴驾车逃跑致丈夫身亡获刑11年 已上诉称无罪

红星新闻 浏览 283 10-31

瓜帅:我一直尊重裁判从未批评他们,但我必须捍卫我的俱乐部

懂球帝 浏览 167 01-28

薛鹤翔:外贸新绿发力,民营“链”动全球,7月外贸数据点评

首席经济学家论坛 浏览 2417 08-09

ESPN:德容已与巴萨就续约达成协议,他的薪水将降低

懂球帝 浏览 244 10-15

北京朝阳国资13年"新房"被抢购 有人半夜就来排队

每日经济新闻 浏览 10044 07-21

诺贝尔委员会拒绝和平奖转让特朗普

环球时报 浏览 206 01-12

济南时报:中国男篮赢沙特为何如此艰难?明日对阵印度队不可大意

直播吧 浏览 4251 08-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11