关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02463人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

火锅进入“70元时代”,品牌靠什么赚钱?

虎嗅APP 浏览 452 09-11

岁月不败美人,42岁的安妮·海瑟薇比20岁的她更好看

LinkFashion 浏览 8470 07-30

能否复刻N7的成功?日产N6申报图现身

Nice好车 浏览 397 10-10

混乱、内耗、丑闻:Meta考虑向Google、OpenAI低头

机器之心Pro 浏览 483 09-01

68岁独居老人为"干儿子"贷款85万 家中还堆满了保健品

红星新闻 浏览 9630 07-10

世间只此一次,《西厢记》4K默片配乐来了!

幕味儿 浏览 350 10-20

8月19日外媒科学网站摘要:科学家发现黄金在极端加热下并未熔化,或影响核聚变研究

网易科技报道 浏览 567 08-20

推广中奖名单-更新至2025年6月5日推广

黎贝卡的异想世界 浏览 4879 06-21

京东外卖全职骑手突破15万,人均缴金约2000元/月

第一财经资讯 浏览 512 08-19

从AI手术机器人到虚拟圆明园,2025服贸会前沿科技抢先看!

文汇报 浏览 409 09-10

美俄元首会谈地"全副武装" 数百特工入驻

红星新闻 浏览 515 08-16

苹果发布iOS 26开发者预览版Beta 6:液态玻璃、动效加强

快科技 浏览 3651 08-12

记者:博洛尼亚100万欧租借费+700万买断报价米兰中场波贝加

懂球帝 浏览 1324 07-18

伊姐周日热推:电视剧《重影》;电视剧《山河枕》......

伊周潮流 浏览 267 10-27

S妈具俊晔联手为大S而战,申请参与大S起诉张兰案

开开森森 浏览 409 09-07

“国民基金经理”王登峰内部调岗至贝莱德基金,任首席资金官

21金融圈 浏览 515 08-20

大S的墓碑刻字“永远在一起”,墓地前的草坪已经被踩变颜色

素素娱乐 浏览 424 09-09

曼联官方:召回小将惠特利,为北安普顿出场25次打进3球

懂球帝 浏览 271 01-13

神秘BE10000 Pro路由器现身小米之家:4个2.5GbE接口+双万兆接口

IT之家 浏览 392 09-21

中国驻日本大使馆提醒在日中国公民防范自然灾害

环球网资讯 浏览 10077 07-05

李连杰因甲亢住院,病床照曝光表情痛苦,好友晒聊天记录报平安

扒虾侃娱 浏览 487 08-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11