关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02462人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深圳南山企业星尘智能携手央视网共同打造人机共演民乐盛宴

南方都市报 浏览 9967 07-30

王家卫录音曝光,内容信息很炸裂

林轻吟 浏览 311 11-01

55岁窦唯已迁居阿那亚,骑电动车,背帆布包

陈意小可爱 浏览 447 09-06

来了!开拓者官方晒杨瀚森入场照

醉卧浮生 浏览 10084 07-13

英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

机器之心Pro 浏览 308 11-05

最新公告!恒泰证券正式更名为金融街证券

券商中国 浏览 452 09-10

基孔肯亚热防控全解析:从科学认知到行动指南

网易健康 浏览 45482 07-27

手游行业“腰部”重塑,柠檬微趣、Florere Game收入赶超米哈游

国际金融报 浏览 432 09-10

与特朗普会晤前 泽连斯基亮明“红线”

上观新闻 浏览 252 12-28

超1000只基金年内回报已超30%!

券商中国 浏览 568 08-19

"阮少平"冒充中科院院士被打假:所列头衔之多令人瞠目

澎湃新闻 浏览 7173 08-06

特斯拉库存引担忧 密苏里州一停车场停满未售新车

智车情报局 浏览 5211 06-23

外媒揭批中东冲突背后的美企牟利链条

环球时报国际 浏览 3258 07-16

汤杯爆冷,14冠王印尼1-4不敌法国,队史首次止步小组赛

懂球帝 浏览 120 04-29

信用卡分期年终鏖战 银行让利潮下的“生存密码”

北京商报 浏览 283 12-02

在南京高淳,年轻人为什么能“横”着走?

无相商业趋势 浏览 550 08-14

限时17.79万起!smart精灵6号上市,奔驰设计+吉利技术

此地无垠 浏览 11 06-15

价格或35万起 理想i8标配双电机四驱

网易汽车 浏览 4033 07-11

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

IT之家 浏览 299 11-09

女生遭霸凌视频被售卖 施暴者称未满14岁不予处罚

极目新闻 浏览 1837 08-06

端午粽飘香,助消化小妙招已备好

人民网 浏览 8241 05-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11