参考指南

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

H20停产，...

英超新赛季前...

没有顶级腰子...

皮克又惹事了...

台风＂韦帕＂...

“10亿只是...

普京开启＂罕见＂四天访华行中俄如何沟通乌议题受关注

茸城她故事丨毋冬梅：以柔肩担重任，用匠心筑梦浩瀚星河

小雷：道曼将成为英格兰史上最杰出的球员之一，这不是过度吹捧

火锅进入“70元时代”，品牌靠什么赚钱？

岁月不败美人，42岁的安妮·海瑟薇比20岁的她更好看

能否复刻N7的成功？日产N6申报图现身

混乱、内耗、丑闻：Meta考虑向Google、OpenAI低头

68岁独居老人为＂干儿子＂贷款85万家中还堆满了保健品

世间只此一次，《西厢记》4K默片配乐来了！

8月19日外媒科学网站摘要：科学家发现黄金在极端加热下并未熔化，或影响核聚变研究

推广中奖名单-更新至2025年6月5日推广

京东外卖全职骑手突破15万，人均缴金约2000元/月

从AI手术机器人到虚拟圆明园，2025服贸会前沿科技抢先看！

美俄元首会谈地＂全副武装＂数百特工入驻

苹果发布iOS 26开发者预览版Beta 6：液态玻璃、动效加强

记者：博洛尼亚100万欧租借费+700万买断报价米兰中场波贝加

伊姐周日热推：电视剧《重影》；电视剧《山河枕》......

S妈具俊晔联手为大S而战，申请参与大S起诉张兰案

“国民基金经理”王登峰内部调岗至贝莱德基金，任首席资金官

大S的墓碑刻字“永远在一起”，墓地前的草坪已经被踩变颜色

曼联官方：召回小将惠特利，为北安普顿出场25次打进3球

神秘BE10000 Pro路由器现身小米之家：4个2.5GbE接口+双万兆接口

中国驻日本大使馆提醒在日中国公民防范自然灾害

李连杰因甲亢住院，病床照曝光表情痛苦，好友晒聊天记录报平安