关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01466人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女子朋友圈内容被"搬运"长达数年 冒充者:已在调解

扬子晚报 浏览 511 09-15

这6只包太火了,今年流行的风格都离不开它

LinkFashion 浏览 5021 06-19

实惨!从白敬亭到许凯连续四次爆雷 真心疼田曦薇

一盅情怀 浏览 519 08-23

都体:图多尔考虑多种方案应对孔塞桑伤情,热格罗瓦或成变招

懂球帝 浏览 408 09-10

有偶像包袱别演戏!《沉默的荣耀》于和伟干饭,打脸多少假吃演员

娱乐圈笔娱君 浏览 345 10-12

北青总结中超夏窗:市场有所回温,理性消费趋势明显

懂球帝 浏览 2825 07-22

男子卖黄金卷入电诈案8万元被划扣 警方:符合办案流程

澎湃新闻 浏览 6740 08-06

蔡国强在海拔5500米喜马拉雅山脉放烟花引发争议

鲁中晨报 浏览 362 09-21

日本宣布从南鸟岛海域采掘到含稀土的淤泥 外交部回应

环球网资讯 浏览 268 02-04

水晶宫1-1诺丁汉森林 伊斯梅拉-萨尔破门奥多伊扳平格伊中柱

直播吧 浏览 534 08-25

上年纪的女人,夏天的“裙子”别瞎穿,记住这三点才优雅得体

静儿时尚达人 浏览 9290 07-25

马伊琍路演发言大翻车!自曝母女之间有雌竞,被吐槽又一个朱丹

萌神木木 浏览 4594 07-11

寻找AI的杀手级应用:机器人、智能驾驶和智能可穿戴设备

21世纪经济报道 浏览 383 09-29

又一拟上市企业惊现体外资金池,贝特电子IPO失败之谜再追踪!

叩叩财讯 浏览 359 11-08

今日热点:ador或将拒绝newjeans另外三人回归#;徐晟津就星辰大海睡觉道歉……

伊周潮流 浏览 287 11-15

港股无人矿卡第一股诞生!大疆教父李泽湘敲钟,红杉百度联手押注

车东西 浏览 180 12-19

恩智浦全新S32N7处理器释放软件定义汽车(SDV)的全部潜力

HiEV 浏览 285 01-07

薛鹤翔:马士基开舱偏低,打乱旺季预期节奏

首席经济学家论坛 浏览 362 11-12

杨幂这一段“抱娃戏”在全网火了

蕾爸退休日记 浏览 496 08-23

自由市场7大遗珠:国王有意韦少 库明加拒绝勇士?

体坛周报 浏览 573 08-12

中国科协年会举办空天飞行器、深海地球、电-氢协同发展等专题论坛

环球网资讯 浏览 9415 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11