关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01371人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

绍伊古访华争分夺秒1天往返 谈好后马上给普京复命

头条爆料007 浏览 157 02-02

张子宇WCBA首秀砍15+6,山东主帅:联赛的对抗她还需要慢慢适应

懂球帝 浏览 169 01-05

科隆vs汉堡:卡明斯基、侯赛因巴希奇首发,法比奥-维埃拉、洛孔加出战

懂球帝 浏览 225 11-03

“低空经济”一线调研 坐着飞机瞰泰山

闪电新闻 浏览 1472 07-18

广东确诊基孔肯雅热已超2000例 传染源是什么

极目新闻 浏览 7655 07-23

纯电续航超400km ID.ERA 9X将于4月正式上市

车质网 浏览 172 02-04

兰博基尼 CEO 温科尔曼称至少十年内不会放弃内燃机

IT之家 浏览 261 10-22

牛弹琴:马克龙众叛亲离 亲信在其最虚弱时公开发难

大象新闻 浏览 351 10-09

40岁男子因情感纠纷伤人致2死1伤 警方通报

澎湃新闻 浏览 428 08-26

连续2天逆跌,票房会破3.5亿!陈思诚还追不上,国产片靠姜文救场

靠谱电影君 浏览 7566 07-11

今年秋冬最时髦的穿法:外套+连帽卫衣,减龄又松弛!

LinkFashion 浏览 192 11-03

罗德里:我们没有达到应有的水平,两个失误导致比分变为1-2

直播吧 浏览 448 09-01

特斯拉“大降价”!830km长续航仅售25.95万,还要啥小米SU7?

隔壁说车老王 浏览 355 09-02

徐嘉余晋级游泳世锦赛男子100米仰泳半决赛,汪顺止步预赛

直播吧 浏览 3358 07-28

“空调被小米超越”?格力回应

中国基金报 浏览 401 08-19

委内瑞拉总统马杜罗:美军事部署行为违反国际法

国际在线 浏览 446 08-22

大S遗产案惊现致命漏洞,具俊晔紧急灭火藏玄机

东方不败然多多 浏览 346 09-08

谢婷婷二胎得子,晒一家四口温馨合

电影侦探社 浏览 2332 07-27

我完美的发型被回南天做局了……

时尚COSMO 浏览 1183 07-11

西媒:巴萨系俱乐部在仓库存了30万件球衣,共花费400万欧元

懂球帝 浏览 177 02-04

NASA 深空激光通信试验超额完成目标,为未来火星任务铺路

IT之家 浏览 326 09-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11