关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029798人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

哪些措施能有效阻止美国充当"世界治安官" 外交部回应

环球网资讯 浏览 182 01-07

5555被拒稿,AC接收但PC强拒,NeurIPS揭榜引争议

机器之心Pro 浏览 322 09-20

女子开宝马住高端小区却偷榴莲 保安提醒后她又拿2件

潇湘晨报 浏览 209 02-05

近期一些地方仍然出现校园食品安全问题 教育部回应

极目新闻 浏览 336 09-24

记者:热刺在争夺埃泽中占据有利,阿森纳因财务问题难签罗德里戈

直播吧 浏览 4447 08-14

晕了晕了!科创50刚创近三年新高,机构就疯狂出逃,ETF份额竟跌至近一年新低

每经牛眼 浏览 404 08-23

膝盖受伤!媒体人:李月汝拍了片子 队医预计至少需要休息6周

直播吧 浏览 448 08-19

吃相难看!汪峰直播卖课,被嘲割韭菜

猛哥的搞笑视频 浏览 5818 07-23

极越汽车或迎新生机!

电动知家 浏览 177 11-25

苹果Vision Pro劲敌!vivo韩伯啸:vivo Vision发布会准备中

快科技 浏览 428 08-11

欧盟试图"全面淘汰"俄能源 斯洛伐克总理:自我毁灭

环球网资讯 浏览 343 10-09

起底逼死前夫的翟欣欣:曾是大学"院花" 2次闪婚闪离

极目新闻 浏览 457 09-20

双节假期临近 多家航司加密航线、改换宽体机迎高峰

北京商报 浏览 287 09-29

船员在公海杀同事6个月后跳海潜逃 中国海警跨境捉拿

扬子晚报 浏览 271 10-24

从OpenAI叛逃谷歌!这位27岁小哥,成了奥特曼最忌惮的「秘密武器」

新智元 浏览 6733 07-13

成龙没想到,这次林凤娇干出这种事?

比利 浏览 403 09-02

9 秒开机 + 2 秒唤醒:联想开天信创笔记本电脑刷新开机速度纪录

IT之家 浏览 407 09-01

威马汽车官宣“复活”,但10万车主还敢信吗?

汽车公社 浏览 365 09-07

伊姐周六热推:综艺《心动的信号第八季》;电视剧《星期三》......

伊周潮流 浏览 3224 08-10

聚焦低空飞行器和原子级制造 中国科协年会举办两场专题论坛

环球网资讯 浏览 3266 07-17

龚雪:从影后到隐居,她的悲剧背后藏着多少秘密?

青史楼兰 浏览 9114 08-04
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11