关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029877人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

baby近照撞脸刘嘉玲,苹果肌下垂脸变僵,没了事业心近乎退圈

萌神木木 浏览 201 11-27

净利润减少超50%,珍酒李渡能靠“大珍”走出低谷吗?

征探财经 浏览 239 03-03

卡瓦尼谈博卡杯赛被淘汰:我们创造了机会,但是没能破门得分

懂球帝 浏览 7218 07-24

顺风车司机3年送出460本《南京大屠杀》 有人感动落泪

扬子晚报 浏览 5185 07-29

下周,沪指能否收复3674点?这两大板块的表现很关键

每经牛眼 浏览 7754 08-10

54岁女星王琳自曝:承认自己水性杨花?

17谭 浏览 9868 07-20

张兰端菜不给儿媳,念叨心急吃不了热豆腐

娱乐官已上任 浏览 511 08-29

晚点独家丨上个周末,淘宝闪购峰值超过了美团

晚点LatePost 浏览 541 08-12

罗永浩被禁言后首亮相 现身B站颁奖典礼获年度新人奖

扬子晚报 浏览 260 01-20

本轮牛市买什么,推荐5个方向

星图金融研究院 浏览 1870 08-12

朱媛媛去世后辛柏青首露正脸,眼神空洞憔悴

胡一舸南游y 浏览 234 10-31

演员阚清子晒孕照官宣怀孕:最好的礼物

红星新闻 浏览 8934 07-25

31岁男子乘摩托艇遇难 家属:两个孩子1个7岁1个3岁

极目新闻 浏览 3092 07-27

胖东来称博主用AI分析毛巾利润,案件已进入司法程序

大象新闻 浏览 124 05-06

卫报:切尔西仍在与曼联谈加纳乔,但最多只愿出4000万英镑

直播吧 浏览 525 08-27

26款奔驰S级入门版不足90万起!外观豪华大气,搭载2.5T+48伏轻混

小史谈车 浏览 275 01-20

货币的真相:不只是冰冷数字,更是连接经济和生活的纽带

上观新闻 浏览 432 09-20

深圳这个人气指标,又爆表了!

博闻财经 浏览 299 12-24

信捷电气亮相华为云城市峰会,联手打造具身智能应用新标杆

证券时报 浏览 4935 07-14

春季如何养肝?中医推荐这六种绿色春菜

人民网 浏览 5105 03-25

演员狗狗“大黄”领奖,主人称其是“专业演员”

韩小娱 浏览 246 11-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11