关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01360人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

270亿福建国企换届,任命85后高管,人均薪酬25.8万元

华美财经 浏览 508 08-23

白山云霍涛:智能体时代,信任是比体验更高的「生死壁垒」

节点财经 浏览 275 01-20

中俄蒙三国互动频繁:俄罗斯向东转步伐加快

浏览 6121 07-14

座舱全面换新/设计更动感 全新长安UNI-V官图发布

网易汽车 浏览 616 06-14

俄罗斯一架安-2轻型飞机发生硬着陆 8人受伤

财联社 浏览 6652 07-07

扫清商业化最大障碍!OpenAI与微软启动新谈判

财联社 浏览 4735 07-30

套路百出,不如“癫剧”灵机一动

时尚COSMO 浏览 5909 07-03

2026春夏八大流行趋势

LinkFashion 浏览 191 01-10

平台上线、标准立项,香港为何积极构筑RWA基础设施?

国际金融报 浏览 7723 08-10

韩国或首次出现"前总统夫妇"同时入狱情况

红星新闻 浏览 8326 08-10

活塞121-90狂胜送尼克斯四连败,坎宁安29分13助,布伦森25分

懂球帝 浏览 298 01-06

队报:不排除皇马在今夏转会窗的最后几天报价科纳特

懂球帝 浏览 7292 07-27

每体:由于巴萨VIP座位收入还未获审批,出售卡萨多或将成为B计划

直播吧 浏览 474 08-22

特朗普称美将管理委直至安全过渡

新华社 浏览 182 01-04

女星安吉丽娜·朱莉访乌 其随身保镖被乌军征兵处抓走服役

极目新闻 浏览 309 11-07

微软 Win11 全面拥抱 AI:首个智能体、完美截图等,让 PC 更懂你

IT之家 浏览 7586 07-23

沃尔沃全新XC60与宝马X3详细比拼,豪华中型SUV怎么选才合理?

二师兄玩车 浏览 8250 07-19

惊天大冷!足总杯卫冕冠军水晶宫1-2遭第六级别球队麦克斯菲尔德淘汰

懂球帝 浏览 284 01-11

“羽绒服+半身裙”,混搭风太好看了!保暖又气质!

Yuki女人故事 浏览 218 11-15

图多尔:世俱杯肯定会对备战有影响,我支持球员放假至少1个月

直播吧 浏览 9024 08-10

留几手称不在意葛夕恋情,又说不能接受,他咋了

新金牌娱乐观察家 浏览 1644 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11