关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01262人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李若彤、郑秀文低能量时期的“处方”!停滞时不妨试试它

黎贝卡的异想世界 浏览 1530 07-05

应采儿携子伦敦地铁,13岁Jasper摘牙套十分帅气

凉湫瑾言 浏览 130 03-02

字节飞书亮剑AI企服战场​

华尔街见闻官方 浏览 9685 07-11

郭晓冬夫妇赶农村大集!程莉莎啃鸡腿不忘撒娇

裕丰娱间说 浏览 178 02-04

要被阿里分拆上市的斑马,成色几何

虎嗅APP 浏览 390 08-22

精读季报丨好气!姜诚管理规模掉到115亿元,相较巅峰缩水1/4

一地基毛 浏览 167 01-29

排在第73位,新央企长安汽车集团成立,级别不如一汽、东风?

数字财经智库 浏览 6501 07-31

布朗:拉什福德是个好球员,他需要低下头专注为巴萨好好踢球

懂球帝 浏览 530 08-12

CBA常规赛第26轮最佳阵:周琦阿不都沙拉木领衔,姜伟泽在列

懂球帝 浏览 90 03-17

天然的妈生脸有多高级 35岁金晨与38岁刘亦菲说明

可乐谈情感 浏览 3723 08-05

斩获700亿订单,机器人独角兽,锋芒毕露!

飞鲸投研 浏览 165 12-23

深交所下令,卷铺盖走人!与证监会缠斗数月,江苏一家人迎来终章

壹只灰鸽子 浏览 7531 07-25

与孙继海翻脸!董路:我的对手们甘愿被当枪使,自降身价智商全无

念洲 浏览 188 12-19

59岁无儿无女,王晶为何说张卫健一点都不惨

林雁飞 浏览 178 01-15

WAIC 2025,我们闯进了超级头部主播的“造星梦工厂”NOVA

脑极体 浏览 9778 07-27

亲历茅台打假办鉴酒翻车,线上的飞天还敢买吗?

虎嗅APP 浏览 204 12-11

马卡:维尼修斯更衣室地位并未改变,但他状态下滑是不争的事实

直播吧 浏览 428 08-23

消息称iPhone 17标准版紧急增产,苹果要求日产量提高40%

IT之家 浏览 355 09-20

离婚后高调秀恩爱的杨子,没给黄圣依留一丝体面

乡野小珥 浏览 441 08-20

价值10万的皮肤“到手价”仅6000元?腾讯手游《金铲铲之战》“翻车”

国际金融报 浏览 193 12-19

马竞战博德闪耀大名单:格列兹曼缺阵,小蜘蛛、瑟洛特在列

懂球帝 浏览 171 01-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11