关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017836人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

印度电动汽车市场:名爵份额逼近塔塔

车质网 浏览 274 10-16

记者:索尔斯克亚在贝西克塔斯帅位面临压力,可能很快遭到解雇

直播吧 浏览 4821 07-28

“工装混搭风”今年爆火!全世界的时髦女人都在穿

LinkFashion 浏览 167 01-30

“Go Global”战略里程碑进展!远大医药钇[90Y]欧洲新增适应症获批

环球网资讯 浏览 378 09-09

长安启源全新 Q05 车型 11 月 21 日上市,纯电续航 506km

IT之家 浏览 216 11-10

女子绿皮车劝阻吸烟与他人起冲突 事发地确实允许吸烟

红星新闻 浏览 528 08-23

多地紧急叫停"刨猪宴"活动 地方政府被指陷入两难困境

中国新闻周刊 浏览 201 01-21

男子夜钓遭枪击 家属:4人当场逃跑 伤者走回家后倒地

封面新闻 浏览 237 11-04

蒙牛特仑苏牛奶里竟喝出蚂蚁?客服这样回应

正经社 浏览 817 07-30

弗兰克:要让孙兴慜出现在能进球的位置,高井幸大患上足底筋膜炎

直播吧 浏览 1673 07-30

"全国最后一个通车村"迎第一批高考生 7人中最高553分

红星新闻 浏览 3787 06-27

杨子新欢怒怼网友!上位接手黄圣依创立品牌?

萌神木木 浏览 443 08-17

外媒:特朗普告诉内塔尼亚胡 以色列突袭卡塔尔“不明智”

环球网资讯 浏览 360 09-11

全景展现抗战艰辛历程,上映之后没排片,就因为不是院线主流类型

最爱酷影视 浏览 427 08-16

加盟仅2天!曝21岁港脚遭中甲队解约 输国足后疑骂中国球迷惹众怒

我爱英超 浏览 3196 07-17

霍尔告别蓝军:一生难忘的回忆,感谢切尔西的一切

懂球帝 浏览 1006 08-07

10月新势力销量爆发:零跑首破7万辆,小米稳超4万辆,理想猛跌38%

21世纪经济报道 浏览 228 11-04

二排座椅配按摩 新款领克09四驱探索版限时价19.88万起

网易汽车 浏览 252 10-24

怎样限制字母哥?立陶宛男篮总经理:只能祈祷他发挥失常

直播吧 浏览 352 09-10

曝小米汽车调整销售体系!

电动知家 浏览 340 09-18

卡位AI算力基建狂潮,鸿辉光通加快实现向光器件隐形龙头的蜕变

第一财经资讯 浏览 354 09-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11