关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017900人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深圳千亿双巨头杀疯了!大疆做全景、影石做无人机,针尖对麦芒?

雷科技 浏览 6806 07-29

申花洋帅为1-2道歉!直言太尊重海港,蒋圣龙:这场踢得不像冠军

我爱英超 浏览 3028 08-10

一件高定卖300万,客户究竟在买什么?

时尚COSMO 浏览 5751 07-12

“高德扫街榜”剑指大众点评 阿里与美团再度交锋

21世纪经济报道 浏览 446 09-10

推广Ⅱ抄作业!港女的头皮护理,每天1分钟头发真的变多了?

黎贝卡的异想世界 浏览 1875 08-02

WTT欧洲大满贯瑞典站:孙颖莎/王曼昱3-0完胜对手,晋级女双八强

直播吧 浏览 437 08-21

1000亿菜鸟,海外狂奔

21财闻汇 浏览 8577 08-07

上海都续约不起!洛夫顿喊出高年薪难续约,季后赛发挥也不行啊!

篮球资讯达人 浏览 1974 07-13

E句话| 李艺彤和丝芭居然和平解约了?

仙女事件簿 浏览 162 12-24

泽连斯基:俄军向乌克兰一家美国企业发射导弹

每日经济新闻 浏览 623 08-22

泡沫,即将破裂?

博闻财经 浏览 515 08-20

高芙:我无意冒犯!但美国男网应该赶上女网脚步!这是他们的责任

网球之家 浏览 10037 08-11

争夺女性用户,李想抢不过雷军

字母榜 浏览 365 10-17

"体检10年未发现患癌"当事人:非常期待爱康国宾起诉我

红星新闻 浏览 4969 07-31

外交部副部长孙卫东已兼任部机关党委书记

澎湃新闻 浏览 3319 06-24

富佳股份:“一体两翼”战略显效,储能+机器人业务成增长新引擎

览富财经网 浏览 508 08-26

塔雷:为米兰工作是我的梦想,这里的历史告诉我们胜利是最重要的

直播吧 浏览 579 08-24

上海15岁女生军训身亡 医务室让孩子吸氧4分钟才打120

大风新闻 浏览 647 08-23

上海一小区物业合同过期18年 小区公共收益成"糊涂账"

新民晚报 浏览 7925 07-12

新势力洗牌激烈:零跑、华为双雄争霸 方程豹斗败“蔚小理”

道哥说车 浏览 286 12-05

苹果发布iPhone 17e与新款iPad Air,定价不变主打中端市场

华尔街见闻官方 浏览 236 03-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11