关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017899人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小S和吴家争斗白热化!吴宗宪放话我女儿代言最多,已经准备起诉

萌神木木 浏览 1216 07-24

裙子专场|| 如果夏天只买一条裙,我毫不犹豫会选它(已下单)

黎贝卡的异想世界 浏览 6225 07-11

股权传承落定 娃哈哈正式迈入“宗馥莉时代”

看看新闻Knews 浏览 561 08-28

女大学生在景区被刺死手机遗失 家属呼吁捡到的人归还

极目新闻 浏览 6122 08-14

辽宁旧将回收营?山东寻求签辽宁3连冠FMVP弗格 效仿昔日签哈德森

醉卧浮生 浏览 3968 07-27

赵露思自曝“内娱黑幕”,张艺兴抽成90%算轻的

老吴教育课堂 浏览 4074 08-06

市场震荡调整,科技股领跌,投资者如何布局?

国际金融报 浏览 473 09-10

毛利率20.1%却亏了31亿,小米汽车这道数学题,把我看傻了

道哥说车 浏览 69 05-27

曼联名宿:C罗2021年该去曼城,他们制造机会的水平比曼联强多了

直播吧 浏览 6021 07-24

前三季度私募产品“超涨”十强!复胜、远信、歌汝等夺冠!

私募排排网 浏览 368 10-17

美媒:无人机竞赛美不光落后中国 甚至还比不上乌克兰

澎湃新闻 浏览 442 09-17

雷克沙海外发布 PCIe 5.0 SSD NM990,规格类似国内 ARES PRO

IT之家 浏览 3150 07-17

哈啰Robotaxi首款自研车型曝光,SUV车型 搭载多组雷达

网易科技报道 浏览 3761 07-25

谢什科转会标价曝光!曼联曾拒绝200万签他,一特殊优势完胜纽卡

罗米的曼联博客 浏览 2060 07-31

罗马诺:奥斯梅恩今日抵达土耳其,莫拉塔的转会或将被激活

懂球帝 浏览 5882 07-31

陈奕迅演唱会上意外摔倒,迅速起身接着唱太敬业

素衣读史 浏览 3813 07-16

国脚变成大毒枭,揭开荷兰足球的黑暗一面

西北望看台 浏览 519 08-20

不要怀疑任何一张能进内娱的脸

时尚COSMO 浏览 3674 07-21

加拿大总理:加美经济关系已结束

北京日报客户端-长安街知事 浏览 350 11-09

商人遭警察逼迫签千万调解协议后又被抓 检方赔偿18万

澎湃新闻 浏览 614 08-21

黄奕带娃闯韩娱续集来了:一手好牌打稀烂

每日一见 浏览 523 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11