关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017898人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉Robotaxi实车曝光 即将开启试运营

车质网 浏览 510 06-17

净利润大跌77.3%!康泰生物,何时才能否极泰来?

侃见财经 浏览 405 09-26

7月14日决赛日:王楚钦大战张本智和,20岁陈熠冲神迹,CCTV5直播

侃球熊弟 浏览 3944 07-14

全面大撤离!李嘉诚英国“套现”2000亿

创业家 浏览 123 05-09

男子房文军假冒多个联合国外交官身份 频繁搞商业走穴

澎湃新闻 浏览 514 08-26

沪电股份:前三季度净利润同比增长47.03%

网易财经 浏览 319 10-29

纽约市长候选人称若当选将逮捕内塔尼亚胡 特朗普发声

澎湃新闻 浏览 4401 07-10

刘晓庆回应税务问题,称相关部门已进行调查,未发现偷税漏税行为

扒虾侃娱 浏览 1634 08-09

美媒:特朗普的一顿操作 加速了"龙象共舞"

澎湃新闻 浏览 7914 07-21

维尼修斯迎来25岁生日!皇马队友姆巴佩社媒晒合照送上祝福

直播吧 浏览 9774 07-13

记者:纽卡即将签下佳夫,正与米兰敲定约3500万镑转会的细节

懂球帝 浏览 2324 08-10

被美国对华鹰派施压后 特朗普对中国提了一个过分要求

梁讯 浏览 601 08-26

国航一航班从北京起飞1小时后返航 客服:非天气导致

红星新闻 浏览 4706 07-04

网坛名宿预测德约在澳网后退役,被六千名塞尔维亚球迷围攻

网球之家 浏览 313 11-03

纳斯达克中国金龙指数跌0.4%

证券时报 浏览 180 01-09

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 276 01-13

实力洗眼!一秒就被她惊艳

吐槽电影院 浏览 1870 07-16

乔治亚理工学院联手微软:让AI训练效率暴增21%的神奇新方法

科技行者 浏览 306 11-11

“萝卜快跑”又“失足”,背后老板李彦宏财富一年缩水182亿

雷达财经 浏览 7895 08-11

大A里程:3.15万亿,4120点,十年新高

正经社 浏览 273 01-11

日产断臂自救:裁2万人,关7家工厂

帮宁工作室 浏览 492 05-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11