关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018108人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

LABUBU隐藏款价崩从过万跌到800多 黄牛哭了:没人接盘

中国基金报 浏览 474 09-10

“全香港梦中情人”的李美琪,已走上另一条路

章眽八卦 浏览 399 09-10

50+的女人,这才是你“反油腻”的穿衣关键:色不过3、衣不花

静儿时尚达人 浏览 1356 07-17

创历史新高!2025年上半年新注册登记新能源汽车562.2万辆丨快讯

华夏时报 浏览 1605 07-15

英伟达CES亮出新牌

北京商报 浏览 194 01-07

深夜重磅!鲍威尔暗示美联储可能降息!美股大涨

国际金融报 浏览 405 08-23

人工智能“入侵”人类新闻网站腹地

刺猬公社 浏览 350 08-20

鸿蒙智行智界 R7 汽车选装配置公布,空悬 / 科技舒享包等变选配

IT之家 浏览 5558 08-11

《献鱼》发布首版预告,王影璐很出彩,陈飞宇一言难尽

最爱酷影视 浏览 9309 08-05

罗马诺:切尔西接近聘请前利物浦球探总监戴夫-法洛斯

懂球帝 浏览 268 10-20

连续霸榜 每4辆新能源公务车就有1辆是比亚迪

网易汽车 浏览 3610 06-25

特朗普比想象的更精明,或许全世界都误读了他

浏览 9772 07-14

美国核弹头重回英国牵动全球神经

环球网资讯 浏览 8052 07-23

E句话| 姐有新恋情啦?

仙女事件簿 浏览 227 10-21

提前一年超额完成2500亿目标!深圳半导体产业的发展密码,藏在三次转身里

时代财经 浏览 441 08-24

孤独的冠军:拉杜卡努与大坂直美,两颗被聚光灯灼伤的流星

网球之家 浏览 3099 07-25

王霜出任“汉超”汉阳队助教,其表哥曹国栋担任主帅

懂球帝 浏览 1794 07-29

长安启源全新Q05申报信息揭晓

环球网资讯 浏览 4033 08-12

先L3还是直接L4?国内车企还在争论,特斯拉已经“空车”上路了

Autolab 浏览 181 12-19

重点企业集聚、百亿母基金支持……湖北人形机器人产业初具规模

贝壳财经 浏览 998 07-18

该!买!包!了!30款绝美初秋包包!拿去!

Yuki女人故事 浏览 291 09-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11