关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018186人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

意游泳名将涉嫌在新加坡偷窃被捕 外交部长紧急介入

极目新闻 浏览 608 09-01

清华REMA框架:透视AI推理错误根源

科技行者 浏览 388 10-22

山姆“打击”代购,激起负评舆情

商业观察家 浏览 2573 07-17

“中国战狼”到“京学被嘲”?互联网解构吴京

桑葚爱动画 浏览 399 09-20

北京越野BJ40增程赤兔版 续航超过1200km

隔壁说车老王 浏览 264 01-25

美媒历史Top20分卫:乔科韦艾领衔 哈登5 麦迪12克莱14 马努16

直播吧 浏览 10347 07-26

李禹熹公开和荣梓杉聊天记录!​开房都不舍花钱,还拿私密照威胁

萌神木木 浏览 335 10-17

马杜罗被指遭"发小"出卖 委"二号人物"疑与美接触数月

扬子晚报 浏览 285 01-19

曝大S骨灰做成7条项链,范玮琪演唱会上疑似佩戴

扒虾侃娱 浏览 340 10-29

纯进口SUV,标配全时四驱+2.5L水平对置,媲美普拉多,仅售24万多

隔壁说车老王 浏览 8969 07-19

不想“英牙早脱”怎么办?

网易健康 浏览 10000 07-14

迪士尼将对OpenAI进行10亿美元股权投资

第一财经资讯 浏览 182 12-12

不会亏着开新店,贾鸣镝帮新进经销商算好了投资账

网易汽车 浏览 7929 06-23

全新TNGA合资中型SUV 从近20万降到14万多

隔壁说车老王 浏览 412 06-16

E句话 | 朱孝天曾经单删明道好友?

仙女事件簿 浏览 4886 07-25

米兰球员身价变更:帕夫洛维奇+1000万,巴尔泰萨吉+1500万

懂球帝 浏览 253 12-24

黄金“疯狂”背后,资金已有分歧

第一财经资讯 浏览 461 09-11

网传申万看A股到8000点,客服称无法确定发布者身份,相关人士称信息不实

红星资本局 浏览 8431 07-27

特斯拉Q3销量首超梅赛德斯奔驰,一个时代终结了?

江瀚视野 浏览 331 10-14

数百名韩国工人被拘留后 LG新能源敦促员工"离开美国"

参考消息 浏览 521 09-08

特拉维夫多处建筑遭袭 相关区域实施严格管制

环球网资讯 浏览 227 03-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11