关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:019167人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

谷歌推出开源全栈NPU新架构,旨在实现大模型在终端的低功耗运行

DeepTech深科技 浏览 338 10-21

对俄加关税对乌"送"导弹 特朗普所谓"重大声明"揭晓

央视新闻客户端 浏览 5364 07-15

200亿造假大案,被重罚1.6亿元

网易财经 浏览 10128 08-13

天才少年21亿买票上车,争夺A股人形机器人第一股?

节点财经 浏览 1768 07-18

美国男子当街被ICE打死 执法人员5秒内至少开了10枪

澎湃新闻 浏览 203 01-27

坠楼身亡的汪林朋:曾是湖北首富 刚被留置调查3个月

新民晚报 浏览 7246 07-29

杨紫胡歌主演,《新闻联播》花1分51秒介绍,这剧必定会火向全国

娱乐圈笔娱君 浏览 341 09-26

从0到171亿!一座制造名城的“追星”金融账本

贝壳财经 浏览 290 01-19

韩军:朝鲜对韩广播今日停止

央视新闻客户端 浏览 1640 06-13

消失在官方记录中的定制传奇:法拉利FX

老爷车 浏览 314 11-05

百亿收购、绑定Plessey,歌尔豪赌AR|氪金·硬科技

36氪财经 浏览 552 08-23

热火106-103险胜雄鹿取6连胜,希罗29+5+7,阿德巴约17+11

懂球帝 浏览 281 11-27

河南"妻儿三人被发小杀害案"宣判:被告人获死刑

红星新闻 浏览 290 12-24

张子宇WCBA首秀砍15+6,山东主帅:联赛的对抗她还需要慢慢适应

懂球帝 浏览 252 01-05

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

静儿时尚达人 浏览 287 11-16

宗馥莉,何超琼,李富真,不一般的女继承者们

LinkFashion 浏览 9731 08-05

海空英雄高翔逝世 曾驾驶歼-6打爆美军机

澎湃新闻 浏览 300 01-11

探访争议中的百果园:价格差了三倍多 口感差异不明显

人民日报健康客户端 浏览 595 08-13

郭晶晶婆婆的新身份,更让我羡慕了

Yuki女人故事 浏览 316 11-05

短剧翻拍《新英雄本色》,刘萧旭主演?

最爱酷影视 浏览 349 10-13

米兰新闻网:米兰今夏出售并清洗多达32名球员,只有奥里吉送不走

直播吧 浏览 470 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11