关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:019076人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

种种迹象表明,越南被美国暗算了

牛弹琴 浏览 7647 07-12

埃尔法最大竞品复活了,这台新出的日系MPV有点酷!

汽车消费网 浏览 217 10-31

玉渊谭天:中国抗战阅兵以来 日本砸560亿日元搞公关

玉渊谭天 浏览 353 08-28

高市早苗曾叫嚣台湾有事日本必入

极目新闻 浏览 259 10-22

马自达全新中型SUV车展亮相,增程/纯电双动力可选,轴距超2米9!

小史谈车 浏览 379 09-02

萨尔瓦多:我们临门一脚始终欠缺感觉,联赛还剩十轮依然拥有决心

直播吧 浏览 9362 08-10

英超新赛季前瞻:4大豪门争冠 曼联2亿重建

叶青足球世界 浏览 5226 08-13

通大附院成功实施脑机接口技术,用科技唤醒失去的功能

扬子晚报 浏览 311 09-26

人类遗忘的难题解法,被GPT-5重新找出来了

量子位 浏览 269 10-14

巴拿马宣布运河改造:中国需求将翻一番 不改不行了

澎湃新闻 浏览 384 09-18

55岁郑丽文当选国民党主席 其被视为"非典型国民党人"

中国青年报 浏览 297 10-19

乌总统:美方28点计划已有所精简

每日经济新闻 浏览 211 11-25

法媒:蒙彼利埃陷入财务困境,将出售俱乐部女足球队

懂球帝 浏览 2873 08-07

热爆了!中国机器人企业近100万家、融资超240亿

钛媒体APP 浏览 1532 08-13

加拿大两架飞机空中相撞飞行员双双身亡 现场冒起黑烟

极目新闻 浏览 1750 07-14

MINI携手Deus Ex Machina 两款JCW概念车亮相慕尼黑车展

网易汽车 浏览 364 09-09

机器情感与AI陪伴的人文审度⑥|邱德钧、李玮农:超越记忆——情感计算中遗忘的必要性和实现

澎湃新闻 浏览 1040 07-17

全智贤急了!20家韩媒统一发稿谴责中国网友偷看盗版,公关太蠢

萌神木木 浏览 310 09-26

特朗普:将考虑因铀浓缩问题再次轰炸伊朗

环球网资讯 浏览 4282 06-28

山西太原现"瀑布云"奇观 飞机贴云飞行上演"穿云箭"

极目新闻 浏览 6074 07-05

看完《阿凡达3》,心情很复杂

独立鱼 浏览 128 12-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11