关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2026-01-13 00:00:01300人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

【视频更新】超级行动派:如何保卫财富?

智本社 浏览 5595 07-14

三伏养生“逆袭”季,怎么偷偷弯道超车?

时尚COSMO 浏览 9687 07-25

岚图FREE+上市,卢放:岚图正与华为开展更加深度的合作

贝壳财经 浏览 3363 07-13

斯基拉:国米、那不勒斯已派球探考察比萨中场伊德里萨-图雷

懂球帝 浏览 254 12-02

民调称马斯克是美国最不受欢迎公众人物 特朗普回应

环球网资讯 浏览 4576 08-08

轴距2815mm 全新欧版马自达CX-5新车图解

车质网 浏览 301 11-05

美航航班因机型太大备降 乘客被迫乘大巴前往目的地

环球网资讯 浏览 891 06-09

AI跨步进入“经验时代”

华尔街见闻官方 浏览 468 09-11

牛市来了?

智本社 浏览 8519 07-30

官方:郑钦文退出WTA500华盛顿站,之后参加两项北美1000级赛事

直播吧 浏览 1623 07-17

华为鸿蒙 HarmonyOS 6.0.0.107 SP7 / SP5 Developer 版本发布

IT之家 浏览 411 10-15

中方回应美100%关税威胁:动辄以高额关税进行威胁,不是与中方相处的正确之道

环球网资讯 浏览 343 10-13

面向大模型应用的审计领域高质量数据集联创联建工作启动

网易科技报道 浏览 460 09-10

黄仁勋年内三次到访中国

北京商报 浏览 2371 07-15

美特使泼脏水:要是中国停止援助 俄乌冲突明天就结束

扬子晚报 浏览 484 09-16

郭碧婷带女儿买鱼,打扮土气

草莓解说体育 浏览 421 09-21

当前最火的五部电视剧,《老舅》跌至第二

草莓解说体育 浏览 277 12-19

政治局会议的破题信号

网易财经 浏览 983 07-31

钓鱼博主谈二娃溺亡:钓鱼时拖鞋掉落 打捞时发生意外

极目新闻 浏览 4003 08-09

中国驻墨西哥使馆:美方的阻挠终将徒劳无功

政知新媒体 浏览 472 10-01

希腊主帅:字母哥多次犯规被漏判,他本应获得更多的罚球

懂球帝 浏览 413 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11