关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2026-01-13 00:00:01303人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以军称对黎巴嫩真主党目标发动新一轮空袭

上观新闻 浏览 349 09-19

颈椎保健全攻略:远离伤害,守护健康

浏览 8734 07-14

平台回应"大三女生乘网约车被猥亵"

红星新闻 浏览 8401 06-20

特朗普已告知内塔尼亚胡其反对军事打击伊朗

上观新闻 浏览 3046 06-11

财经观察:担忧产业短板,欧盟自查“经济瓶颈”

环球网资讯 浏览 304 10-24

特朗普高喊和平,以色列悄悄磨刀:巴勒斯坦的血腥噩梦结束了?

宋鸿兵 浏览 358 10-17

宗馥莉,何超琼,李富真,不一般的女继承者们

LinkFashion 浏览 9734 08-05

硬科技投资的“海松范式”,一年9个IPO背后的产业深耕之路

投中网 浏览 548 08-26

70岁"老虎"杜梓13年敛财超8191万元 获刑15年

政知新媒体 浏览 3375 07-30

读懂IPO|实控人及高管拿分红买理财,世昌股份近亿元利润无现金支撑,靠票据贴现实现回款

时代周报 浏览 443 09-10

美俄航天局高层将会晤 聚焦国际空间站与联合任务

界面新闻 浏览 8369 07-30

纯电/增程双动力 日产NX8上市限时权益价14.99万起

网易汽车 浏览 167 04-10

千亿市值豪威集团冲刺IPO,“中国芯片首富”虞仁荣再下一城

野马财经 浏览 7654 07-25

卫星电话关键时刻保命:网友分享使用华为 Pura 70 Pro+ 脱困经历

IT之家 浏览 2679 07-29

袁悦苦战182分钟惨胜后遭调侃打球兼项马拉松,吴易昺疑似又伤了

网球之家 浏览 294 01-15

王腾翻车,给“网红”雷军敲响警钟!

功夫财经 浏览 482 09-11

今年最火的鞋子好怪,但是她们好爱!

黎贝卡的异想世界 浏览 497 08-16

春秋航空否认故意调低客舱温度售卖毛毯

南方都市报 浏览 411 08-26

特朗普:希望对伊朗的军事打击快速且具决定性

界面新闻 浏览 276 01-16

宝宝黄疸,必须停母乳?错!

网易健康 浏览 9899 06-12

小米高管:很多友商在拆解、研究小米,也有少数碰瓷甚至攻击我们

车宇世界 浏览 534 05-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11