关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者2025-10-31 00:00:02269人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

打破传统漫展模式,小红书首个二次元大型线下活动收官

大象新闻 浏览 499 08-12

美经济学家:所谓对伊开战有利美国经济十分荒谬

国际在线 浏览 77 04-08

美媒:参与对委军事行动的十余架F-22战机离开波多黎各

环球网资讯 浏览 213 01-07

进行大量体能训练恢复,博格巴:我好像签约了马拉松俱乐部

懂球帝 浏览 340 09-29

比亚迪“腾势问答第三期”发布

IT之家 浏览 6831 08-10

美政府正式"关门" 特朗普:可能带来"很多好处"

环球网 浏览 315 10-02

伊朗强硬表态:永不接受冻结铀浓缩 不担心美方制裁

财联社 浏览 9854 05-28

尊界公众号,主体为啥变了?

车轱辘话V 浏览 304 10-22

11.59万起 2025款东风奕派eπ007加量还降价

网易汽车 浏览 472 05-23

相同的3nm工艺:天玑9500要比第五代骁龙8至尊版便宜50%以上!

快科技 浏览 278 10-13

全新TNGA合资中型SUV 从近20万降到14万多

隔壁说车老王 浏览 363 06-16

和尚对女性下手被当场撞见 吐槽徒弟"连泡妞都不会"

界面新闻 浏览 3167 07-16

关键时刻委少将为美军"敞开大门" 美压制委军手段披露

澎湃新闻 浏览 199 01-19

涉嫌网络侵权?坦克CEO常尧被比亚迪起诉了|封面关注

封面新闻 浏览 353 09-09

湖人胜勇士!里弗斯后场发动机,八村垒艾顿齐爆,拉拉维亚辣眼

篮球资讯达人 浏览 305 10-13

今日热点:电影《得闲谨制》定档;成毅回应《两京十五日》拍摄受伤……

伊周潮流 浏览 187 11-29

AI蛋白设计迈入“可编程”时代 众多AI技术成果亮相世界人工智能大会

封面新闻 浏览 4296 07-28

百万母猪大淘汰!生猪行业产能过剩何解

中国商报 浏览 4969 08-12

山东一餐饮店因蛤蟆汤视频被拟罚45万元 老板最新发声

极目新闻 浏览 3215 07-15

英诺赛科、联合电子、纳芯微牵手,布局新能源汽车功率电子

IT之家 浏览 320 10-02

32岁章泽天又有新动作!不愿当家庭主妇

娱乐圈圈圆 浏览 203 01-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11