关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者2025-11-11 00:00:01303人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

看来阿里要发力扶持盒马了

蓝鲸新闻 浏览 2562 08-06

荣梓杉塌房太离谱!出轨家暴还反咬?

东方不败然多多 浏览 345 10-16

中国地下700米,有了个全球第一!

环球网资讯 浏览 494 08-26

又到每年假装自己是汤唯的时候了

时尚COSMO 浏览 280 10-15

西贝降价,部分菜品降幅超20%!

红星资本局 浏览 411 10-02

分手26年 如今的邵美琪已是郑伊健高攀不起的存在

奥字侃剧 浏览 413 09-11

全球首例体细胞克隆犏牛在西藏诞生

环球网资讯 浏览 1506 07-16

中国稀土创始人被踢出董事会 否认2亿债务称被外商坑

界面新闻 浏览 657 08-23

更熟悉的命名 大众ID.Polo亮相慕尼黑车展

网易汽车 浏览 408 09-09

谷歌开源AI工具Aeneas,辅助历史学家高精度修复、断代及溯源铭文

DeepTech深科技 浏览 2744 07-25

62岁农村大爷打赏女主播50万 全家人一查账单直接傻眼

极目新闻 浏览 509 09-22

时隔近两年,巴媒:内马尔入选巴西国家队初选名单

懂球帝 浏览 531 08-19

“富贵闲人”许绍雄的快乐哲学

仙女事件簿 浏览 360 10-29

里克-巴里:NBA应该设立两个MVP奖项 东部MVP以及西部MVP

直播吧 浏览 460 09-10

小红书对着B站“贴脸开大”

经济观察报 浏览 6174 08-11

崔东树:2025年全国汽车市场总体走势较强 新能源商用车景气度走高

智通财经 浏览 277 12-15

融资1111亿元,估值近8750亿元,全球最贵自动驾驶独角兽诞生

红星资本局 浏览 272 02-05

返利吸存罚30万违规揽储罚160万、行长也被警告,监管剑指花式揽储

湘财Plus 浏览 6151 07-14

卫报:曼苏尔和芬威集团的第三大股东曾成立一家联合投资公司

懂球帝 浏览 311 11-08

AI Startup 招聘集市|千寻智能正在寻找AI落地世界的工程合伙人

硅星人 浏览 5986 07-31

用重罚来逼迫商家“限价”,京东在焦虑什么?

斑马消费 浏览 363 10-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11