关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014007人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

43岁张杰正式宣布退出!原因令人意外

吴蒂旅行ing 浏览 187 01-26

男网又一35岁老将退役,德约科维奇动情告别老友

网球之家 浏览 9477 07-29

张柏芝某宝购物带到澳洲,谢振轩提一要求引热议

念得小柔 浏览 165 02-05

限量 100 台 电动 MINI JCW 蒙特卡洛 60 周年版上市

网易汽车 浏览 238 10-25

“苏超”“赣超”再破纪录!全国最大规模“社超”来了

国是直通车 浏览 310 09-22

1句话生成可玩的3D世界!谷歌Genie3震圈登场,世界模型终于迎来ChatGPT时刻

智东西 浏览 2078 08-06

罗永浩怒怼西贝,预制菜除了方便,我们还吃进了什么?

网易健康 浏览 386 09-13

官方:加强对婴幼儿食品等日常监管

界面新闻 浏览 10055 07-27

1746个螺母被认定为枪支散件 五金厂老板获刑四年

黄河新闻网吕梁频道 浏览 171 02-03

丁真自曝曾遭圈内人歧视,被嘲身上有异味,直言自己像讨饭的

萌神木木 浏览 405 08-23

男子手部外伤被要求检查前列腺 多方回应

齐鲁壹点 浏览 2753 07-02

媒体:抽烟正是导致鲁迅健康恶化最终去世的罪魁祸首

新民周刊 浏览 497 08-27

62岁千百惠因病去世 上个月刚抱孙子

红星新闻 浏览 450 08-21

杨议妻子回应杨少华去世争议:网友的眼睛是雪亮的

深圳晚报 浏览 5468 07-11

宝马“又搞大事”!推全新旗舰SUV取代XM,硬派定位对标G级

网上车市 浏览 422 08-14

vivo Vision 探索版使用磁吸镜片方案,会尝试三方镜片的兼容

IT之家 浏览 454 08-24

光伏企业今晚的中期业绩预告,隐藏着怎样的信息量?

赶碳号 浏览 2748 07-15

黄多多晒20岁生日照,美国公寓装修高档

揭秘世间万象 浏览 151 02-05

字母哥首秀但他还走吗? 胜公牛并未让雄鹿宽心

仰卧撑FTUer 浏览 269 10-13

AI和AV一看就有亲戚

星球商业评论 浏览 458 08-20

90后美国男子在中国当15年道士:已拿到中国"五星卡"

FM93浙江交通之声 浏览 9834 07-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11