关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014100人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卡德罗夫发文:希望我们的敌人知道 我很健康

澎湃新闻 浏览 3209 08-07

经纪人:哲凯赖什没有罢训,是葡体给了他额外的假期

懂球帝 浏览 5817 07-31

翻拍一部剧,有这么难吗?

时尚COSMO 浏览 291 01-17

张靓颖的眼镜,戴和摘都是错

时尚COSMO 浏览 5124 07-18

前东方甄选主播"顿顿"回应被指"娘""女性化":很荣幸

极目新闻 浏览 600 08-27

iPhone 17 Pro散热大幅改进!但依旧远远落后于安卓

雷科技 浏览 364 09-20

61岁华西女教授创业冲刺港股IPO,估值超34亿元,腾讯、启明等参股

红星资本局 浏览 291 01-21

足球报:城市联赛面临高昂行政成本,赛风赛纪和裁判也是困扰

懂球帝 浏览 390 10-13

科技氛围浓郁 全新奥迪Q5L内饰正式公布

车质网 浏览 297 11-27

牛弹琴:委内瑞拉面临三场较量 美国将更加狂妄

北京日报客户端 浏览 271 01-06

高圆圆、宋佳、陈妍希最近美出圈!她们的穿搭普通人也可以借鉴

LinkFashion 浏览 281 01-24

6名大学生溺亡 涉事公司2月曾称已更换浮选车间格栅板

每日经济新闻 浏览 9411 07-24

阿斯:皇马面临管理危机,维尼修斯被换不满&巴尔韦德拒踢边卫

懂球帝 浏览 412 10-02

好莱坞传奇落幕!雷德福辞世,圣丹斯精神永流传

情感大头说说 浏览 457 09-18

穿来穿去,发现50+女人夏天离不开过膝裙和阔腿裤,遮肉时髦

静儿时尚达人 浏览 2450 06-30

业绩大幅预增!券商股或迎多方利好共振

券商中国 浏览 9380 07-28

特朗普拒绝赖清德"过境"美国 国台办回应

北京日报 浏览 5176 07-31

安东尼奥:我是“变色龙”式的教练,根据实际情况有不同打法

懂球帝 浏览 292 01-23

你的数据上“保险箱”:谷歌安卓核心组件通过物联网安全最高标准

IT之家 浏览 7453 08-13

钟薛高两子公司被申请破产审查,创始人曾卖红薯还债

红星资本局 浏览 5574 07-16

ST联合,急饮润田水

斑马消费 浏览 436 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11