关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01222人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新一代智己LS6 终结油电之争的“六边形战士”

买车君 浏览 417 08-18

精致穷,我们在为“符号消费”买单

时尚COSMO 浏览 265 10-11

今年夏天一定要拥有的4件衣服,太好看了!

LinkFashion 浏览 7130 07-24

TA:森林接近签下麦卡蒂,交易尚未达协议但谈判正朝积极方向发展

直播吧 浏览 434 08-12

BBA大促混战,谁是真性价比之王?

百姓评车 浏览 204 01-05

阅兵后第一个找中国合作的西方大国来了 表态震动欧美

博览历史 浏览 437 09-10

悦龙科技闯关北交所:研发人员大量流失,大客户秒变孙公司惹隐忧

叩叩财讯 浏览 192 12-11

商务部:2026年优化消费品以旧换新政策实施

央视财经 浏览 196 01-12

重启上市路,海明润A股江湖十年再见!深创投加持,剑指北交所!

叩叩财讯 浏览 8311 07-12

近期7台新车官图/申报图曝光:特斯拉华为别克上新作,哪款会好卖

蜗牛车志V 浏览 4156 07-19

美被爆施压欧盟对中俄加税,外交部:中方坚决反对所谓“经济压力”

环球网资讯 浏览 389 09-11

跌破面值也坚持分红!公募行业频现闪电派现,月月分红成常态

券商中国 浏览 2612 07-14

爱奇艺2025年Q2财报:收入66.3亿 运营利润5870万

网易科技报道 浏览 450 08-21

中国犀旺队|欧塞尔共研青训,法国集训圆满结束 

绿茵情报局 浏览 74 04-10

袁立吐槽章子怡、张国立:有钱能使鬼推磨

冷紫葉 浏览 6574 08-05

巴萨官方:巴勃罗-托雷获准未参加季前体检,在等待确定未来

懂球帝 浏览 7412 07-14

李书福双剑合璧,吉利鲤鱼跃龙门

象视汽车 浏览 4486 07-05

舒淇再获关注,黎明称其为“高攀不起”的存在

何嗀爱捕渔 浏览 17467 07-26

43岁蔡卓妍官宣再婚!明星好友纷纷祝福

萌神木木 浏览 13 04-29

女大学生隐私视频泄露拟被学校开除 律师:处分存争议

封面新闻 浏览 5480 07-14

嚼槟榔+吸烟+HPV感染=口腔癌?

网易健康 浏览 1169 03-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11