关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01296人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加沙城民众生计仍然艰难 天气与蚊虫也成威胁

极目新闻 浏览 325 10-26

E句话 | 寄居蟹永远没有代表作?

仙女事件簿 浏览 449 08-18

牛弹琴:"三支箭"正射向以色列 以色列的大麻烦来了

现代快报 浏览 15 06-17

男生眼中最好看的女生排行榜TOP1

Yuki女人故事 浏览 342 10-11

马天宇的院子又火了,仅一菜园、鸡舍就圈粉百万

素衣读史 浏览 406 08-22

2025世界人形机器人运动会口号和奖牌发布

环球网资讯 浏览 4985 07-16

胡梅尔斯:告别战一切都很完美,再多踢一会儿体能就要撑不住了

直播吧 浏览 591 08-11

被中方制裁日本参议员生于中国 毕业于北大哲学系

北京日报 浏览 547 09-09

伊朗指责美以策划动乱 哈梅内伊呼吁伊朗人民保持团结

环球网资讯 浏览 280 01-11

上海将建第一座激光聚变能电站,2045年商业运营,成本只有美国一半

文汇报 浏览 403 09-21

这个季节高发!中国2亿人被它折磨

科普中国 浏览 5898 06-03

湖媒坚信詹皇将在湖人退役!下季仍存冲冠曙光 暗示外界过度解读

颜小白的篮球梦 浏览 5547 07-28

温州推出外卖后厨“AI 智能评价处置”系统

IT之家 浏览 402 09-22

吴千语被传怀孕后被偶遇,小腹平平无孕味,与施伯雄机场合体超甜

扒虾侃娱 浏览 491 08-19

日付30元的"假装上班公司"来了几十名"员工" 老板发声

极目新闻 浏览 1498 08-05

TA:德罗认为自己在巴萨没有清晰的发展路径,巴萨对此很无奈

懂球帝 浏览 312 01-23

投资人的三个心理

创业家 浏览 4183 07-18

珍珠配美人,最老派也最高级的时髦

时尚COSMO 浏览 249 12-23

2025年最期待的待播现偶剧,部部高颜值CP坐镇

影视快通车 浏览 395 09-20

詹杜库2K26能力值:三人均进Top10 詹库都是94

直播吧 浏览 474 08-22

仅买10天的哈弗大狗高速上突发变速箱故障 车主后怕

大风新闻 浏览 239 03-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11