关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01298人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

郑丽文赴美前表态:不当"麻烦制造者" 不会拖美国下水

海峡导报社 浏览 91 05-28

Meta收购曾火爆一时的AI智能体社交网络Moltbook

IT之家 浏览 259 03-11

18岁留学女孩被实时监控 按"指令"回国装满一箱钱送走

极目新闻 浏览 492 09-21

史上最强量产"911" 保时捷911 Turbo S 亚洲首秀

网易汽车 浏览 304 11-06

动作片王者归来,赵文卓新片燃爆,票房断崖式领先,不输院线片

最爱酷影视 浏览 516 08-27

成都vs国安第7分钟,成都球迷举起球衣声援韦世豪

懂球帝 浏览 9366 07-27

官宣孙兴慜?记者:洛杉矶FC将在8月7日5点开发布会 宣布重大消息

直播吧 浏览 3201 08-06

英伟达的AI已经开始接管整个项目了?SATLUTION进化代码库登顶SAT

机器之心Pro 浏览 362 09-11

选秀专家:夏联时开拓者副总向我炫耀小杨“我们选的家伙咋样?”

直播吧 浏览 3271 08-10

ESPN球队排行榜:雷霆居首 火箭升2 掘金3 快船升7 勇士9 湖人10

直播吧 浏览 7447 07-31

巴基斯坦男子枪杀婚内出轨姐姐 母亲称"荣誉处决"无罪

中国新闻周刊 浏览 637 08-22

巴西发起最致命反毒行动:致121人死亡 头号头目逃脱

红星新闻 浏览 317 10-31

雷军在京喊话:共同抵制网络水军、黑公关

大象新闻 浏览 376 10-19

媒体:菲载300多人客船倾覆 中国没法救的原因很简单

新民周刊 浏览 275 01-27

获“全优大满贯”腾势N9创中保研测试历史最高评级

汽车维基 浏览 283 01-25

午评:创业板指半日跌0.52% 芯片股逆势大涨

网易财经 浏览 6526 08-07

新势力2月销量解读:青黄不接与厚积薄发

科技丛林 浏览 229 03-02

记者:迪亚斯将在几天内提交转会申请,巴萨正等待他向利物浦施压

直播吧 浏览 4046 07-14

baby祖孙三人回香港,小海绵腿长连背影都很帅

柒佰娱 浏览 2542 07-16

黄岩岛传捷报中方成功清场驱离 菲律宾最后大败而归

文雅笔墨 浏览 443 09-17

罗帅宇大伯:举报材料有11.6斤 在他宿舍发现打斗痕迹

大风新闻 浏览 4354 06-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11