关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2025-11-09 00:00:01327人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

追平《主角》,对塑料古偶应激了!满屏磨皮的痛,此刻尽数爆发

娱乐圈笔娱君 浏览 56 06-02

始祖鸟在喜马拉雅山放烟花 成功"劝退"了真正的户外人

每日经济新闻 浏览 417 09-21

格林克维奇正式就任北约盟军最高司令

央视新闻客户端 浏览 7582 07-05

一箭双雕!拉什福德实现儿萨梦,接过偶像亨利的14号球衣

直播吧 浏览 2786 07-24

消失的贾玲,到底得罪了谁?

会说话的舌 浏览 5933 07-09

苹果新品上线

都市快报橙柿互动 浏览 244 03-03

张雨绮风波持续发酵,曝多个商务被取消

扒虾侃娱 浏览 280 01-28

美乌代表:佛州会谈"富有成效和建设性"

上观新闻 浏览 281 12-23

77岁老人在大渡河游泳 被冲到乐山大佛脚下失联超3天

封面新闻 浏览 563 08-17

800名核心员工谁先富?千亿联影医疗5大股权激励平台同步减持!

野马财经 浏览 10172 08-10

账面1000多亿,却隐藏20多年,整个互联网都找不到它长什么样

壹只灰鸽子 浏览 313 01-18

35年"老公安"被开除党籍 下属女副局长与丈夫同日被查

南方都市报 浏览 7451 08-07

东风柳汽总经理林长波再谈理想i8、乘龙卡车对撞:我们保留诉讼权

IT之家 浏览 522 08-23

从零做起 刘备扮演者孙彦军以"高校首任校长"身份亮相

鲁中晨报 浏览 525 09-26

阮经天情绪激动,叹:妈妈不在了就不过生日,去年陪母抗癌失败

温柔娱公子 浏览 5911 08-07

单电机200kW 奔驰纯电长轴距CLA申报信息曝光

网易汽车 浏览 3277 06-24

剧组拍戏用激光笔清场致游客眼睛受伤 街道办:已约谈

上游新闻 浏览 8656 06-18

美交通部长:印度空难后 暂未发现需停飞波音787的理由

经济观察报 浏览 9630 06-14

极氪12月交付超3万台,2025全年销量超22.4万台

大象新闻 浏览 284 01-02

降息300个基点!这国央行,重启降息周期!

上观新闻 浏览 4739 07-25

脆皮年轻人养生:扎堆整活,20元吊脖子

新京报 浏览 8735 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11