关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02348人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"苦情"首相白了头 柬埔寨首相洪玛奈的夫人走向台前

现代快报 浏览 578 09-01

10个瞬间,回顾这一年

黎贝卡的异想世界 浏览 267 01-31

马克龙不加入和平委员会 特朗普:加征关税他就会加入

界面新闻 浏览 359 01-21

张本智和惨遭逆转!痛失4个赛点+连丢3局,无缘法国冠军赛男单8强

乒谈 浏览 305 11-01

东吴证券,找到了黄金赛道

券商中国 浏览 7076 07-25

外卖大战的第一个“受害者”出现了?

凤凰WEEKLY财经 浏览 4858 07-16

20万级还有大空间 尚界H5官图首曝/秋季上市

网易汽车 浏览 1593 07-15

吴镇宇携妻带娃度假 费曼却发老爸丑照

策略剖析 浏览 494 08-26

曼晚:曼联官方确认杰克-弗莱彻正随一线队备战阿森纳

直播吧 浏览 9221 08-14

限时售9.29万起 第五代瑞虎8正式上市

网易汽车 浏览 309 11-12

ST华通:间接投资摩尔线程,持股比例约0.35806%,对业绩无重大影响

澎湃新闻 浏览 413 09-26

牙周科专家破解口臭3大谣言

网易健康 浏览 4342 03-21

全网爆火的“鲨鱼裤”太丑了!巨显腿粗!

Yuki女人故事 浏览 254 10-10

6件相见恨晚的懒人神器!巨爽巨实用!件件直戳心窝!

Yuki女人故事 浏览 1125 07-21

博格丹:约基奇球商高&体力好 他是我搭档过的所有球员里最强的

直播吧 浏览 504 08-21

川超揭幕战-成都领克6-0遂宁舍得干 全兴名宿亮相开幕韩红献唱

直播吧 浏览 362 09-21

摄影师称在大理旅拍店附近发现信号屏蔽器 已报警处理

大风新闻 浏览 533 08-21

中国海警舰艇编队在钓鱼岛巡航

界面新闻 浏览 250 11-17

特朗普称将审查伊朗提出的结束冲突新方案

极目新闻 浏览 100 05-03

开盘涨停!002510,四度筹划易主

中国基金报 浏览 378 09-26

全烂透了!9个董监高无一清白,强制清退!知名央企迎来最终审判

壹只灰鸽子 浏览 550 08-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11