关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02263人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张学友东莞演唱会高音多次破音 称想"中止演唱会退票"

极目新闻 浏览 437 09-02

河北张家口崇礼发生3.4级地震 震源深度20千米

中国地震台网速报 浏览 4924 07-10

拓展绿色金融版图,这家券商争做“ESG探路人”!

券商中国 浏览 2469 07-24

出海速递:小鹏在印尼开启本地化生产

车质网 浏览 5603 06-28

哈马斯证实其军事领导人辛瓦尔已死亡

极目新闻 浏览 311 08-31

卡瓦哈尔谈国家德比:我们渴望复仇,击败他们意义重大

懂球帝 浏览 252 10-22

阿特拉斯主帅:我们要抛开迈阿密的球星光环,同时专注于自己

直播吧 浏览 1760 07-30

《用武之地》票房崩塌:这块金字招牌算砸了

靠谱电影君 浏览 179 01-02

记者:卢克曼离队的做法过于极端,国米应充分考虑后再签下他

懂球帝 浏览 1987 08-10

AI教父辛顿:AI正在压缩入门级岗位,变富的只会是少数人

澎湃新闻 浏览 340 09-09

销售渠道改为“单城单店”模式?丰田中国:仅少数地区试点|早报

汽车服务世界 浏览 231 10-24

狗仔疑似曝白百何离婚原因,陈羽凡醉酒闹事她不断善后,耗尽心力

萌神木木 浏览 2452 07-25

千人冒雪送“棋圣”,韩国“围棋皇帝”曹薰铉专程道别:盼未来与聂老天堂对弈

国是直通车 浏览 218 01-18

美国一医疗转运机坠毁 4人死亡

北青网-北京青年报 浏览 7150 08-07

作家李娟怒斥"喜马拉雅烟花秀"傲慢:气得编不出标题

新京报政事儿 浏览 296 09-23

长泽雅美官宣结婚,日本女星都偏爱“丑男”

FUFASHION 浏览 178 01-18

OpenAI和DeepMind大佬离职联手,誓用AI科学家实现室温超导!已融3亿美元

新智元 浏览 319 10-02

微信iOS又有新功能 聊天终于能发实况图片了

快科技 浏览 10575 07-13

2026年量产 特斯拉Cybercab将于进博会首发

车质网 浏览 233 10-31

多辆无人驾驶出租车在洛杉矶被烧毁 损失或超60万美元

澎湃新闻 浏览 3192 06-10

S妈心灵受重创,不敢再跟家人到国外旅行,害怕再度失去亲人

素素娱乐 浏览 5624 07-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11