关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02403人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《逐玉》注水风波升级!315评论区沦陷

萌神木木 浏览 197 03-11

将于9月份上市 全新问界M7内饰曝光

车质网 浏览 511 08-20

阿斯:西班牙希望亚马尔与皇马之间关系能正常,别影响世界杯

懂球帝 浏览 300 01-19

杨少华突然去世没留下遗言 被质疑遭儿子过度"消费"

新民周刊 浏览 1230 07-11

荷兰政府对安世半导体实施全球运营冻结 闻泰科技回应

财联社 浏览 363 10-13

莱巴透露战斯瓦泰克的两大关键,丝袜称气温还这么高会手足无措

网球之家 浏览 255 01-27

新疆夜空现不明飞行物 星空摄影师称系俄罗斯火箭

极目新闻 浏览 2411 07-05

刚被马斯克收购,Cursor新模型:10万卡加持,和Opus、GPT一样大

机器之心Pro 浏览 11 06-17

携程迎来监管风暴

华尔街见闻官方 浏览 277 01-15

《长安二十四计》成待播剧王,成毅1人单挑12权臣,谁不想看呢

最爱酷影视 浏览 8752 07-10

闫学晶"哭穷"引争议被禁止关注 知名品牌终止其代言

极目新闻 浏览 314 01-12

印度异想天开,万万没想到,中国早布天罗地网

浏览 9934 07-14

牙周科专家破解口臭3大谣言

网易健康 浏览 4346 03-21

翁虹女儿18岁成人及笄礼惊艳全网

艳姐的搞笑视频 浏览 342 10-13

50岁女性冬季穿衣指南:避开 2 大禁忌,这样得体又时髦

静儿时尚达人 浏览 300 12-03

泰禾集团:董事长黄其森因涉嫌违法被辽宁省新民市监察委员会实施留置措施

网易财经 浏览 432 08-23

小S的第3个女儿发自拍照,14岁就很漂亮,外形完成惊艳蜕变

素素娱乐 浏览 233 02-24

内娱又一个女明星,「疯」了

独立鱼 浏览 5506 08-06

特斯拉副总裁陶琳发文谈“刹车门”:交给时间

极目新闻 浏览 1890 07-15

何美延玩游戏都会生气,连Anson都对她应激了

老吴教育课堂 浏览 175 12-21

胡塞武装:以军空袭萨那致9死174伤 包括大量妇女儿童

极目新闻 浏览 402 09-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11