关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02405人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马克-普维尔:我能很快地融入到球队;想在马竞赢得荣誉

懂球帝 浏览 7849 07-26

北京79-73战胜浙江 球员评价:2人优秀,4人及格,4人低迷

篮球资讯达人 浏览 318 01-23

梅伦多:我一直有着对冠军的渴望 希望武磊早日从伤病中康复

直播吧 浏览 6167 07-14

海南封关,就能半价买豪车了?

汽车公社 浏览 243 12-22

九三阅兵 他们将第一个走过天安门广场

上观新闻 浏览 14818 08-23

4岁男孩住酒店后确诊川崎病?12345回应

红星新闻 浏览 8059 10-29

曝加纳乔只愿加盟英超欧冠参赛队!曼联降价至4000万,却无人报价

罗米的曼联博客 浏览 5113 07-24

A股1天2度"冲高翻绿" 居民存款出现"搬家"现象

每日经济新闻 浏览 587 08-20

知名男星老婆晒全家福宣布诞下三胎

探长影视解说 浏览 401 09-26

冯绍峰新恋情刚曝,陈晓赵丽颖就传二搭?

喜欢历史的阿繁 浏览 530 08-11

记者:斯图加特中场米约已获准与马竞进行谈判

懂球帝 浏览 10025 07-27

多国要求以色列撤回“接管加沙城”计划

环球网资讯 浏览 4655 08-11

北京大学教授俞孔坚在巴西坠机遇难

澎湃新闻 浏览 445 09-25

牛弹琴:中国周边又一场激烈冲突开始了 两国大打出手

现代快报 浏览 4382 07-25

克林顿与爱泼斯坦案受害者共浴照片披露:坐在浴缸里

扬子晚报 浏览 239 12-21

今夏流行“不穿裤子”,太撩了!

Yuki女人故事 浏览 5345 08-10

智己LS8官图发布:5米车长增程动力 理想L8怕了吗

大李说车 浏览 258 01-25

卫星互联网低轨 12 组卫星发射成功,长征系列火箭 600 次里程碑

IT之家 浏览 387 10-16

男子"想摸美腿丝袜"约女子打台球 消费5062元拒付被打

潇湘晨报网 浏览 5105 07-29

越南传奇女飞行员阮安秋第二次环球飞行坠亡 年仅44岁

红星新闻 浏览 7215 08-05

安卓版谷歌Gemini AI助手灰度测试“聊天历史记录搜索”功能

IT之家 浏览 8395 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11