关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02334人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

正佳科学馆·正佳天文馆“星际领航”展区启幕

南方都市报 浏览 3260 07-12

新疆98-56大胜送四川18连败,凯文-哈里斯19+7+3,纳托尔15分

懂球帝 浏览 190 01-23

剑指AI终端产业,东莞和深圳携手再放大招|东莞一周

南方都市报 浏览 285 10-20

累计减持超5%,湘财股份撤离大智慧!

独角金融 浏览 3396 07-18

夏季穿衣别太沉闷老气!这些穿搭值得试一试,舒适耐看又减龄

静儿时尚达人 浏览 498 08-14

德媒:卖完科曼后监事会只允许埃贝尔租球员,他既惊讶又困惑

直播吧 浏览 434 08-20

8月底欧锦赛将重燃战火 法德塞尔维亚是夺金热门?

仰卧撑FTUer 浏览 2633 08-06

阿Sa闪婚原因曝光,曾冻卵计划40多岁生小孩

萌神木木 浏览 12 04-29

冯兴亚澄清员工持股风波,埃安仍需爆款突围

帮宁工作室 浏览 8836 06-24

OpenAI拿下IMO金牌,职业数学家崩溃:我终于明白李世石为何会落泪

新智元 浏览 10012 07-25

外观微调配置全面 小鹏P7+新老款车型对比

车质网 浏览 157 02-02

孙怡首谈生孩子还会漏尿,如今有点后悔

寻墨阁 浏览 5019 08-07

金价持续调整,投资者该入局吗?

国际金融报 浏览 2312 07-13

罗马诺:费内巴切就埃德森提交了新报价,转会正在走向实质

懂球帝 浏览 395 09-01

首次!YH-1000,成功完成

环球网资讯 浏览 3102 07-29

听说新能源车“不入东三省”?打破技术垄断的全新MG4偏向“虎山行”

澎湃新闻 浏览 476 08-12

颜丙燕公开恋情 男友小她20岁,被误认成“儿子”

韩小娱 浏览 280 10-16

你从托马斯·穆勒身上吸取教训了吗?

绿茵情报局 浏览 190 01-20

男童被狗咬伤离世 疫苗无用?

网易健康 浏览 7316 06-03

空间升级/后排配腿托 豹8大五座版上市售37.98万起

网易汽车 浏览 278 10-21

小扎“亿元俱乐部”开招白菜岗,年薪20-30万美元

量子位 浏览 421 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11