关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028205人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

网红“健康”食品,把中产绕晕了

虎嗅APP 浏览 1212 07-17

吉利11月销量破31万辆 连续9个月同环比双增长 再刷历史新高

网易汽车 浏览 283 12-02

记者:U21联赛和U19中青赛合并为U20联赛,只是超龄球员数额不同

懂球帝 浏览 249 02-05

中国市场缺席,特斯拉将 FSD 转移促销计划扩展至欧洲及中东地区

IT之家 浏览 8932 07-24

蔚来官宣:降价2万元

第一财经资讯 浏览 460 08-20

零跑终于不用证明自己还活着了

汽车公社 浏览 495 05-28

俄知名富商前CEO失踪4天 手机信号消失在沿海悬崖

红星新闻 浏览 306 01-13

奇瑞汽车宣布三大升级计划,2026年超35款车型将搭载猎鹰智驾

IT之家 浏览 310 01-18

五粮液是会计差错还是财务造假?

诗与星空 浏览 119 05-06

那不勒斯训练营大名单:德布劳内、诺阿-朗入选,奥斯梅恩缺席

懂球帝 浏览 2161 07-18

防御"利刃"出鞘:反无人机强大"铁三角"

上观新闻 浏览 359 09-08

大爷奔现后吃野菜度日:女友自称老板 会给我买房买车

小莉帮忙 浏览 80 06-02

柬内政部称一名中国公民在柬泰冲突中受伤

北京日报 浏览 243 12-23

“嘎子”谢孟伟被执行超1400万元 并被限制高消费

新京报 浏览 337 10-14

机场航站楼有人坠落砸到保洁员 画面披露

极目新闻 浏览 538 08-22

沪指站上3800点 芯片股爆发 寒武纪涨停

网易财经 浏览 481 08-23

里程碑,勇士主帅科尔取生涯执教第600胜&位列NBA第28位

懂球帝 浏览 202 03-17

百度崔珊珊可能不会远离权力中心

YOUNG财经 浏览 7109 07-31

李兰迪元气透亮肌的权威,我后知后觉

时尚COSMO 浏览 5869 07-30

特朗普将美国防部更名 媒体:美国有人看到自身的衰退

新民周刊 浏览 508 09-09

希腊主帅:字母哥多次犯规被漏判,他本应获得更多的罚球

懂球帝 浏览 407 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11