关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2025-11-25 12:00:01266人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今日热点:许光汉否认和周子瑜恋情;郝熠然与诚实一口终止合作……

伊周潮流 浏览 145 04-18

鲁内眼中,那个让他敬畏的辛纳是如何炼成的

网球之家 浏览 286 01-15

瓜迪奥拉:胡桑诺夫明天可上场踢几分钟;罗德里还没完全恢复

懂球帝 浏览 306 10-29

鹿晗的“体面”,终于被关晓彤撑起来了

娱乐圈笔娱君 浏览 270 01-06

九三阅兵后第一个"刺头"出现 中方撂12字给对方"上课"

空天力量 浏览 544 09-10

腾讯《虚环》《穿越火线:虹》公开实机演示;心动投资AI游戏公司;GPT-5可分钟级生成3D游戏 | 氪游周报8.4-8.10

36氪 浏览 1130 08-10

全球科技资本博弈:“抢人大战”盖过并购潮

蓝鲸新闻 浏览 4188 07-22

定位中型SUV 丰田兰德酷路泽FJ效果图曝光

车质网 浏览 478 05-19

曹圭成:手术出现并发症后我体重掉了14公斤,瘦得皮包骨

懂球帝 浏览 459 09-09

何穗:新生亦重生

时尚COSMO 浏览 203 03-11

现在买显卡你会选什么:万人投票结果超半数选择RX 9060 XT 16GB!

快科技 浏览 4248 07-28

韦东奕在两人陪同下去医院看牙 曾因牙齿脱落引关注

极目新闻 浏览 9355 07-11

波士顿动力人形机器人亮相CES 拟2028年进厂造车

网易汽车 浏览 266 01-07

从一罐无糖,到“全城疯迷”:百事如何把联名做成渠道新生意

新零售财经 浏览 290 12-21

极石汽车1月交付新车1028台 拓宽海外业务

网易汽车 浏览 263 02-02

甜了10年,超多暧昧细节,全网求他俩原地结婚

Yuki女人故事 浏览 272 01-26

豫媒:全省上下的支持,是河南队冲击足协杯冠军的最大底气

懂球帝 浏览 493 08-23

饿了么前CEO巨贪案:供应链管理失能

虎嗅APP 浏览 10192 07-27

马斯克:SpaceX今年收入将超155亿美元 明年或超NASA整年预算

潇湘晨报 浏览 4686 06-05

68倍PE,凯赛生物值不值?

节点财经 浏览 8513 07-26

阿维塔或四季度赴港IPO:三年累计亏损97.26亿元,估值约300亿

明镜pro 浏览 381 09-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11