关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2025-11-25 12:00:01176人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

雅斯特酒店回应房客发病送药不及时死亡:送药者未告知病情,隐私考虑未查看药品

封面新闻 浏览 192 11-25

保罗致谢马刺:对这段旅程心怀感激自豪能成为球队一份子

直播吧 浏览 3309 07-22

寒武纪高处不胜寒

富凯财经 浏览 422 08-20

我国科学家揭秘月球“晚年”为何还有火山喷发

环球网资讯 浏览 403 08-23

上年纪的女人穿衣,掌握这3个搭配“小套路”,越老越有气质

静儿时尚达人 浏览 373 09-06

谷歌回应广告垄断指控:AI和平台影响下,开放网络迅速衰落

澎湃新闻 浏览 347 09-10

东方甄选难解“大主播后遗症”:董宇辉单飞一年粉丝已超5千万,俞敏洪转型路在何方?

时代周报 浏览 430 08-21

多地楼市新政密集落地 背后还有一个大信号

商业观察杂志社 浏览 347 09-10

美联航一航班起飞后引擎发生故障 飞行员发出紧急求救信号

环球网资讯 浏览 5733 08-04

当美妆变成快消品,为何还需要一件“传家宝”?

时尚COSMO 浏览 324 09-26

近两个月13家券商收罚单 投行、经纪业务是重灾区

证券时报 浏览 203 11-17

今年最流行的5双鞋,配阔腿裤太好看了!

LinkFashion 浏览 793 06-16

硬抢1.5亿用户!短视频之后,中国下一个流量战场被引爆

网易科技报道 浏览 406 08-19

这个季节高发!中国2亿人被它折磨

科普中国 浏览 5803 06-03

捡来的便宜!翻垃圾找到6TB SSD:六块1TB的三星850 Pro

快科技 浏览 418 08-25

「躺赚」130%的极简,你拿得住吗?

简七理财 浏览 2527 07-15

新建核潜艇、升级核武 英军事战略转向全面"备战"

央视新闻客户端 浏览 6195 06-03

AI越来越强,程序员和软件产业就要消失了?

诗与星空 浏览 34 04-22

从50天减至10天!特朗普确定对俄罗斯最后通牒新期限,原油盘中大涨超4%

华尔街见闻官方 浏览 9014 07-30

陈晓做梦都没料到 陈妍希离婚仅半年就开启新生活

新语爱八卦 浏览 3712 07-16

英超首轮积分榜:曼城大胜领跑,卫冕冠军&2升班马在内的7队3分

直播吧 浏览 338 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11