关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024874人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄外交部:扎波罗热核电站归属俄罗斯不容置疑

上观新闻 浏览 324 09-20

纳指、标普再创新高,特斯拉涨超4%

中新经纬 浏览 5897 07-11

“医美茅”上半年净赚近8亿!爱美客抗周期能力凸显,双轮驱动支撑稳健增长

时代周报 浏览 461 08-20

早有预兆!浙江老板遭刑事强制,一个多月前已有小道消息

壹只灰鸽子 浏览 274 10-22

中俄海军8月将举行联合演习 专家解读三大亮点

环球网资讯 浏览 4313 07-31

新不如旧!这4件时髦“旧衣服”今年太火了

LinkFashion 浏览 163 01-25

5名员工出差连夜开车遇车祸3人当场死亡 均系家中独子

红星新闻 浏览 8358 07-25

宗馥莉的两大心腹疑似离职,“宏胜系”权力大洗牌

财通社 浏览 269 10-15

VLOG:直升机博览会初探

新华社 浏览 260 10-16

与AI机器人同行,中山万人徒步共迎新年

南方都市报 浏览 185 01-02

西安市委书记方红卫任上落马 7月刚表态韩松被查

鲁中晨报 浏览 206 11-08

特朗普驳斥“美军打击伊朗计划已获批准”报道

环球网资讯 浏览 5768 06-20

9月多家新势力交付创新高:零跑突破6万辆,小鹏、小米超4万辆

澎湃新闻 浏览 287 10-02

图片报:埃贝尔送走8将腾出7600万欧,最终节省3500万欧薪资成本

直播吧 浏览 357 09-10

英伟达 CEO 黄仁勋回应大热天穿皮夹克:仅有一套西装未来得及干洗

环球网资讯 浏览 1897 07-16

中国车企带来“鲇鱼效应”,美国关税遭致强烈反对,“中美因素”影响欧洲最大车展

环球网资讯 浏览 390 09-10

被问想通过电影《731》向日本传递何种信息 中方回应

外交部网站 浏览 434 09-19

谁说了算?泰伦-卢赛前说哈登可以出战,快船官方说卢说错了

懂球帝 浏览 207 12-16

上海自动驾驶实训场建设成果发布 全新“绝影开悟”世界模型亮相WAIC 2025

网易汽车 浏览 1074 07-27

1家5口被失控车撞倒:爷爷离世 遇难孩子刚幼儿园毕业

大风新闻 浏览 461 08-17

奥迪 Q6L e-tron / Sportback e-tron 双电机四驱版申报

IT之家 浏览 382 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11