关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024953人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄联邦航天局发回太空实验鼠失重画面

看看新闻Knews 浏览 464 09-02

手表微信来了:小米 REDMI Watch 5 开启内测特邀用户招募

IT之家 浏览 3870 08-09

加拿大留学7年,95后小伙回杭开奔驰摆摊卖盒饭!“大家都只活一次,重要的就是体验生活”

都市快报橙柿互动 浏览 286 11-25

配置提升 2026款丰田铂智3X将于今日上市

车质网 浏览 115 05-09

机器人变身售货员!天府绛溪实验室这一临时“训练场”正式启用

红星新闻 浏览 8874 08-07

iOS 26公测版发布:视觉交互优化 修复多项问题

网易数码 浏览 10122 07-25

城区油耗2L级 长安逸动/CS75 PLUS蓝鲸超擎抢订价7.99万起

网易汽车 浏览 135 04-29

百万人围观,「上下文图谱」火了,万亿美元新机遇?

机器之心Pro 浏览 272 12-29

滑翔伞飞行员被"云吸"高空背后:有机构曾提示近期天气变化

南方都市报 浏览 3474 05-30

美军大兵压境 委内瑞拉发现一邻国与中情局勾结

上观新闻 浏览 332 10-29

全新丰田SUV上市!焕新价10.28万起 配2.0L混动

小史谈车 浏览 451 09-30

小区居民听说家门口要办"殡葬一条街"炸锅了:非常膈应

大风新闻 浏览 88 06-02

布拉格队长:下半场我们想踢得更具威胁,但阿森纳太强了

懂球帝 浏览 328 11-05

纳瓦斯:得知转会曼联失败我十分冷静,这激励了我的皇马生涯

懂球帝 浏览 245 03-03

美国与欧盟达成贸易协议,对欧输美商品征收15%的关税

上观新闻 浏览 7429 07-28

别克GL8陆上公务舱智享版上市 售24.99万元

车质网 浏览 338 09-12

阿卡强调休息的重要性:“我爱网球,但连续参赛的日子太多了”

网球之家 浏览 603 08-12

7月新能源战绩点评 零跑霸榜 蔚小理重新排位

网易汽车 浏览 8976 08-02

西贝冷冻大黄鱼用X光去刺引争议 专家:可放心食用

极目新闻 浏览 524 10-02

多巴胺“粉”,赫本是这样穿的!

Yuki女人故事 浏览 77 05-27

警惕“夺命”蜱虫!

网易健康 浏览 1853 02-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11