关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019458人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美联储理事米兰再次呼吁加快降息,断言“潜在”通胀接近目标,称任期或延长

华尔街见闻官方 浏览 270 12-16

媒体:冯德莱恩听特朗普召唤 在关税面前显得无力

新民周刊 浏览 2098 07-29

王晶曝赵文卓梅艳芳分手原因,意外牵扯出古天乐

阿废冷眼观察所 浏览 4417 08-13

最新现场:山东舰完成年度最后一次海上训练

环球网资讯 浏览 254 12-18

奇瑞压缩供应商账期至47天

盖世汽车 浏览 576 08-26

景区欲花1.27亿给大山装扶梯惹争议:资金来自专项债

中国新闻周刊 浏览 535 09-01

“打不开的车门”为何成致命陷阱?

国际金融报 浏览 337 10-20

堪比汽车诞生!黄仁勋给出人工智能时代生存答案

环球网资讯 浏览 10 06-17

乌克兰新型导弹"火烈鸟"照片披露:射程突破3000公里

每日经济新闻 浏览 588 08-22

刚刚,智谱发布GLM-4.5:面向推理、代码与智能体的开源SOTA模型

学术头条 浏览 889 07-29

以军称已有87万巴勒斯坦人从加沙城撤离

环球网资讯 浏览 403 10-04

西安阿房宫药业遭问询,业绩连亏6年

粉巷财经 浏览 1689 07-25

前助教:穆里尼奥的离开是意甲的重大损失,罗马输欧联决赛太可惜

直播吧 浏览 5425 07-30

530亿拼购巨头,力辩财务疑云

21财闻汇 浏览 3044 07-31

特朗普:我说服了自己暂缓对伊朗采取军事行动

澎湃新闻 浏览 288 01-18

帕金斯:保罗不是历史前10的控卫 我不会把他排在威少前面

直播吧 浏览 1911 07-27

今秋交付 梅赛德斯-迈巴赫V12 Edition发布

车质网 浏览 392 09-25

杨洋《凡人修仙传》开播差评一片?理由出奇一致

娱乐圈笔娱君 浏览 7224 07-29

压根没想卖?名记:爵士仍然视马尔卡宁为未来核心阵容中的一员

直播吧 浏览 3090 07-16

2025公益热度排名:肖战压过王一博登顶公益榜

未曾青梅 浏览 283 01-15

今年双11,搞出了点新意思

虎嗅APP 浏览 258 11-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11