参考指南

8月6日消息，于本周一发布了其旗舰模型的升级版Claude Opus 4.1，该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分，超过了OpenAI的o3模型（69.1%）和谷歌的Gemini 2.5 Pro（67.2%），进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升，Opus 4.1还在研究和数据分析，特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构，在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时，Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3（ASL-3），要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示，Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为，例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响：企业热捧与开发者的审慎

尽管存在安全疑虑，企业客户的采纳热情并未减弱。GitHub方面表示，Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”；乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务，月费高达200美元，在几乎没有市场推广的情况下，仅用数周时间便实现了收入翻番，目前年度经常性收入已达到4亿美元。

开发者阮明日 (

GPT-5发布前夜，Anthropic抢先出牌，发布新模型Claude 4.1

阿里副总裁确...

深圳＂卷尺哥...

媒体：特朗普...

《长安二十四...

拓记：老詹本...

吸职工血、吞...

小米推出米家智能净烟机 Pro：无油网免拆洗，券后 2999 元

泽连斯基会晤北约秘书长要求提供真正有效安全保障

广汽集团的“战时”生死局

美联储理事米兰再次呼吁加快降息，断言“潜在”通胀接近目标，称任期或延长

媒体：冯德莱恩听特朗普召唤在关税面前显得无力

王晶曝赵文卓梅艳芳分手原因，意外牵扯出古天乐

最新现场：山东舰完成年度最后一次海上训练

奇瑞压缩供应商账期至47天

景区欲花1.27亿给大山装扶梯惹争议：资金来自专项债

“打不开的车门”为何成致命陷阱？

堪比汽车诞生！黄仁勋给出人工智能时代生存答案

乌克兰新型导弹＂火烈鸟＂照片披露：射程突破3000公里

刚刚，智谱发布GLM-4.5：面向推理、代码与智能体的开源SOTA模型

以军称已有87万巴勒斯坦人从加沙城撤离

西安阿房宫药业遭问询，业绩连亏6年

前助教：穆里尼奥的离开是意甲的重大损失，罗马输欧联决赛太可惜

530亿拼购巨头，力辩财务疑云

特朗普：我说服了自己暂缓对伊朗采取军事行动

帕金斯：保罗不是历史前10的控卫我不会把他排在威少前面

今秋交付梅赛德斯-迈巴赫V12 Edition发布

杨洋《凡人修仙传》开播差评一片？理由出奇一致

压根没想卖？名记：爵士仍然视马尔卡宁为未来核心阵容中的一员

2025公益热度排名：肖战压过王一博登顶公益榜

今年双11，搞出了点新意思