关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019378人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨力维和杨舒予,是姐妹,也是战友

界外编辑部 浏览 4055 07-17

他的魔幻鬼马杰作,可远远不止《天使爱美丽》

幕味儿 浏览 925 07-10

电讯报:带队5-0塞尔维亚的图赫尔让人回想起2008年的卡佩罗

懂球帝 浏览 355 09-11

确认鹿晗和关晓彤分手,透露女方酒局没醉过

蕾爸退休日记 浏览 177 12-24

微微一笑澳大利亚主帅:这场比赛非常艰难,对结果很满意

直播吧 浏览 371 09-10

TVB颁奖礼红毯老龄化严重!50岁佘诗曼压轴,黄宗泽老到认不出

萌神木木 浏览 114 01-05

推广|| 用了5年才来推荐,多亏它保住我的发际线

黎贝卡的异想世界 浏览 367 08-16

苹果发布会“牙膏挤爆”,但缺了最性感的部分

首席商业评论 浏览 365 09-11

上了年纪的女人,请远离“假时髦、精致土”,这样穿才显得体

静儿时尚达人 浏览 1671 08-05

天花板砸落致17岁店员身亡,茉莉奶白回应!所在商场曾被罚款……

国际金融报 浏览 464 08-19

中酒协秘书长何勇:一款号称用了“世界上最好的原料”的啤酒新品,一定卖不好

红星资本局 浏览 451 08-12

榜妹热线 |王一博又被造谣?曾舜晞杀青后续?宋祖儿新剧无缝进组?代露娃资源飞升?哈妮克孜再演女二?

趣看热点 浏览 2988 07-15

救一家三口牺牲的小伙宋士佳下葬 送行队伍蜿蜒百米

极目新闻 浏览 4987 07-28

儿子车祸过世后 上海阿姨精神异常每天在小区里骂人

环球网资讯 浏览 486 08-25

两位民营企业家登上人民大会堂主席台

一见财经 浏览 122 03-11

交手6次输了5次!林诗栋连追3局后葬送机会 张本智和4-3晋级决赛

风过乡 浏览 2517 07-13

半年报盘点|500倍业绩王诞生,食品饮料行业二季度净利润环比暴跌43%

网易财经 浏览 368 09-02

中国男子在美移民拘留所被押5天 于淋浴间自缢身亡

看看新闻Knews 浏览 7049 08-11

白家犯罪细节披露:强迫20名女子卖淫 不接客关小黑屋

央视新闻 浏览 2290 07-12

杨幂孙俪已经认识20多年了,如今双“视后”

韩小娱 浏览 417 08-21

小红书社区公约2.0里的「UGC社区进化史」

周天财经 浏览 190 01-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11