关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015925人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普的亲家激怒法国政府:控告法国纵容"反犹情绪"

环球时报国际 浏览 525 08-26

首搭图灵AI芯⽚ 小鹏G7上市 19.58万起

网易汽车 浏览 8641 07-05

全新小鹏P7全球首发冰雪AES:湿滑路面刹不住或转向过大都能应对

IT之家 浏览 429 08-21

王伟中已兼任内蒙古党校校长

界面新闻 浏览 304 10-02

面向国家关键行业,中国电子云发布全链路AI解决方案

观察者网 浏览 9208 07-27

“云”上看长春航展 战机训练大图先睹为快

环球网资讯 浏览 263 09-16

朴素的商战,从“0元购”开始

时尚COSMO 浏览 3456 07-24

官方点赞️NBA官推:开拓者新秀杨瀚森的脚步太棒了

直播吧 浏览 10225 07-13

米哈游持股11.86%,Suplay冲刺“收藏级卡牌第一股”|港E声

时代周报 浏览 193 01-07

字节在新加坡171名员工食物中毒 云海肴被顶格罚款

中国新闻周刊 浏览 5192 07-20

拒绝吉达国民4500万欧元报价,记者:扎卡里亚将会留在摩纳哥

懂球帝 浏览 421 08-20

快手“午夜惊魂”,4亿用户信任一夜崩塌

深蓝财经 浏览 178 12-24

特朗普称赞高市:如果安倍知道你当首相 肯定非常高兴

第一财经资讯 浏览 276 10-29

宝宝黄疸,必须停母乳?错!

网易健康 浏览 9809 06-12

王鸥女儿疑曝光!扎着小辫胖嘟嘟,知情人曝王鸥和何九华已结婚

探源历史 浏览 1367 07-15

顶流歌手、8次登上春晚,却沦为走穴歌手的毛宁

温读史 浏览 416 09-02

口子窖的百亿目标受阻,高端化未见成效,省外扩张乏力!

征探财经 浏览 469 08-21

卫星电话关键时刻保命:网友分享使用华为 Pura 70 Pro+ 脱困经历

IT之家 浏览 2578 07-29

穆尼奥斯:会以最好表现回报深圳球迷,让对手难以在我们主场取胜

直播吧 浏览 2221 08-06

特朗普:半导体关税要来了 可能达到300%

参考消息 浏览 516 08-17

缓存有望超 200MB:消息称英特尔和 AMD 正比拼大缓存 CPU

IT之家 浏览 2307 08-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11