关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:016026人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《麻省理工科技评论》发布2026年“十大突破性技术”

DeepTech深科技 浏览 289 01-13

闻泰科技回应:个别外籍高管试图颠覆公司治理结构

澎湃新闻 浏览 348 10-13

澳专家:我害怕的是对中国的无知

环球时报国际 浏览 556 09-02

高管窃取28人存单款2.5亿 一名被害储户起诉涉事工行

红星新闻 浏览 2800 07-16

看完九三阅兵美国乱了阵脚 NASA警告:不能让中国领先

空天力量 浏览 821 09-11

中国新能源汽车出海遭遇“专利围剿”

电动汽车观察家 浏览 475 08-27

2000元起家的“魔方狂人”,赚了2个亿

虎嗅APP 浏览 561 08-11

特朗普高喊和平,以色列悄悄磨刀:巴勒斯坦的血腥噩梦结束了?

宋鸿兵 浏览 352 10-17

隐蔽出动、突然袭击 歼-10超低空飞行含金量超高

环球网资讯 浏览 9926 06-03

好友忆溺亡大学生:活泼幽默 常开玩笑让我们介绍女友

南方都市报 浏览 4039 07-25

中化装备连亏6年!拟收购益阳橡机、北化机,股价一字板

时代周报 浏览 5187 07-30

深圳最牛“盲盒”,开出了下一个30年

老斯基财经 浏览 547 08-27

造车新势力,重要时刻!

中国基金报 浏览 271 01-07

轴距加长/六座 仰望U8L鼎世版预售130万元

网易汽车 浏览 1223 08-01

北京送走周琦陈盈骏范子铭之一才能引进赵睿 新疆去年追过陈盈骏

直播吧 浏览 487 08-26

新一轮上行周期,谁能抓住?

虎嗅APP 浏览 408 09-11

贝斯美实控人涉要约收购违规遭立案

中国经营报 浏览 338 11-01

一场针对日本的军演,却看出俄罗斯的决心

浏览 8276 07-14

没有狠活 新款特斯拉Model S曝光

懂车之道 浏览 566 06-09

半年暴涨超470%!中际旭创,实控人拟套现22亿!

侃见财经 浏览 385 09-29

拥抱变革,向智向新,2025中国新媒体智库报告正式发布

正解局 浏览 438 09-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11