关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:016027人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国足首发出炉!已27年不胜日本,久帅变阵5后卫,韦世豪先发

奥拜尔 浏览 6505 07-13

万科:董事长辛杰辞职

网易财经 浏览 280 10-13

曾毅手表事件休整后首次露面,发布新团队全家福

迷迭香的记忆a 浏览 266 12-23

美国被指对伊朗行动的准备在两周内完成

潇湘晨报 浏览 257 01-29

2025WAIC“人工智能精英夜话”定档:第一财经携手共探AI产业化应用价值脉络

第一财经资讯 浏览 3332 07-15

方程豹钛3拆车:情绪烘托到这份儿上,你会买单吗?

大飙车 浏览 279 12-21

尹锡悦在公园遛狗 韩在野党成员:享受最后的出游吧

红星新闻 浏览 9748 05-10

别克至境L7:新能源赛道,没有人能靠旧身份活下去

AutoBusiness 浏览 428 09-17

牛弹琴:美国参议员集体休假 特朗普破防气得破口大骂

映象网 浏览 5621 08-05

智元机器人的“野心”,能否撑得起150亿?

节点财经 浏览 454 08-23

澎湃新闻总裁、总编辑刘永钢:变革是一场没有终点的征程

澎湃新闻 浏览 7266 07-25

辽宁摄影金像奖获奖者李靖作品确定模仿抄袭

南方都市报 浏览 418 09-14

联合国秘书长敦促黎以冲突各方重返谈判桌

国际在线 浏览 244 03-15

BaaS方案售20.8万起 蔚来ET5/ET5T远空套装版上市

网易汽车 浏览 267 12-19

理想基地获评2025汽车制造超级工厂 AI驱动智造新范式

智车情报局 浏览 260 12-12

黄晓明的体面全被叶珂造完!叶珂复出后的发言,再次让黄成为笑柄

娱乐圈笔娱君 浏览 3212 08-08

SpaceX 星舰 9 号飞行事故调查结束,第十次试飞箭在弦上

IT之家 浏览 528 08-19

预计今年秋季发布 享界全新越野SUV谍照曝光

车质网 浏览 120 05-07

潘长江靠短剧实现逆袭,截下特朗普的流量?

最爱酷影视 浏览 713 08-04

哈梅内伊最新警告:若再次遭袭 伊朗将予以更猛烈反击

环球网资讯 浏览 5051 07-17

暗讽谁?莲花集团CEO:想两年做出一台车,但真做不到

智车情报局 浏览 383 09-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11