关闭广告

美团杀入开源大模型混战:LongCat登场,推理速度直破100 Token/s

AI寒武纪2025-09-01 00:00:01447人阅读


美团也推出一款名为 LongCat-Flash 的非推理开源(MIT)大模型,总参数量为 5600亿, MoE架构,激活 186亿至313亿参数(平均约270亿),模型性能看起来还是很不错的,尤其在智能体(Agentic)任务方面表现突出


一大看点是模型采用了 shortcut-connected 架构,扩展了计算与通信的重叠窗口,使推理能够在成本可控的情况下达到每秒100 Token 以上,我刚试了一下速度真的超快

体验地址:

https://longcat.ai

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

零跑Lafa5:一副钢炮的皮,一颗家用的心?

Autolab 浏览 338 11-09

大众乘用车中国CEO的交棒时刻:孟侠的"锦囊"与"行囊"

网易汽车 浏览 5446 06-23

张碧晨陷原唱风波 汪苏泷已给足体面 还是被打脸

联友军事 浏览 6208 07-29

1月销量环比暴跌超20%!雷军:一季度本就是汽车销售淡季,且初代SU7已停售

商用车头条 浏览 261 02-03

炬芯科技赋能全场景AI音频应用

爱集微 浏览 469 09-10

雷克萨斯产品大变动 全新IS将于2026年亮相

车质网 浏览 10392 08-04

负债累累!百年巨头宣布破产保护

汽车工程师 浏览 490 06-16

1.77亿患者,等待一款痛风药

虎嗅APP 浏览 753 07-15

经贸合作为中拉经济持续发展增添新动力

浏览 4639 07-14

MiniMax冲刺科创板,“大模型双雄”有望会师A股

国际金融报 浏览 59 06-02

Mercado:拉美 “阿里” 慢功夫的千亿市值路

钛媒体APP 浏览 3203 07-13

以军72小时内袭击叙利亚 黎巴嫩等6国

环球网资讯 浏览 423 09-12

天弘基金对话陆灏川:“反内卷”催化创业板战略配置机遇

证券市场周刊 浏览 1733 07-17

泰柬边境冲突持续 柬国防部指控泰方实施"毒气袭击"

环球网资讯 浏览 8096 07-29

小切口解决大问题 “人工智能+”加出了什么?

北青网-北京青年报 浏览 415 09-09

南京一景区内长满浮萍的水潭走红 景区:定期会清理

潇湘晨报 浏览 2220 07-15

重庆用无人机表演库里三分!詹宁斯:他们太疯狂了

直播吧 浏览 1432 08-19

民用航空法修订草案将二审

红星新闻 浏览 6320 06-23

“薄荷绿+巧克力棕”今年夏天最美配色,谁穿谁好看!

LinkFashion 浏览 6522 07-08

以色列对卡塔尔首都多哈发动袭击 称目标是哈马斯高层

财联社 浏览 548 09-10

曝古二家人被骚扰!90多岁外婆被人找上门,难怪放录音重锤王家卫

萌神木木 浏览 273 11-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11