关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02330人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

智己汽车11月销量13,577台,连续三个月刷新历史纪录

网易汽车 浏览 308 12-02

唐嫣罗晋离婚?她的状态早就说明一切

隔壁灵妹妹 浏览 312 11-02

当智能体爆发在即,数据库如何成为“发动机”?

科技行者 浏览 291 01-20

男子被骗至缅甸妙瓦底获救 曾与记者往来邮件一百多封

新京报 浏览 2349 07-26

东体:申花针对国安三中卫做文章,三次转换机会打进三球

直播吧 浏览 7406 07-21

穆迪:卢尼带我入门瑜伽这项运动 我们经常一起练习

直播吧 浏览 4226 07-26

特朗普插手泰柬冲突,争议地区发现大型稀土矿,中国要出手吗?

北向财经 浏览 4232 07-28

一名香港警察疑被困柬埔寨诈骗园区 香港保安局回应

新京报 浏览 441 09-01

王欣瑜因伤止步布拉格250赛四强,网友感慨:终于从委屈中解脱了

网球之家 浏览 1520 07-26

男子称小区卖16个"违规车位"价值超百万 如今要求撤除

封面新闻 浏览 559 08-19

苹果首款低价MacBook来了!搭载iPhone处理器 对标入门Windows PC

快科技 浏览 297 11-05

苹果终于抛弃精织斜纹!iPhone 17系列官方手机壳亮相:合成纤维材质

快科技 浏览 504 08-20

五十岁也优雅的女人,穿衣搭配不扮嫩和穿老年装,体面又时尚

静儿时尚达人 浏览 10031 07-22

李在明访华签下3亿大单祭拜抗日英雄 转头突然宣布访日

博览历史 浏览 272 01-11

卖爆了!谁在“抄底”深圳

博闻财经 浏览 391 09-21

麻六记酸辣粉「塌房」,贴牌产品还有人买吗?

豹变 浏览 2742 08-06

售24.98万起 2025款理想L系列智能焕新版上市

网易汽车 浏览 533 05-10

对话“死了么”App创始人:这几天付费人数翻了200倍;另有“活了么”App上线

红星资本局 浏览 292 01-12

杭州10岁男孩猛地看到自己床上有蛇 蛇系从邻居家逃出

极目新闻 浏览 4521 07-28

社交倦怠的年轻人,遇见有「活人感」的AI

36氪 浏览 424 09-11

项立刚再批罗永浩!为搞流量煽动舆论,被封就是活该

雷科技 浏览 287 12-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11