关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02332人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

手握好题材,《利剑·玫瑰》却给浪费了!

电和影 浏览 8649 08-13

特朗普将发涉俄"重大声明" 同日俄美外长会谈细节披露

鲁中晨报 浏览 4870 07-12

辛巴宣布退出直播行业,辛选集团由妻子初瑞雪接管

网易科技报道 浏览 491 08-19

满屏爱张力,现偶活过来了!

吐槽电影院 浏览 252 12-22

76人新赛季不败金身被破,全胜球队仅剩马刺、雷霆和公牛

懂球帝 浏览 328 11-01

汪小菲信守承诺带娃玩,小玥儿正脸太像大S

观察鉴娱 浏览 8602 07-08

8.98 万元的 B01,零跑推了一台「半价 Model 3」

极客公园 浏览 3651 07-25

阿尔特塔:对结果感到失望 为球员们感到自豪

体坛周报 浏览 536 09-01

曼联本季联赛目前射门数达56次&全英超最多,断层领先第二

直播吧 浏览 362 09-02

轻松!王楚钦横扫张本智和,取得对阵张本智和的8连胜

直播吧 浏览 2887 07-14

72岁赵雅芝1588生日会门票秒没,网友:人傻钱多

港剧叔 浏览 374 10-19

伊朗国安会前高官:引爆美伊冲突存多种可能

澎湃新闻 浏览 223 02-21

约克雷斯谈爆冷输科索沃:战术是一个因素,关键还是球员表现不佳

直播吧 浏览 464 09-09

绿茵三十载,长春亚泰将于6月6日举办成立30周年主题活动

懂球帝 浏览 71 06-02

华为版CUDA,全面开源了

量子位 浏览 3360 08-07

特朗普:再给普京“几周”时间 我知道我在做什么

参考消息 浏览 584 08-24

王晶为妻子庆祝生日,70岁丁德君温婉端庄像40岁

心静物娱 浏览 485 08-25

以媒:爆发冲突,意大利队在赛后已就部分球员行为向以色列队道歉

直播吧 浏览 447 09-11

阿尔特塔:哲凯赖什已准备好再次出场;球队所做一切皆为争冠

懂球帝 浏览 512 08-23

7.48万元!比亚迪元UP加推新版:续航301km,便宜够用

电车通 浏览 7372 07-31

46岁罗志祥近况曝光!去国外开演唱会和粉丝击掌

萌神木木 浏览 488 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11