关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02269人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

京粤沪专家齐聚,2026“人工智能+”教育行动在深外举行

南方都市报 浏览 13 04-29

美国一飞船出现故障 150人骨灰全扬在太平洋

界面新闻 浏览 5898 06-28

华硕灵耀14双屏2026来袭:酷睿Ultra X9加持,移动办公集大成者

IT之家 浏览 168 02-02

意大利诺:因莫比莱状态非常好,他有着20岁年轻人的特质

懂球帝 浏览 420 08-23

招行原副行长年近70岁被查、曾年薪332万,退休后兼齐鲁银行独董

湘财Plus 浏览 368 09-11

从WAIC上爆火的功夫机器人,看到这家央企的具身智能「真功夫」

机器之心Pro 浏览 6246 07-29

美财长:世界经济最大风险就是99%高端芯片在台湾生产

澎湃新闻 浏览 438 09-26

华为巴黎发布新品:HUAWEI WATCH GT6 系列全球发布

IT之家 浏览 359 09-20

铜梁融媒:U16国足已抵达重庆备战,全力冲刺U17亚洲杯预选赛

懂球帝 浏览 253 11-12

世界第一林诗栋3-4不敌张本智和!张本智和决赛战世界第二王楚钦

直播吧 浏览 9453 07-13

特拉维夫多处建筑遭袭 相关区域实施严格管制

环球网资讯 浏览 121 03-02

京东AI爆发:“狂扫”机器人赛道后,官宣与数十家机器人品牌达成合作

时代财经 浏览 1795 07-29

美国再退66个"群" 外交部回应

界面新闻 浏览 196 01-09

武大事件升级 疑老师辟谣:女方保研合规 14人中排第9

火山诗话 浏览 6951 08-05

媒体:特朗普凌晨出手 内塔尼亚胡迫于压力道歉了

中国新闻周刊 浏览 401 10-01

这场研讨会关注视障教育将如何被AI改变?

上观新闻 浏览 253 10-18

长城魏牌汽车,到底被谁“逼急”了?丨正经深度

正经社 浏览 184 01-12

2年1亿美元!杜兰特有望与火箭达成续约:比顶薪标准少拿2210万

罗说NBA 浏览 429 08-11

透视全球车企财报:为何中国车企活得更稳?

小号撩车 浏览 469 05-09

美国抓走马杜罗计划曾外泄 美媒收到计划后未公布

新京报 浏览 185 01-05

13米挂车为摩友"挡风"20分钟 摩友寻到司机欲酬谢被拒

极目新闻 浏览 422 09-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11