关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02329人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗:已迫使以色列单方面停止侵略

新华国际 浏览 6199 06-25

今年春天一定要拥有的针织,这样穿减龄又好看!

LinkFashion 浏览 244 02-22

花18万治疗阿尔茨海默病,值不值?

网易健康 浏览 2100 09-21

马卡:皇马目前没考虑施洛特贝克,弗里克很欣赏他但转会不易

懂球帝 浏览 336 01-12

搭载6缸发动机 宝马M3旅行版11月4日亮相

车质网 浏览 387 09-30

乌戈:今天是场起伏很大的比赛;过去几场打出了我们想要的风格

懂球帝 浏览 269 02-04

小米Watch Type-C充电底座发布:磁吸设计、共用手机线,39元

IT之家 浏览 226 03-11

长城欧拉出奇招:“一车多动力”打破单点竞争

经济观察报 浏览 279 12-21

瞄准下沉市场!理财公司“牵手”农商行

国际金融报 浏览 505 08-20

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者 浏览 273 01-05

对冲基金大亨劝和后 马斯克语气软化:同意"和平相处"

上观新闻 浏览 1655 06-07

空调市场“老二”之争:小米让格力电器“抖了抖”,董明珠岂能坐视不管?

时代周报 浏览 503 08-21

甘肃成立省委省政府调查组 提级调查幼儿血铅异常问题

潇湘晨报 浏览 9787 07-13

300万以内无敌手 莲花首款插混SUV定名For Me

网易汽车 浏览 285 12-11

帮助截瘫患者重获运动功能,华山神外脑机接口团队在上海先进事迹报告会分享创新故事

上观新闻 浏览 289 11-12

美国交通部:取消对加州高铁的另外1.75亿美元拨款

国际在线 浏览 392 08-27

这些才是普通人适合的穿搭!衣服不夸张、配色不鲜艳,大方又得体

静儿时尚达人 浏览 8954 06-08

韦斯利:希望继续用进球来帮助球队实现保级目标

懂球帝 浏览 487 09-01

特斯拉Q2财报会实录:关税带来3亿美元成本 但Robotaxi和人形机器人潜力巨大

财联社 浏览 5037 07-24

美国驻以色列大使狠批英国首相 外媒:猛烈程度罕见

参考消息 浏览 7666 08-10

伊朗东部领空已重新开放

上观新闻 浏览 5120 06-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11