DeepSeek开源DeepSeek-OCR 2,视觉理解能力大幅提升
创始人
2026-01-27 18:49:11

1月27日,DeepSeek开源DeepSeek-OCR 2模型,改变了AI处理图像的方式。新模型不再像传统AI那样机械地从左到右扫描图片,而是能根据内容重要性和逻辑关系决定阅读顺序,实现了从“固定扫描”到“语义推理”的转变。

技术突破核心在于DeepEncoder V2架构,该架构用Qwen2-500M轻量级语言模型替代传统CLIP编码器,并引入“因果流查询”机制。这使得AI能像人一样先看标题、再看正文,遇到表格会按行列阅读,遇到分栏能自动跳跃。

在OmniDocBench v1.5评测中,DeepSeek-OCR 2综合得分达91.09%,较前代提升3.73%。在阅读顺序准确度上,编辑距离从0.085显著降至0.057,逻辑理解能力提升33%。模型效率极高,处理复杂页面仅需256到1120个视觉Token。

实际应用数据显示,新模型将在线OCR日志重复率从6.25%降至4.17%,PDF数据处理重复率从3.69%降至2.88%。论文作者魏浩然、孙耀峰、李宇琨表示,这一设计为构建统一的全模态编码器提供了可行路径,未来可扩展到语音、视频等多模态处理。

相关内容

热门资讯

原创 黄... 黄磊和孙莉带着他们的二女儿以及刚出生的三胎儿子,一家四口悠闲地游玩广东。自从嫁入黄磊的家庭后,孙莉几...
【安庆新闻联播】春茶采摘正当时... 安庆各地立足生态资源禀赋和茶产业基础,以茶旅融合为主线,推动生态优势向产业优势、发展优势转化,走出一...
南京位列五一酒店预订热门目的地... 近日,同程旅行发布的《2026年五一旅行趋势报告》显示,南京位列五一假期酒店预订热门目的地TOP2,...
旅行是疲惫生活的解药:2026... 旅行,是我们给自己的温柔奖励 会不会你也常常有感觉到些许疲惫的时候呢,日子被工作以及那些琐碎的事情给...
暑假带孩子来伊犁研学?这份哈萨... 暑假带孩子来伊犁研学?这份哈萨克非遗与草原生态深度游攻略请收好! 每年暑假,都有许多像您一样的家长,...