北京贝壳财经讯(记者罗一丹)北京时间10月20日,DeepSeek在Hugging Face开源社区发布了新的DeepSeek-OCR模型。 OCR(光学字符识别)模型被理解为一种用于从图像中提取文本的技术。 DeepSeek 还上传了一篇与该模型相关的论文,其中 DeepSeek-OCR 被描述为“关于使用二维光学映射压缩长上下文的可行性的初步研究”。实验表明,当文本标记数量在视觉标记数量的10倍以内(即压缩比<10倍)时,我们的模型可以实现97%的解码准确率(OCR)。即使使用 20 倍压缩率,OCR 准确率也能保持在 60% 左右。这显示了大型语言模型中的长上下文压缩和 mMemory 遗忘机制等研究领域的巨大潜力。编辑:岳彩洲 校对:刘宝庆