06月
09日
轻量化文档解析模型 MonkeyOCR 发布,3B 参数重构行业标准
牛透社 6 月 9 日消息,文档解析模型 MonkeyOCR 发布研究成果,该产品具备仅 3B 参数的轻量化架构与独创 “结构-识别-关系” 三元组解析框架,主要应用于金融合同解析、科研论文处理等实时性场景。
根据社交媒体上的最新讨论,MonkeyOCR 在多项文档解析任务中超越了 Gemini 2.5Pro 和 Qwen 2.5-VL-72B 等重量级模型,平均性能提升显著。尤其是在复杂文档类型的解析上,MonkeyOCR 表现尤为突出,公式解析提升高达 15.0%,表格解析提升 8.6%,整体在 9 种文档类型上平均提升 5.1%。并且,其对多页文档的解析速度达到每秒 0.84 页,远超 MinerU 的 0.65 页 / 秒和 Qwen 2.5-VL-7B 的 0.12 页 / 秒。
这一速度优势使得 MonkeyOCR 在处理大规模文档任务时更具竞争力,尤其适合需要快速响应的企业级应用场景。