10月
17日
百度研究院开源文档解析模型 PaddleOCR-VL 登顶 OmniBenchDoc 全球评测榜首,综合得分 92.6 创纪录
牛透社 10 月 17 日消息,百度研究院发布开源多模态文档解析模型 PaddleOCR-VL,该产品具备轻量高效架构(0.9B 参数)与 109 种语言支持,主要应用于政府公文处理、企业知识管理及档案数字化场景。
技术指标显示:在 OmniBenchDoc V1.5 评测中获综合得分 92.6,文本识别编辑距离 0.035,表格识别 TEDS 93.52,推理吞吐量达每秒 1881 个 Token(较 MinerU2.5 提升 14.2%),单卡适配 NVIDIA A100 80GB PCIe 环境。