06月
05日
英伟达发布 80 亿参数文档处理模型 Llama Nemotron Nano VL,登顶 OCRBench v2 多领域基准测试
牛透社 2025 年 6 月 3 日消息,英伟达发布专为文档智能处理优化的紧凑型视觉-语言模型 Llama Nemotron Nano VL。该产品基于 Meta 的 Llama 3.1 架构并整合轻量级视觉编码器 CRadioV2-H,参数规模 80 亿,支持 16K 令牌上下文长度,在包含超 10,000 个人工验证问答对的 OCRBench v2 基准测试中登顶,覆盖金融、医疗、法律及科学出版领域的复杂文档、图表解析与低质量扫描场景。
通过 AWQ4bit 量化技术可在单块 NVIDIA RTX GPU 或 Jetson Orin 边缘设备运行,兼容 TensorRT-LLM 框架实现高效推理。其开源特性支持企业通过 NeMo 微服务定制财务分析、医疗记录处理等专业场景应用,为 Agentic AI 领域提供从云端到边缘的完整解决方案。