05月
23日
阿里国际AI团队联合发布TransBench翻译评测基准,GPT-4o多语种综合排名居首
牛透社 5 月 23 日消息,阿里国际 AI Business 团队、上海人工智能实验室与北京语言大学联合发布首个人工智能应用型翻译评测基准 TransBench(译界基准),该产品具备“幻觉率”、文化禁忌词检测及敬语规范等全新评价维度,主要应用于大语言模型翻译质量评估。
最新评测数据显示,GPT-4o 在多语种翻译综合排名中位列第一,DeepSeek-V3 在电商垂直领域表现突出,通义千问(Qwen)系列则在文化适配性维度领先。目前 TransBench 的评测方法论及数据集已全面开源,旨在推动行业标准化建设与技术升级。