09月
24日
阿里通义千问发布 Qwen3-ASR-Toolkit 开源工具,实现小时级音视频转录突破
牛透社 9 月 24 日消息,阿里巴巴集团旗下通义千问团队发布开源 Python 命令行工具 Qwen3 – ASR – Toolkit,该产品具备小时级音视频转录能力,支持主流音视频格式兼容,主要应用于大规模音频处理场景。
该工具搭载第三代语音识别引擎 Qwen3 – ASR – Flash,通过千万小时量级 ASR 数据集优化识别精度,集成智能静音分割、自适应音频预处理及多线程分片技术,其核心算法已通过阿里达摩院技术团队确认。