04月
09日
亚马逊推出全新语音模型 Amazon Nova Sonic
美东时间 4 月 8 日消息,亚马逊公司推出了一款全新的基础模型 Amazon Nova Sonic,该模型针对客户支持电话等语音交互场景进行了优化。
亚马逊表示,正利用该模型的部分组件为 Alexa + 提供支持。今年 2 月推出的 Alexa+,作为亚马逊语音助手的最新版本,能够自动执行诸如订购外卖、预订航班等操作,必要时还可与第三方应用程序交互以完成任务。
通常,语音处理需三步:首先,应用程序使用语音识别模型转录音频;接着,将转录文本输入大语言模型以生成基于文本的回复;最后,通过第三种算法将输出文本转换为语音。使用三个不同的神经网络,不仅使软件开发变得复杂,还会降低人工智能应用的性能,数据在神经网络间传输耗时,增加了响应延迟。
亚马逊称,新的 Nova Sonic 模型简化了工作流程,企业可使用该模型替代通常处理语音所需的三个不同神经网络,从而简化开发。亚马逊还承诺其性能优势:Nova Sonic 平均 1.09 秒即可开始响应用户输入,据亚马逊称,这使其比 OpenAI 和谷歌的竞品更快。