12月10日,阿里通义千问正式推出Qwen3-TTS语音合成AI模型,该模型可通过Qwen API调用,提供超过49种音色选择,涵盖不同性别、年龄、地域特征及角色设定,例如撒娇搞怪的茉兔、青梅竹马风格的小野杏、严厉老师形象的墨讲师等,满足多样化场景需求。
在语言支持方面,Qwen3-TTS实现了10大主流语种覆盖,包括中文、英语、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语和俄语。实测数据显示,其在MiniMax TTS多语种测试集中的词错误率优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview等同类模型。方言生成能力进一步增强,支持普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话等九种方言,精准还原地域口音特色。
技术层面,Qwen3-TTS通过优化自适应算法,显著提升了语速调节和韵律控制的自然度,官方宣称其拟人化表现已接近真人水平。这一改进使得语音输出更符合人类交流习惯,为智能客服、有声内容创作等领域提供了更高质量的解决方案。 |