NekoTeco»社区 › 宅闻情报 › 数码资讯 › 阿里通义千问发布Qwen3-TTS语音合成模型，支持多音色多 ...

[AI] 阿里通义千问发布Qwen3-TTS语音合成模型，支持多音色多语种

150 |0

未来视野 发表于 25-12-11 22:17:15 | 显示全部楼层 |阅读模式

12 px

26 px

12月10日，阿里通义千问正式推出Qwen3-TTS语音合成AI模型，该模型可通过Qwen API调用，提供超过49种音色选择，涵盖不同性别、年龄、地域特征及角色设定，例如撒娇搞怪的茉兔、青梅竹马风格的小野杏、严厉老师形象的墨讲师等，满足多样化场景需求。

在语言支持方面，Qwen3-TTS实现了10大主流语种覆盖，包括中文、英语、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语和俄语。实测数据显示，其在MiniMax TTS多语种测试集中的词错误率优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview等同类模型。方言生成能力进一步增强，支持普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话等九种方言，精准还原地域口音特色。

技术层面，Qwen3-TTS通过优化自适应算法，显著提升了语速调节和韵律控制的自然度，官方宣称其拟人化表现已接近真人水平。这一改进使得语音输出更符合人类交流习惯，为智能客服、有声内容创作等领域提供了更高质量的解决方案。

TTS, Qwen3, 模型, 语音, 支持

[AI] 阿里通义千问发布Qwen3-TTS语音合成模型，支持多音色多语种

相关帖子

注册