发帖
客户端
扫码下载

[AI] 阿里通义千问发布Qwen3-TTS语音合成模型,支持多音色多语种

[复制链接]
4 |0
未来视野 发表于 昨天 22:17 | 显示全部楼层 |阅读模式
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
12月10日,阿里通义千问正式推出Qwen3-TTS语音合成AI模型,该模型可通过Qwen API调用,提供超过49种音色选择,涵盖不同性别、年龄、地域特征及角色设定,例如撒娇搞怪的茉兔、青梅竹马风格的小野杏、严厉老师形象的墨讲师等,满足多样化场景需求。

在语言支持方面,Qwen3-TTS实现了10大主流语种覆盖,包括中文、英语、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语和俄语。实测数据显示,其在MiniMax TTS多语种测试集中的词错误率优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview等同类模型。方言生成能力进一步增强,支持普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话等九种方言,精准还原地域口音特色。

技术层面,Qwen3-TTS通过优化自适应算法,显著提升了语速调节和韵律控制的自然度,官方宣称其拟人化表现已接近真人水平。这一改进使得语音输出更符合人类交流习惯,为智能客服、有声内容创作等领域提供了更高质量的解决方案。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表