近日,Qwen3-TTS 语音合成模型迎来了全面升级,凭借其出色的表现,成为了语音合成领域的一颗新星。此版本不仅支持多音色、多语种和多方言,还提升了语音生成的自然性和稳定性,用户可以通过 Qwen API 轻松访问这一强大功能。

image.png

Qwen3-TTS 的音色支持数量大幅增加,现提供超过49种高品质音色,覆盖了不同性别、年龄和地域特征,让用户在不同场景中都能找到合适的声音。例如,有撒娇搞怪的茉兔,陪伴感满满的小野杏,或是严厉的墨讲师等多种角色可供选择。这种丰富的音色选择使得合成的语音更具表现力,能够更好地传递情感。

此外,Qwen3-TTS 在多语种和方言的支持上也取得了显著进展。该模型支持包括中文、英文、德语、法语等在内的十种主要语言,且在多语言测试中的平均词错误率(WER)表现优于许多同类产品。同时,Qwen3-TTS 也支持多种方言的音色生成,如普通话、粤语、闽南语等,能够真实还原地方口音和语言的韵味,满足更广泛用户的需求。

在语音的自然度方面,Qwen3-TTS 的自适应调节能力得到了大幅提升,能够根据文本内容灵活调整语速和韵律,拟人化的程度接近于真人语音。这意味着用户在使用 Qwen3-TTS 进行语音合成时,能够获得更自然流畅的听觉体验。

用户体验方面,Qwen3-TTS 还提供了简单易用的 API 接口,方便开发者快速接入。通过一些简单的代码,用户即可轻松生成高质量的语音合成内容。这样的设计不仅降低了使用门槛,还让更多人能够享受到先进的语音合成技术。

Qwen3-TTS API文档:

https://help.aliyun.com/zh/model-studio/multi-round-conversation?spm=a2c4g.11186623.help-menu-2400256.d_0_1_1.49445002U6gJoz

划重点:

🌟 Qwen3-TTS 新增49种高品质音色,角色多样化满足不同需求。

🌍 支持10种主要语言和多种方言,真实还原地方口音特色。

🎤 语音自然度提升,拟人化程度接近真人,让用户体验更佳。