您现在的位置是:首页智能区块

微软发布最新智能语音合成模型Uni-TTSv3

责编:admin发布时间:2021-11-17阅读:158

微软发布最新Azure神经网络语音合成技术Uni-TTSv3多语言语音合成模型。与上一代语音合成模型相比,Uni-TTSv3语音合成保真度更高、速度更快、训练时间更短,更降本增效。借助Uni-TTSv3,微软升级美语合成女声Jenny。全新升级的JennyMultilingualNeural,拥有跨语言能力,支持14个国家和地区的语言。

基于Uni-TTSv3而构建的深度神经网络定制语音服务,也扩展了跨语言定制服务功能,客户只需提供一个语言的录音数据作为语料,即可训练定制模型同时说多个语言。

多语言通用

Uni-TTSv3是强大的多语言语音模型,在多语言和多说话人数据集上训练。Uni-TTSv3通过训练来自50多个不同地域和口音的发音人在不同场景下录制的超过3,000个小时的语音数据,构建多语言通用基础语音模型,确保AI语音在语速、语调和重音模式等不变的情况下演绎多国语言。

训练时间更短

Uni-TTSv3授权Azure语音合成平台和自定义神经语音支持多语种语音。借助Uni-TTSv3升级自定义神经语音训练管道,支持客户用更短的训练时间创建高质量的语音模型。与上一代语音合成模型相比,Uni-TTSv3调优过程简单,尤其在声学训练部分,训练时间显著减少50%左右,更加降本增效。

所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。

举报邮箱:258375376@qq.com

相关标签:互联网