中国真实科技水平 ,看看车科技有限公司 ,药药好(杭州)网络科技有限公司

有关科技的新闻报道-谷歌提供类似人类的文本到语音转换系统的更新

时间:2019-06-21 18:09:15 | 作者:爱科技网 | 点击: 168 次

谷歌本周通过博客文章向感兴趣的技术爱好者提供了有关其Tacotron文字转语音系统的最新消息。在该帖子中,该团队描述了该系统如何工作并提供了一些音频样本,该帖子的作者Ruoming Pang和Jonathan Shen声称与一组人类听众判断的专业录音相当。作者还与其他Google团队成员一起撰写了一篇论文,描述了他们的努力,并将其发布到arXiv预打印服务器上。

有关科技的新闻报道-谷歌提供类似人类的文本到语音转换系统的更新

多年来,科学家一直致力于使计算机生成的语音更具人性化,科学的概念或定义,更少机器人化。作者指出,该任务的一部分是开发文本到语音(TTS)应用程序。大多数人都听说过TTS系统的结果,例如许多公司用于现场客户呼叫的自动语音系统。在这项新的努力中,谷歌集团将其从Tacotron和WaveNet项目中学到的知识与创建Tacotron 2-a系统相结合,将科学提升到一个新的水平。在收听提供的样本时,很难判断语音是人还是TTS系统语音是很困难的。

为了达到这种新的准确度,Google的团队使用了经过优化的序列到序列模型,以便与TTS一起使用 - 它将字母排列映射到描述音频的一系列功能。结果是80维谱图。然后,该频谱图被用作第二系统的输入,该系统使用基于WaveNet的架构输出24kHz波形。两者都是使用语音示例(来自众包应用程序,如亚马逊的Mechanical Turk)训练的神经网络及其相应的成绩单。新系统能够融合音量,发音,语调和速度,从而创造出更像人类的声音。

该团队还指出,科技小知识摘抄简短,他们仍在努力改进系统,最重要的是克服复杂单词的问题并使其实时工作。他们还希望为声音添加更多​​情感,以便听众可以实际听到幸福或悲伤,或者发现不快。这样做不仅会推动科学发展,而且会使与数字助理的互动变得更加亲密。