点击量:118
Ren, Yi, et al. “Fastspeech: Fast, robust and controllable text to speech.” Advances in Neural Information Processing Systems. 2019.

本次分享的论文是FastSpeech语音合成框架,这篇论文由微软研究院和浙大联合发表在NIPS2019上。
点击量:118
Ren, Yi, et al. “Fastspeech: Fast, robust and controllable text to speech.” Advances in Neural Information Processing Systems. 2019.
本次分享的论文是FastSpeech语音合成框架,这篇论文由微软研究院和浙大联合发表在NIPS2019上。
点击量:54
语音合成又称文语转换(Text to Speech, TTS)技术,是语音处理领域的一个重要研究方向,旨在让机器生成自然动听的人类语音。
近年来在深度学习的推动下,语音合成技术飞速发展,落地应用越来越多,最常见的是手机语音助手、车载导航、智能音箱、智能玩具等,这些应用都离不开语音合成技术的支持。
点击量:164
Juvela, Lauri, et al. “Speech waveform synthesis from MFCC sequences with generative adversarial networks.” 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018.
本次论文分享的是一篇2018年发表在IEEE上的用GAN从MFCC合成语音波形的论文。
点击量:92
Sotelo, Jose, et al. “Char2wav: End-to-end speech synthesis.” (2017).
Char2Wav是一个2017年发表在ICLR上的语音合成模型。