分类
学界业界动态

语音合成:基础与前沿

点击量:27

(在苹果系统下,如果文章中的图片不能正常显示,请升级Safari浏览器到最新版本,或者使用Chrome、Firefox浏览器打开。)

语音合成又称文语转换(Text to Speech, TTS)技术,是语音处理领域的一个重要研究方向,旨在让机器生成自然动听的人类语音。

近年来在深度学习的推动下,语音合成技术飞速发展,落地应用越来越多,最常见的是手机语音助手、车载导航、智能音箱、智能玩具等,这些应用都离不开语音合成技术的支持。

(语音合成相关应用图)

此外,语音合成在AI音频&视频内容创作与生成上也有巨大的应用潜力,如:AI听书、AI电台、虚拟主播,视频配音等均需要自然流畅、多样化、个性化的语音合成技术。

随着语音合成技术应用范围的不断扩大,对语音合成技术人员的需求也在不断增加,语音合成算法工程师平均薪资已经高达29.7K/月(数据来自职友集)。

(部分岗位信息,来源于Boss直聘)   

面对市场人才的紧缺,很多的求职者并没有相关的专业背景,并非“科班”出身的求职者,尽管能够找到工作,但是在这个方向发展中会发现,由于自身专业知识的不系统、不扎实,导致在工作当中常常会遇到难以解决的“基础性”问题,这也是与“科班”出身的同事存在的最大“差异”。然而,语音合成技术涵盖了多门学科,大家在学习过程中很难找到系统的学习资料与书籍,国内也鲜有专门系统讲解语音合成技术的课程,更少有能够真正从基础开始搭建知识框架的课程!因此,深蓝学院邀请谢磊老师团队重磅推出「语音合成:基础与前沿」在线课程。希望在两个月的学习时间内,通过理论结合实践的方式,帮助我们高效夯实语音合成基础,学习前沿技术。本课程是继『语音信号处理』、『语音识别:从入门到精通』与『语音算法:前沿与应用』之后,深蓝学院重磅推出的智能语音系列第四门课程!

课程以系统全面的知识讲解和精心设计的动手实践,让我们掌握扎实的专业知识,同时培养良好的工程实战能力。本课程将于9月25日正式开课,诚邀各位伙伴共同参与,在语音合成的学习之路上少走弯路,高效成长!

导师团队

科学系统的教学计划

精益求精的课程服务

1. 社群答疑
课程建立答疑群,高效获得疑问解答的同时,结识更多同一领域的伙伴。

2. “三师”助力
班主任督促学习、助教及时批改作业并配合讲师微信群答疑,及时解惑,高效学习。

3. 作业迭代
提交作业,助教批改后,根据助教意见对作业进行迭代修改;没有最好,只有更好!

4. 定期班会
每期班会,助教对作业进行讲评和指导;在班会中,学习更多技巧;在交流中,收获更多思路。

阅读原文

版权声明
本博客的文章除特别说明外均为原创,本人版权所有。欢迎转载,转载请注明作者及来源链接,谢谢。
本文地址: https://blog.ailemon.me/2020/09/03/ttsbasefront/
All articles are under Attribution-NonCommercial-ShareAlike 4.0


发表评论

电子邮件地址不会被公开。 必填项已用*标注

8 − 5 =

如果您是第一次在本站发布评论,内容将在博主审核后显示,请耐心等待