语音合成(TTS)
技术思想及原理分析
语音合成与语音识别的应用方向刚好相反,语音识别是STT(speech to text),而语音合成是TTS(text to speech),从二者的名称中就可以看出,语音合成的输入是文本信息,输出是声音信息。在技术上可以看成是STT的逆向操作。目前的语音合成方法主要有拼接合成语音和参数合成语音两种。
应用场景及商业价值
虽然目前的语音合成技术还不是非常成熟,但是在一些要求不太高的应用中已经开始应用了。目前语音合成的应用主要在新闻广播行业较为广泛,比如搜狗AI合成主播,有了AI合成主播,就可以帮助新闻机构做一些简单的广播了。当然国外有人拿这个技术配合上图像合成技术,造了一段总统讲话的视频,表情和声音还都挺像的,不仔细甄别,还真看不出来。