情感语音合成技术是什么?为什么它能使张国荣“复活”!
“13年了,久等了,辛苦你们。……”这封来自已故明星张国荣的“天堂来信”让粉丝们感动不已。据悉,这段语音回复是百度通过机器和人工双重搜集全网内张国荣原声和采访资料,利用百度最新的“情感语音合成技术”,合成出的张国荣生前的声音。它的音质完全来自于张国荣,但内容又并不能在任何一段张国荣生前的语音记录中找到。那么情感语音合成技术是什么?为什么它能使张国荣“复活”!为什么网为您解答~
情感语音合成技术是什么?
情感语音合成是近几年语音合成的研究热点,现有的研究多以语音的韵律和声 学特征为指导因素.在情感语音合成的研究中,必须解决如下三个核心问题:
(1)如何确定情感状态和情感语音的声学特征参数?
(2)如何建立情感状态与语音 的声学特征的关联关系,建立情感声学参数的综合控制模型?
(3)如何结合文本分析和场景因素建立情感的预测机制?
然而随着语音人机交互潮流的到来,用户对于语音合成品质的要求逐渐提高。为了给用户带来优质的听觉体验,百度工程师经过长期的技术积累和攻坚,终于在情感语音合成领域取得重大突破:一直以来,语音合成技术都一大难点。尤记得儿时用学习机播放课文时,学习机里的声音生涩无比,毫无感情,听的时间长了,人的耳朵甚至要发疯。后来即使发展到了智能手机时代,智能手机中的语音播报依旧较为机械化,基本处于不可用的状态。
融入情感,科技不再只是科技
情感语音合成其实真正最值得注意的是“情感”二字。在过往人工智能技术的运用中,人们一直强调人工智能技术进行理性分析的重要性,对“情感”一直照顾不足。百度这次的语音合成融入了情感,这个领域的突破有利于百度人工智能技术在情绪表达、情绪沟通的层面上再进一步。软小冰的卖萌耍宝算是在情感领域的探索,但国产的人工智能运用在这个领域还是缺乏相关深入研究。这次百度的“情感语音合成”技术实际上正是在机器人如何做出情感化的表达这个层面上展开了攻势。科幻电影中总是描绘出人和机器人恋爱的场景,这种场景虽然在某种程度上有悖于伦理道德,但百度在人工智能“情感”的深入发展很可能会带来这种科幻化的未来。
人工智能的未来——情感化
虽然一直存在诸多争议,但从目前技术发展的趋势来看,人工智能未来的方向一定是情感化。目前微软的小娜和小冰明显正在朝这个方向演变。微软Win10内置的小娜在和人进行对话时明显已经接近了真人水平,微信里的小冰则更加激进,像是一个不受控制的萌妹子,脑洞很大,总能给用户带来欢快。小冰都已经可以和人语音对话了,百度此时选择将情感融入语音识别,正是契合了人工智能发的发展潮流,甚至是占领了技术高点。
不管怎样,科学会一直进步,人工智能的方向也将会越来越全面,相信情感化的人工智能也会给我们带来更多的惊喜~