一直以来,语音合成技术都一大难点。尤记得儿时用学习机播放课文时,学习机里的声音生涩无比,毫无感情,听的时间长了,人的耳朵甚至要发疯。后来即使发展到了智能手机时代,智能手机中的语音播报依旧较为机械化,基本处于不可用的状态。
近日,语音合成技术领域传来了好消息。有用户发现手机百度小说频道悄然上线了情感语音合成模块,用户可以选择在线“磁性男声”来朗读小说。与此同时,百度新闻客户端的最新版本同样开始支持下拉语音播报。
两款新技术综合体验下来虽然离预想的那种“新闻联播”式的语音播报还是存在很大的差距,但相比其他不可用的产品而言,百度的新产品已经到了勉强可用的程度。
如果说是某家新闻客户端或是某家线上小说APP采用了新技术做语音播报,而且还做的不错的话,笔者可能依旧还是会一笑而过,但百度作为国内人工智能领域的先行者涉足到了语音合成领域,其实释放出了非常强烈的信号。
某种意义上来讲,百度舞剑情感语音合成,真实目的是“意在人工智能”。根据目前媒体的公开报道。百度情感语音合成技术的突破,是在以上语音合成传统技术和服务的基础上,依托百度大数据和深度学习的技术优势,并结合语音合成学科特点进行创新,实现汉语情感语音合成技术突破。
其实将这个技术突破联系到小度常驻百度搜索栏,度秘还在加紧开发的一系列事件,足以勾勒出百度在人工智能领域的更多野心——情感语音合成如若变得更加成熟,未来会不会出现小度常驻搜索栏和用户进行人机对话的情况?或者小度直接成为人们PC上的秘书,为用户提供各式各样的咨询和服务。
情感语音合成其实真正最值得注意的是“情感”二字。在过往人工智能技术的运用中,人们一直强调人工智能技术进行理性分析的重要性,对“情感”一直照顾不足。
百度这次的语音合成融入了情感,这个领域的突破有利于百度人工智能技术在情绪表达、情绪沟通的层面上再进一步。
软小冰的卖萌耍宝算是在情感领域的探索,但国产的人工智能运用在这个领域还是缺乏相关深入研究。这次百度的“情感语音合成”技术实际上正是在机器人如何做出情感化的表达这个层面上展开了攻势。
科幻电影中总是描绘出人和机器人恋爱的场景,这种场景虽然在某种程度上有悖于伦理道德,但百度在人工智能“情感”的深入发展很可能会带来这种科幻化的未来。
虽然一直存在诸多争议,但从目前技术发展的趋势来看,人工智能未来的方向一定是情感化。
目前微软的小娜和小冰明显正在朝这个方向演变。微软Win10内置的小娜在和人进行对话时明显已经接近了真人水平,微信里的小冰则更加激进,像是一个不受控制的萌妹子,脑洞很大,总能给用户带来欢快。
目前小冰都已经可以和人语音对话了,百度此时选择将情感融入语音识别,正是契合了人工智能发的发展潮流,甚至是占领了技术高点。
不管人工智能的发展未来是不是“情感化”,在情感与技术的结合点中谋求科技的进步总不会有错误,百度这次可能真的压对了宝。
———分割线————
本文作者吴俊宇。微信号:852405518,微信公众号“深几度”,期待交流沟通。转载请保留版权内容,否则禁止转载。
|