百度输入法的“轻声识别”功能可升级输入法“听力”,用户的“悄悄话”也能听懂。据了解,耳语语音较之正常语音有两大不同点,一是耳语语音音量比正常音量要低很多,二是人们在轻声说话的时候,由于不经过声带振动,因此不存在基频,也不会产生相应的各次谐波,导致耳语的频谱特性与正常语音完全不同,极大增加技术研发难度。 针对耳语语音的特殊性,百度输入法依托人工智能技术,采取主动学习的方式,通过基音检测和谐波分析技术,挑选出符合耳语特性的数据,作为百度输入法“轻声识别”的训练集和开发集。挑选出的耳语数据经过标注后,作为训练数据放在声学模型上进行适配,使得已有声学模型能够快速适配耳语语音特性。 随着语音识别技术的不断发展,百度在语音输入方面频频发力。在此前发布的V7.3版本中,百度输入法创新性的推出了长文本语音输入等语音输入新功能。2017年初,百度推出的网页应用SwiftScribe可以将音频文件转为文本,时长1分钟的音频文件可以在30秒内转换完成,转化效率较人工速记快 1.67倍,极大提升速记行业转录效率。 业内人士指出,百度输入法的“轻声识别”功能具有声音低、识别准、速度快的特点,将拓展用户语音输入的使用场景,并培养用户的语音使用习惯,“轻声识别”功能的上线为语音输入法市场带来一抹亮色,通过人工智能技术对输入法产品的加持,提升用户的输入体验,同时也将在输入法行业掀起人工智能浪潮。 |