北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

新闻资讯NEWS

北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

拒绝交互等待!灵云语音识别SDK全新升级

 发布于:2021-11-16 18:37   浏览:

微信时代,在紧张的办公中,收到对方大段一分钟长的音频时,内心其实是崩溃的。于是,越来越多人开始选择语音输入,轻松了自己,更方便了他人。

然而选择语音输入的另一个问题就是:不得不面对的语音识别速度。一旦网络环境稍差,识别速度就堪称“龟速”,而在没网的情况下,就只能面对着“网络在打盹儿,稍后在试吧!”而兴叹了。

近期,捷通华声针对灵云语音识别SDK进行全新升级,更改vad引擎并优化了效果,大幅提升了识别率以及识别速度,并增加了ASR 的双路识别功能,更能保障识别的准确率与成功率。

除了语音识别SDK,灵云语义理解SDK、语音合成SDK也得到了相应的升级优化,从而实现更快、更优质的人机语音交互。开发者登陆灵云平台(www.aicloud.com),进入开发者社区,即可下载相的SDK,让你的APP不再忍受语音交互的等待之苦。

灵云语音识别 中国智能语音领军品牌

捷通华声作为国内最早从事中文智能语音技术研究与应用的高新技术企业,拥有行业领先的灵云语音识别技术。识别技术采用行业领先的深度学习算法,具备了识别率高、响应速度快、支持话者分离和智能语音端点检测,口音和方言适应能力强等优点。

除支持中文识别已达国内领先水平外,灵云语音识别还支持英文、维语、粤语等多语种识别,其中,中文普通话,识别率可达97%以上,实时率在0.3以下,并可通过语言模型定制和声学模型定制,在短时间内大幅提升专业领域的语音识别率。

结合灵云语音识别技术,捷通华声在灵云平台上为开发者提供的灵云语音识别SDK可支持HTTP、Socket、WebService以及MRCP接口,且支持词表识别、语法识别和自由说识别,可以在用户终端进行语音识别,也可以在云端进行语音识别,并能根据不同领域的需求进行个性化定制。

大规模语音实现高效、实时、精准转写

灵云语音识别技术的快速进步,给企业创新发展、提高效率带来了新机遇,让更多企业享受到灵云人工智能技术带来的方便与快捷。

新升级的灵云语音识别SDK,以及灵云语义理解SDK、语音合成SDK、灵云种子,配合捷通华声专门推出的灵云麦克风阵列技术,不仅能够轻松实现电视、空调、音箱、机器人、车载系统的远场精准语音交互,也让交互等待时间不再漫长、卡顿。

在各类会议的文字直播中,新升级的灵云语音识别能更加实时、高效地将会议情况进行文字转播,从而达到同步转写的效果,庭审记录中将庭审现场实时记录转写下来,大幅减轻速记员等文字工作者的工作量,提升了信息的传播效率。

在客服、呼叫中心领域,语音识别技术将坐席与用户的电话实时转写为文字,识别速度及准确率的提升,让沟通与文字的转写变得更为同步。在灵云智能语音导航系统以及灵云智能外呼机器人上,这一升级体现的更为明显,接打外呼机器人或机器人客服的电话沟通交流时,我们再也不用为机器人长时间的“思考”而苦苦等待了,用户体验得到显著提升。

未来,捷通华声将进一步深化与清华大学“灵云科技 源自清华”的战略合作,不断提升灵云语音识别、语义理解、语音合成、人脸识别等各项技术的能力,让大众能够体验到人工智能带来的方便与快捷。