大家好,欢迎来到IT知识分享网。
最近在测试一些语音识别库,然后国内几家语音识别的公司有,科大讯飞、云知声等企业。今天主要是测试一下科大讯飞离线语音识别的sdk。目前产品需求是:用户说出关键命令词,比如拍照、录影、关机等。相机识别出命令关键词,执行相应的命令操作。科大讯飞语音提供识别方式有离线识别和在线识别。针对产品需求场景,我们使用科大讯飞离线命令词识别功能。
离线识别语音SDK:
Linux安装包:Linux_aitalk_1158_597a9469.zip
目录:bin:编译的samples可执行文件和语法文件。
doc:离线命令词和语法使用说明。
include:离线语音识别头文件。
libs:离线语音识别库。
samples:离线语音识别测试程序,asr_record_sample识别mic采集和音频文件的语音数据,asr_sample识别音频文件中语音数据。
语音识别性能参数:
识别时间:大概1-2s的识别时间。
识别率:90%以上。
语言:支持中英文,支持简体中文、四川话、粤语。
音频采样率:支持16K、8K PCM。
cpu 内存要求:
风险点:CPU和内存占用可能偏高,嵌入式MCU有必要考量这一因素。
以下是离线命令词功能测试结果:目前对asr_record_sample测试,编辑bin/call.bnf文件,定义不同命令词可以识别,定义如下图:
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/72493.html