本文实例为大家分享了python实现百度语音识别的具体代码,供大家参考,具体内容如下
先下载python用SDK,可以用python setup.py install安装
1
2
3
4
5
6
7
8
9
10
|
# 引入Speech SDK from aip import AipSpeech # 定义常量 APP_ID = '你的 App ID' API_KEY = '你的 API Key' SECRET_KEY = '你的 Secret Key' # 初始化AipSpeech对象 aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY) |
在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。
开始识别
注意:
请求说明:
1. 原始语音的录音格式目前只支持评测 8k/16k 采样率 16bit 位深的单声道语音
2. 压缩格式支持:pcm(不压缩)、wav、amr
3. 系统支持语言种类:中文(zh)、粤语(ct)、英文(en)。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
# 读取文件 def get_file_content(filePath): with open (filePath, 'rb' ) as fp: return fp.read() # 识别本地文件 aipSpeech.asr(get_file_content( 'audio.pcm' ), 'pcm' , 16000 , { 'lan' : 'zh' , }) # 从URL获取文件识别 aipSpeech.asr(' ', ' pcm', 16000 , { 'url' : 'http://121.40.195.233/res/16k_test.pcm' , 'callback' : 'http://xxx.com/receive' , }) |
返回结果:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
/ / 成功返回 { "err_no" : 0 , "err_msg" : "success." , "corpus_no" : "15984125203285346378" , "sn" : "481D633F-73BA-726F-49EF-8659ACCC2F3D" , "result" : [ "北京天气" ] } / / 失败返回 { "err_no" : 2000 , "err_msg" : "data empty." , "sn" : null } |
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/qq_35037977/article/details/76274157