百度语音识别 python

发布时间：2024-11-20 17:39

使用语音识别软件纠正发音 #生活技巧# #学习技巧# #英语口语训练#

python实现语音识别

我们用到是百度语音识别，因为不掏钱哈哈！首先去百度官网去创建你的 APPID AK SK 这个网上很多大家没创建的自己看下

目前本SDK的功能同REST API，需要联网调用http接口, 具体功能见REST API 文档, REST API 仅支持整段语音识别的模式，即需要上传完整语音文件进行识别，时长不超过60s，支持、自定义词库设置，没有其他额外功能。
原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道，支持的格式有：pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）

首先安装使用Python SDK有如下方式

如果已安装pip，执行pip install baidu-aip即可。如果已安装setuptools，执行python setup.py install即可 12

AipSpeech是语音识别的Python SDK客户端，为使用语音识别的开发人员提供了一系列的交互方法。

参考如下代码新建一个AipSpeech：

from aip import AipSpeech """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) 12345678

注意：如果导报aip有问题可能是下载版本问题可以

pip uninstall baidu-aip pip install baidu-aip 12

API的具体代码

# 读取文件 def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 识别本地文件 client.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'dev_pid': 1536, }) 123456789

结果

// 成功返回 { "err_no": 0, "err_msg": "success.", "corpus_no": "15984125203285346378", "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D", "result": ["北京天气"] } // 失败返回 { "err_no": 2000, "err_msg": "data empty.", "sn": null } 123456789101112131415

自己写的一段测试小代码喜欢的可以看看

from aip import AipSpeech class BaiduVoiceToTxt(object): def __init__(self, client, file_path): self.client = client self.file_path = file_path # 读取文件 @staticmethod def get_file_content(file_path): with open(file_path, 'rb') as fp: return fp.read() # 识别本地文件 def run(self): print('正在识别.....') result = client.asr(self.get_file_content(self.file_path), 'pcm', 16000, { 'dev_pid': 1536, }) if not isinstance(result, dict): with open('testAudio.mp3', 'wb') as f: f.write(result) else: print('语音内容:{}'.format(result['result'][0])) if __name__ == '__main__': APP_ID = '17973848' # 你的 App ID' API_KEY = 'D7dskLcxcIqit6GjNxfLg3u0' # 你的 Api Key' SECRET_KEY = 'NbTGUrNfKWgUwGP3TFd0MCFwGi4EkRda' # 你的 Secret Key' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) file_path = 'D:\code\zuj_jian/test.pcm' baidu_voice_to_srt_obj = BaiduVoiceToTxt(client,file_path) baidu_voice_to_srt_obj.run()

1234567891011121314151617181920212223242526272829303132333435363738

网址：百度语音识别 python https://www.yuejiaxmz.com/news/view/158403

⬅️上一篇：语音识别系统控制

➡️下一篇：语音助手

百度语音识别 python

python实现语音识别

相关内容

随便看看

最新动态分享

热点动态分享

专题

推荐动态分享