百度语音识别 python

发布时间:2024-11-20 17:39

使用语音识别软件纠正发音 #生活技巧# #学习技巧# #英语口语训练#

python实现语音识别

我们用到是百度语音识别,因为不掏钱哈哈!首先去百度官网去创建你的 APPID AK SK 这个网上很多大家没创建的自己看下

目前本SDK的功能同REST API,需要联网调用http接口, 具体功能见REST API 文档, REST API 仅支持整段语音识别的模式,即需要上传完整语音文件进行识别,时长不超过60s,支持、自定义词库设置, 没有其他额外功能。
原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)

首先安装使用Python SDK有如下方式

如果已安装pip,执行pip install baidu-aip即可。 如果已安装setuptools,执行python setup.py install即可 12

AipSpeech是语音识别的Python SDK客户端,为使用语音识别的开发人员提供了一系列的交互方法。

参考如下代码新建一个AipSpeech:

from aip import AipSpeech """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) 12345678

注意:如果导报aip有问题可能是下载版本问题可以

pip uninstall baidu-aip pip install baidu-aip 12

API的具体代码

# 读取文件 def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 识别本地文件 client.asr(get_file_content('audio.pcm'), 'pcm', 16000, { 'dev_pid': 1536, }) 123456789

结果

// 成功返回 { "err_no": 0, "err_msg": "success.", "corpus_no": "15984125203285346378", "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D", "result": ["北京天气"] } // 失败返回 { "err_no": 2000, "err_msg": "data empty.", "sn": null } 123456789101112131415

自己写的一段测试小代码喜欢的可以看看

from aip import AipSpeech class BaiduVoiceToTxt(object): def __init__(self, client, file_path): self.client = client self.file_path = file_path # 读取文件 @staticmethod def get_file_content(file_path): with open(file_path, 'rb') as fp: return fp.read() # 识别本地文件 def run(self): print('正在识别.....') result = client.asr(self.get_file_content(self.file_path), 'pcm', 16000, { 'dev_pid': 1536, }) if not isinstance(result, dict): with open('testAudio.mp3', 'wb') as f: f.write(result) else: print('语音内容:{}'.format(result['result'][0])) if __name__ == '__main__': APP_ID = '17973848' # 你的 App ID' API_KEY = 'D7dskLcxcIqit6GjNxfLg3u0' # 你的 Api Key' SECRET_KEY = 'NbTGUrNfKWgUwGP3TFd0MCFwGi4EkRda' # 你的 Secret Key' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) file_path = 'D:\code\zuj_jian/test.pcm' baidu_voice_to_srt_obj = BaiduVoiceToTxt(client,file_path) baidu_voice_to_srt_obj.run()

1234567891011121314151617181920212223242526272829303132333435363738

网址:百度语音识别 python https://www.yuejiaxmz.com/news/view/158403

相关内容

语音识别与合成:PyTorch实践
实战案例:AI在语音识别与语音合成领域的应用
深入了解PyTorch中的语音识别和语音生成
【深度学习】深度学习语音识别算法的详细解析
语音识别合成助手下载
UC答题助手来了,智能语音识别助力答题赢百万!
语音识别技术 能多大程度改变我们的生活?
详解卷网络(CNN)在语音识别中的应用
语音识别api接口报后台识别服务器音频分片等待超时,请请从seq=0重传是什么问题,要怎么解决?
python

随便看看