智能机器人语音识别技术详细解析
智能手机通过AI技术实现语音助手和人脸识别功能。 #生活知识# #科技生活# #科技改变生活# #科技创新成果#
语音控制的基础就是语音识别技术,可以是特定人或者非特定人的。非特定人的应用更为广泛,对于用户而言不用训练,因此也更加方便。语音识别可以分为孤立词识别,连接词识别,以及大词汇量的连续词识别。对于智能机器人这类嵌入式应用而言,语音可以提供直接可靠的交互方式,语音识别技术的应用价值也就不言而喻。
如今智能语音设备或者机器人很多,如智能手机(例如Cortana,Siri,Ok Google,。。。),个人助理(例如Google Home,Amazon Echo,。。。),交互式语音应答(银行,应答机, 。。。。。。),语音机器人(电话机器人、客服机器人、电销机器人,……),在生活中很常见,表现都让人惊喜。同时他们工作原理也大致相同。
1 语音识别概述
语音识别技术最早可以追溯到20世纪50年代,是试图使机器能“听懂”人类语音的技术。按照目前主流的研究方法,连续语音识别和孤立词语音识别采用的声学模型一般不同。孤立词语音识别一般采用DTW动态时间规整算法。连续语音识别一般采用HMM模型或者HMM与人工神经网络ANN相结合。 语音的能量来源于正常呼气时肺部呼出的稳定气流,喉部的声带既是阀门,又是振动部件。语音信号可以看作是一个时间序列,可以由隐马尔可夫模型(HMM)进行表征。语音信号经过数字化及滤噪处理之后,进行端点检测得到语音段。对语音段数据进行特征提取,语音信号就被转换成为了一个向量序列,作为观察值。在训练过程中,观察值用于估计HMM的参数。这些参数包括观察值的概率密度函数,及其对应的状态,状态转移概率等。当参数估计完成后,估计出的参数即用于识别。此时经过特征提取后的观察值作为测试数据进行识别,由此进行识别准确率的结果统计。训练及识别的结构框图如图1所示。
图1 语音识别系统结构框图
1. 1 端点检测
找到语音信号的起止点,从而减小语音信号处理过程中的计算量,是语音识别过程中一个基本而且重要的问题。端点作为语音分割的重要特征,其准确性在很大程度上影响系统识别的性能。
能零积定义:一帧时间范围内的信号能量与该段时间内信号过零率的乘积。
能零积门限检测算法可以
网址:智能机器人语音识别技术详细解析 https://www.yuejiaxmz.com/news/view/158390
相关内容
【深度学习】深度学习语音识别算法的详细解析语音识别方案,语音交互控制技术,无线模组解决方案
ISHE 2017——“语音交互+机器人=智能家居”模式成主流
深入了解PyTorch中的语音识别和语音生成
灵云四川话语音识别,这个技术很“要得”
详解卷网络(CNN)在语音识别中的应用
国产智能技术突破:我们为用户提供未来科技生活体验的智能机器人产品文案
语音识别与合成:PyTorch实践
智能家电的语音控制:如何让你的生活更加智能化1.背景介绍 随着人工智能技术的不断发展,我们的生活日益智能化。智能家电已经
自动化、智能、机器人