基于AI语音识别的智能多媒体终端制造技术
AI语音识别技术用于语音输入设备 #生活知识# #科技生活# #科技改变生活# #人工智能#
本发明专利技术公开了基于AI语音识别的智能多媒体终端,涉及智能终端技术领域。它包括:唤醒判断部分、身份鉴别部分、语音识别部分和多媒体控制部分;所述唤醒判断部分,用于实时采集周围环境的语音信息,发送第一控制命令至身份鉴别部分;所述身份鉴别部分,用于对语音信息进行特征识别,判断是否为特定用户;所述语音识别部分,对语音信息进行语音识别,得到语音控制指令;所述多媒体控制部分,用于根据语音控制指令,控制多媒体终端的运行。本发明专利技术实现了对语音单元的状态转移和观测概率建模,从而提高了语音识别的准确性、实时性和稳定性,为用户带来更智能、便捷的多媒体使用体验。
【技术实现步骤摘要】
本专利技术涉及智能终端,特别涉及基于ai语音识别的智能多媒体终端。
技术介绍
1、在当今数字化时代,智能语音识别技术的发展已经取得了显著的进展,为人们的生活和工作带来了诸多便利。智能语音识别技术允许用户通过口语指令与智能设备进行交互,无需通过物理接口或者键盘输入,大大提升了用户体验的便捷性和效率。然而,虽然语音识别技术已经取得了长足的进步,但在特定场景下,如智能多媒体终端中的应用,仍然存在一些挑战和问题。在传统的智能多媒体终端中,用户通常需要通过按键、触摸屏等方式来操作设备,这种方式受限于用户的物理动作,操作体验相对受限。
2、目前已经公开的现有技术主要是基于语音识别技术的应用,其中包括基于语音唤醒的智能助手。这些智能助手通过语音识别技术实现了语音指令的识别和执行,用户可以通过语音指令来实现多媒体终端的控制和操作,从而提高了用户的操作便捷性和体验。然而,现有的智能语音识别技术在智能多媒体终端中的应用还存在一些问题和局限性。首先,传统的语音识别技术往往只能实现简单的语音指令识别,对于复杂的语音场景和语音内容理解能力有限。例如,...
【技术保护点】
1.基于AI语音识别的智能多媒体终端,其特征在于,它包括:唤醒判断部分、身份鉴别部分、语音识别部分和多媒体控制部分;所述唤醒判断部分,用于实时采集周围环境的语音信息,首先对语音信息进行声源定位,获取声源距离多媒体终端的距离,若距离在小于设定的距离阈值,则检测语音信息的分贝值,并判断分贝值是否处于预设分贝区间,若是,则计算语音信息的长度是否在预设长度区间,若是则判断语音信息是否为人声,若为人声,则发送第一控制命令至身份鉴别部分;所述身份鉴别部分,用于对语音信息进行特征识别,判断是否为特定用户,若是,则发送第二控制命令至语音识别部分;所述语音识别部分,对语音信息进行语音识...
【技术特征摘要】
1.基于ai语音识别的智能多媒体终端,其特征在于,它包括:唤醒判断部分、身份鉴别部分、语音识别部分和多媒体控制部分;所述唤醒判断部分,用于实时采集周围环境的语音信息,首先对语音信息进行声源定位,获取声源距离多媒体终端的距离,若距离在小于设定的距离阈值,则检测语音信息的分贝值,并判断分贝值是否处于预设分贝区间,若是,则计算语音信息的长度是否在预设长度区间,若是则判断语音信息是否为人声,若为人声,则发送第一控制命令至身份鉴别部分;所述身份鉴别部分,用于对语音信息进行特征识别,判断是否为特定用户,若是,则发送第二控制命令至语音识别部分;所述语音识别部分,对语音信息进行语音识别,得到语音控制指令,具体包括:使用梅尔滤波器对语音信号进行频谱分析,得到频谱特征;将频谱特征转换为倒谱系数;构建动态贝叶斯网络作为声学模型,将倒谱系数建模为动态贝叶斯网络的状态转移过程;将倒谱系数映射到状态空间中,每个状态代表一个语音单元;使用动态贝叶斯网络进行推断,估计每个状态的后验概率,即给定观察序列条件下每个状态的概率分布;对动态贝叶斯网络的输出进行稀疏编码,将每个状态的后验概率表示为稀疏向量;将稀疏向量映射到词汇表中的单词,得到语音信息对应的词序列,作为语音控制指令;所述多媒体控制部分,用于根据语音控制指令,控制多媒体终端的运行。
2.如权利要求1所述的基于ai语音识别的智能多媒体终端,其特征在于,所述唤醒判断部分判断语音信息是否为人声的方法包括:对语音信息进行预加重处理,然后使用窗口函数,将预加重后的语音信息分割成m帧,每帧包含固定数量的采样点;从每个帧提取高阶短时能量,并计算非线性敏感过零率;若高阶短时能量高于设定的能量阈值,且非线性敏感过零率低于设定的过零率阈值,则判断该帧为人声;若则判断语音信息为人声;其中,...
【专利技术属性】
技术研发人员:周四华,刘邦,刘长华,戴腾华,
申请(专利权)人:深圳中洲卓越科技有限公司,
类型:发明
国别省市:
网址:基于AI语音识别的智能多媒体终端制造技术 https://www.yuejiaxmz.com/news/view/1282755
相关内容
基于语音识别技术的智能家居控制智能语音交互技术在媒体的应用和前景
智能AI语音识别算法:实现高精度语音转文字技术解析
基于语音识别技术的智能家居控制系统
智领AI终端新时代!中国移动终端公司发布搭载灵犀终端智能体的AI终端矩阵
AI人工智能知识科普篇—语音识别
粤语语音识别技术:小米打造智能生活新体验
智能语音识别技术及其在家庭中的应用
人工智能的语音识别技术详解
智能助手语音识别技术革新:实现精准语音识别与交互体验