900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > 【语音识别】基于DTW算法实现0~9数字含Matlab源码

【语音识别】基于DTW算法实现0~9数字含Matlab源码

时间:2021-04-07 06:18:28

相关推荐

【语音识别】基于DTW算法实现0~9数字含Matlab源码

1 简介

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,语音识别是一门交叉学科。人们预计,不久的未来年,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别是人机交互里很重要的模块,从PC时代到现在的移动互联时代,人机交互由鼠标键盘走向智能手机、Pad等的多点触摸。到了智能硬件时代,交互则更加多元,不仅有触摸,还有基于语音、视觉的交互。原本是以机器为中心的人机交互,逐渐走向以人为中心的自然交互。

语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别常见的五种算法:动态时间伸缩算法(Dynamic Time Warping,DTW)、基于规则的人工智能、人工神经网络(Artificial Neural Network,ANN)方法、隐马尔可夫(Hidden Markov Model、HMM)方法,HMM和ANN混合模型。本文利用MATLAB强大的数学运算能力,实现孤立语音信号的识别。本文应用DTW为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数。其中包括语音信号处理,特征参数提取,识别模板训练,识别匹配算法。识别效果可以达到预期。

DTW算法原理:在孤立词语音识别中,最为简单有效的方法是采用DTW(Dynamic Time Warping,动态时间归整)算法,该算法基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。

用于孤立词识别,DTW算法与HMM算法在训练阶段需要提供大量的语音数据,通过反复计

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。