基于DSP的语音识别计算器设计
时间:2023-09-29 10:36来源: 作者: 点击: 次摘要:为解决特殊群体使用困难的问题,了一种TMS320VC5509 的可的系统。该系统的核心是采用HMM算法建立模型。通过对实时信号(数字、运算符号等语音)进行处理,将得到的参数与模板库参数进行匹配并加以,利用TMS320VC5509 自带的计算模块实现语音信号整数100以内的加、减、乘、除等计算功能。实验结果表明,该计算器系统在低噪声场合和高噪声场合下识别率分别达到94.73%和76.55%。
关键词:语音识别;;HMM;计算器;TMS320VC5509
随着电子技术的高速发展,现代普通民用计算器在保留基本的加减乘除等运算外,加入了大量如三角函数、幂函数等比较复杂的运算。但是其基本的操作没有发生变化,依然是运用手指操作,对于需要进行实时数字计算的一些特殊人群(残疾人士)或是在一些特殊场合在无法手动操作计算器的情况下,用加入了语音识别模块的计算器来进行实时数字计算就有相当的必要。
语音识别技术是人机最自然、最简洁的交流方式,它就是让机器能够自动识别并理解说话人要表达的意思,将语音信号转变为正确的文本或者命令的高科技技术。根据实际的应用,语音识别可以分为:特定人与非特定人的识别、孤立词与连续词的识别、中小词汇量与无限词汇量的识别。
考虑到成本及使用范围因素,本文中应用的是TMS320VC5509 DSP的非特定人、孤立词、小词汇量的语音识别系统。通过实际测试,使用该DSP的语音识别系统有着较高的实时性、识别率,该系统的计算器对实时数字计算有较高准确性,基本能解决特殊群体和特殊地点使用计算器困难的情况。
1 系统硬件
1.1 语音识别系统
语音识别的基本原理框图如图l所示。语音识别过程主要包括语音信号前处理、特征提取、模式匹配等部分。语音信号输入之后,预处理和数字化是进行语音识别的前提条件。特征提取是进行语音信号训练和识别必不可少的步骤,本文采用的是提取每帧的Mel系数的倒谱参数作为语音信号的特征值。模板匹配算法目前有DTW算法、HMM隐马尔科夫模型、ANN人工神经网络等。本文采用HMM隐马尔科夫模型的方法,提取出的特征值存入参考模式库中,用来匹配待识别语音信号的特征值。匹配计算是进行语音识别的核心部分,由待识别人的语音经过特征提取后,与系统训练时产生的模板进行匹配,在说话人辨认中,取与待识别语音相似度最大的模型所对应的语音作为识别结果。
1.2 系统硬件结构
图2为系统硬件结构框图。此系统的核心器件是TI公司的TMS320VC5509定点DSP。在本系统中,它不仅是语音识别的核心,还负责计算器的运算部分。TMS320VC5509是系统的运算处理单元,具有2个乘法器(MAC),4个累加器(ACC);40位、16位的算术逻辑单元(ALU)各一个,这大大增强了DSP的运算能力;指令字长不只单一的16位,可扩展到最高48位,数据字长16位;可通过USB接口对TMS320VC5509烧写程序而不必借助仿真器。正是基于这些优点,选择该器件可节省开发资金,减小电路板面积。DSP与TLV320AIC23的接口电路如图3所示。