(DEAD) HMM-GMM Based ASR (Auto Speech Recogition)
动机、参考资料、涉及内容
参考资料
- 台湾大学李琳山老师的两门课程:《数字语音处理》、《数字信号处理》
- 西北工业大学课程:《语音识别从入门到精通》
涉及内容
- 参考资料中关于传统语音识别方法的全部内容
不涉及内容
- kaldi
概述
本博客主要参考台湾大学李琳山老师的两门课程:《数字语音处理》、《数字信号处理》
声音是一个一维的信号(时间序列),根据前人的研究,将其处理为一个
HMM
声学模型
人发出声音的过程为:由肺部产生一股一股的“气”,经由唇齿舌的作用下,产生声音。
附录 A:傅里叶变换
A.1 信号(待补充)
离散情形下,如下信号被称为激冲信号:
平行地,连续情形下,如下信号被称为激冲信号
A.2 线性时不变系统
在信号理论中,一个“系统”指的是输入一个信号,输出也是一个信号的东西。而线性时不变系统指的是满足如下条件的系统:
离散情况(信号的定义域为整数域
- 对于任意的
以及任意的信号 ,假定该系统将信号 变换至 ,那么该系统会将 变换到 ; - 对于任意的信号
,假定该系统会将其分别变换至 。那么对于任意的实数(复数) ,该系统会将 变换到
连续情况(信号的定义域为实数域
- 对于任意的
以及任意的信号 ,假定该系统将信号 变换至 ,那么该系统会将 变换到 ; - 对于任意的信号
,假定该系统会将其分别变换至 。那么对于任意的实数(复数) ,该系统会将 变换到
可以证明,线性时不变系统一定为下述形式:
对于离散情况,系统对于
上述
对于连续情况,系统对于
对于线性时不变系统而言,如下信号是特别的:
离散情形下,对于任意的
其响应函数为:
即上述形式的输入信号为“特征”信号,即输出信号与输入信号只差一个常数倍
连续情形下,对于任意的
其响应函数为:
A.3 连续周期信号的傅里叶级数
A.4 离散周期信号的傅里叶级数
A.5 连续信号的傅里叶变换
A.6 离散信号的傅里叶变换
###