本书系统地阐述语音信号处理的原理、方法、技术和应用,同时给出部分内容对应的MATLAB程序。全书共14章,第1~7章是基本理论部分,包括绪论、语音信号的数字模型、语音信号短时时域分析、语音信号短时频域分析、语音信号倒谱分析、语音信号线性预测分析和矢量量化;第8~14章是应用部分,包括语音编码原理及应用、语音识别原理及应用、神经网络原理及应用、语音合成原理及应用、语音情感识别原理及应用、语音增强原理及应用、语音质量评价和可懂度评价。本书内容全面,重点突出,原理阐述深入浅出,注重理论与实际应用的结合,可读性强。
张雪英,太原理工大学教授、博士生导师,从事本科生和研究生的语音信号处理、DSP应用及多媒体通信等的教学和科研工作,主要研究方向为语音编码、抗噪语音识别和DSP应用及嵌入式系统开发及应用。
第1章 绪论1
1.1 语音信号处理的发展1
1.1.1 语音合成1
1.1.2 语音编码2
1.1.3 语音识别4
1.2 语音信号处理的应用7
1.3 语音信号处理的过程8
1.4 MATLAB在数字语音信号处理中的应用9
习题110
第2章 语音信号的数字模型11
2.1 语音的发声机理11
2.1.1 人的发声器官11
2.1.2 语音生成12
2.2 语音的听觉机理13
2.2.1 听觉器官13
2.2.2 听觉掩蔽效应14
2.2.3 临界带宽与频率群15
2.2.4 耳蜗的信号处理机制16
2.2.5 语音信号听觉模型17
2.3 语音信号的数字模型18
2.3.1 激励模型18
2.3.2 声道模型20
2.3.3 辐射模型22
2.3.4 数字模型22
2.3.5 模型局限性23
习题223
第3章 语音信号短时时域分析24
3.1 语音信号的预处理24
3.1.1 语音信号的预加重处理24
3.1.2 语音信号的加窗处理26
3.2 短时平均能量29
3.3 短时平均幅度32
3.4 短时平均过零率34
3.5 短时自相关分析36
3.5.1 短时自相关函数36
3.5.2 语音信号的短时自相关函数36
3.5.3 修正的短时自相关函数41
3.5.4 短时平均幅度差函数44
3.6 基于能量和过零率的语音端点检测45
3.7 基音周期估值47
3.7.1 基于短时自相关法的基音周期估值47
3.7.2 基于短时平均幅度差函数法的基音周期估值51
3.7.3 基音周期估值的后处理53
3.7.4 基音周期估值后处理的MATLAB实现54
习题357
第4章 语音信号短时频域分析59
4.1 傅里叶变换的解释59
4.1.1 短时傅里叶变换59
4.1.2 窗函数的作用60
4.2 滤波器的解释65
4.2.1 短时傅里叶变换的滤波器实现形式一65
4.2.2 短时傅里叶变换的滤波器实现形式二66
4.3 短时合成的两种方法67
4.3.1 短时合成的滤波器组相加法原理67
4.3.2 短时合成的滤波器组相加法的MATLAB实现69
4.3.3 短时合成的叠接相加法原理及其MATLAB实现75
习题478
第5章 语音信号倒谱分析80
5.1 复倒谱和倒谱的定义及性质80
5.1.1 定义80
5.1.2 复倒谱的性质80
5.2 语音信号倒谱分析及应用83
5.2.1 语音信号倒谱分析原理83
5.2.2 语音信号倒谱应用85
5.3 Mel频率倒谱参数91
5.3.1 Mel频率滤波器组91
5.3.2 MFCC提取93
5.3.3 MFCC提取的MATLAB实现94
习题595
第6章 语音信号线性预测分析97
6.1 LPC的基本原理97
6.1.1 LPC的实现方法97
6.1.2 语音信号模型和LPC之间的关系99
6.1.3 模型增益G的确定100
6.2 LPC系数的解法101
6.2.1 自相关法101
6.2.2 协方差法102
6.2.3 自相关法的MATLAB实现103
6.3 线谱对(LSP)分析104
6.3.1 LSP的定义和特点105
6.3.2 LPC系数到LSP系数的转换及MATLAB实现108
6.3.3 LSP系数到LPC系数的转换及MATLAB实现111
6.4 LPC的几种推演参数113
6.4.1 反射系数113
6.4.2 对数面积比(LAR)系数113
6.4.3 预测器多项式的根114
6.4.4 预测误差滤波器的冲激响应及其自相关函数114
6.5 LPC的两个应用实例114
6.5.1 LPC倒谱及MATLAB实现115
6.5.2 LPC基音周期检测及MATLAB实现117
习题6124
第7章 矢量量化126
7.1 矢量量化基本原理127
7.1.1 矢量量化的定义127
7.1.2 失真测度128
7.1.3 矢量量化器129
7.2 最佳矢量量化器130
7.3 矢量量化器的设计算法及MATLAB实现131
7.3.1 LBG算法131
7.3.2 初始码书的选取与空胞腔的处理133
7.3.3 已知训练序列的LBG算法的MATLAB实现134
7.3.4 树形搜索矢量量化器136
习题7139
第8章 语音编码原理及应用140
8.1 语音编码的分类及特性140
8.1.1 波形编码140
8.1.2 参数编码141
8.1.3 混合编码141
8.2 语音编码性能的评价指标141
8.2.1 编码速率141
8.2.2 编码语音质量评价142
8.2.3 编解码延时142
8.2.4 算法复杂度142
8.3 语音信号波形编码143
8.3.1 脉冲编码调制(PCM)143
8.3.2 自适应预测编码(APC)147
8.3.3 G.721标准及算法实现149
8.4 语音信号参数编码161
8.4.1 LPC声码器原理161
8.4.2 LPC-10声码器162
8.5 语音信号混合编码165
8.5.1 合成分析技术和感觉加权滤波器165
8.5.2 激励模型的演变167
8.5.3 G.728标准简介167
8.6 语音信号宽带变速率编码168
习题8169
第9章 语音识别原理及应用170
9.1 语音识别系统概述170
9.1.1 语音信号预处理170
9.1.2 语音识别特征提取171
9.1.3 语音训练识别网络172
9.2 支持向量机在语音识别中的应用175
9.2.1 支持向量机分类原理175
9.2.2 支持向量机的模型参数选择问题180
9.2.3 支持向量机用于语音识别的MATLAB实现181
习题9185
第10章 神经网络原理及应用186
10.1 人工神经网络186
10.1.1 神经元186
10.1.2 神经网络的分类187
10.2 深度神经网络188
10.2.1 深度学习188
10.2.2 卷积神经网络189
10.2.3 长短时记忆(LSTM)网络190
10.3 神经网络在语音信号处理中的应用191
10.3.1 RBF网络在语音识别中的应用及MATLAB实现191
10.3.2 SOFM网络在语音编码中的应用及MATLAB实现197
10.3.3 深度神经网络在语音识别中的应用200
习题10202
第11章 语音合成原理及应用203
11.1 语音合成系统概述203
11.1.1 文本分析204
11.1.2 韵律控制206
11.1.3 语音合成方法206
11.2 传统语音合成207
11.2.1 共振峰合成208
11.2.2 线性预测分析合成210
11.2.3 基音同步叠加212
11.2.4 统计参数语音合成219
11.3 基于深度学习的端到端语音合成223
11.3.1 基于WaveNet的语音合成223
11.3.2 基于FastSpeech的语音合成225
习题11226
第12章 语音情感识别原理及应用227
12.1 情感的划分227
12.1.1 离散情感划分227
12.1.2 情感维度空间228
12.1.3 其他情感模型231
12.2 情感语音数据库232
12.2.1 情感语音数据库建立原则与方法232
12.2.2 常用情感语音数据库233
12.3 语音情感特征及识别模型的应用234
12.3.1 传统语音情感特征234
12.3.2 基于经验模态分解的特征238
12.3.3 语音情感的非线性特征242
12.3.4 深度神经网络在语音情感识别中的应用249
习题12251
第13章 语音增强原理及应用252
13.1 语音特性和数据库252
13.1.1 语音和噪声的主要特性252
13.1.2 语音和噪声数据库253
13.2 语音增强算法的分类254
13.2.1 无监督语音增强算法254
13.2.2 有监督语音增强算法255
13.3 传统语音增强算法及MATLAB实现257
13.3.1 谱减法257
13.3.2 维纳滤波法260
13.3.3 最小均方误差法263
13.4 基于深度学习的语音增强算法266
13.4.1 基于卷积神经网络的语音增强267
13.4.2 基于长短期记忆网络的语音增强273
13.4.3 基于生成对抗网络的语音增强275
习题13278
第14章 语音质量评价和可懂度评价279
14.1 语音质量与可懂度279
14.2 语音质量的主观评价方法279
14.3 语音可懂度的主观评价方法281
14.4 语音质量客观评价方法283
14.4.1 时域和频域分段信噪比方法及MATLAB实现283
14.4.2 基于LPC客观评价方法及MATLAB实现287
14.4.3 语音质量的感知(PESQ)评价方法及MATLAB实现290
14.5 语音可懂度客观评价方法294
14.5.1 频域加权分段信噪比评价方法及MATLAB实现294
14.5.2 归一化协方差(NCM)评价方法及MATLAB实现298
习题14301
参考文献302