封面
版权信息
内容简介
人工智能出版工程 丛书编委会
献辞
推荐序
前言
符号
第1章 简介
1.1 自动语音识别:更好的沟通之桥
1.2 语音识别系统的基本结构
1.3 口语理解与人机对话系统
1.4 全书结构
第I部分 传统声学模型
第2章 混合高斯模型
2.1 随机变量
2.2 高斯分布和混合高斯随机变量
2.3 参数估计
2.4 采用混合高斯分布对语音特征建模
第3章 隐马尔可夫模型及其变体
3.1 介绍
3.2 马尔可夫链
3.3 序列与模型
3.4 期望最大化算法及其在学习HMM参数中的应用
3.5 用于解码HMM状态序列的维特比算法
3.6 隐马尔可夫模型和生成语音识别模型的变体
第II部分 深层神经网络在语音识别中的应用及分析
第4章 全连接深层神经网络
4.1 全连接深层神经网络框架
4.2 使用误差反向传播进行参数训练
4.3 实际应用
第5章 高级模型初始化技术
5.1 受限玻尔兹曼机
5.2 深度置信网络预训练
5.3 降噪自动编码器预训练
5.4 鉴别性预训练
5.5 混合预训练
5.6 采用丢弃法的预训练
第6章 深层神经网络-隐马尔可夫模型混合系统
6.1 DNN-HMM混合系统
6.2 CD-DNN-HMM的关键模块及分析
6.3 基于KL距离的隐马尔可夫模型
第7章 训练加速和解码加速
7.1 训练加速
7.2 解码加速
第8章 深层神经网络中的特征表示学习
- APP免费
8.1 特征和分类器的联合学习
- APP免费
8.2 特征层级
- APP免费
8.3 使用随意输入特征的灵活性
- APP免费
8.4 特征的鲁棒性
- APP免费
8.5 对环境的鲁棒性
- APP免费
8.6 信号严重失真情况下的推广能力
- APP免费
8.7 使用合成数据提升鲁棒性
- APP免费
第9章 深层神经网络和混合高斯模型的融合
- APP免费
9.1 在GMM-HMM系统中使用由DNN衍生的特征
- APP免费
9.2 识别结果融合技术
- APP免费
9.3 帧级别的声学分数融合
- APP免费
9.4 多流语音识别
- APP免费
第10章 VAD和唤醒词识别
- APP免费
10.1 基于信号处理的VAD
- APP免费
10.2 基于DNN的VAD
- APP免费
10.3 唤醒词识别的解码器方案
- APP免费
10.4 只用DNN的唤醒词识别
- APP免费
10.5 可定制的唤醒词识别
- APP免费
10.6 多阶段唤醒词识别
- APP免费
10.7 唤醒词识别的位置
- APP免费
第III部分 先进深度学习模型在语音识别中的应用
- APP免费
第11章 卷积神经网络
- APP免费
11.1 概述
- APP免费
11.2 卷积神经网络的基本架构
- APP免费
11.3 卷积神经网络的训练
- APP免费
11.4 时间延迟神经网络
- APP免费
11.5 时频域上的卷积
- APP免费
11.6 时域上的卷积
- APP免费
11.7 深层卷积神经网络
- APP免费
第12章 循环神经网络及相关模型
- APP免费
12.1 概述
- APP免费
12.2 基本循环神经网络中的状态-空间公式
- APP免费
12.3 沿时反向传播学习算法
- APP免费
12.4 一种用于学习循环神经网络的原始对偶技术
- APP免费
12.5 结合长短时记忆单元的循环神经网络
- APP免费
12.6 高速公路LSTM和网格LSTM
- APP免费
12.7 双向LSTM
- APP免费
12.8 GRU循环神经网络
- APP免费
12.9 循环神经网络的对比分析
- APP免费
12.10 讨论
- APP免费
第13章 基于深度学习的语言模型
- APP免费
13.1 统计语言模型简介
- APP免费
13.2 DNN语言模型
- APP免费
13.3 RNN和LSTM语言模型
- APP免费
13.4 CNN语言模型
- APP免费
13.5 语言模型的建模单元
- APP免费
13.6 双向语言模型
- APP免费
13.7 深度学习语言模型的使用
- APP免费
13.8 语言模型与声学模型的联合优化
- APP免费
第IV部分 高级语音识别方法
- APP免费
第14章 深层神经网络的自适应技术
- APP免费
14.1 深层神经网络中的自适应问题
- APP免费
14.2 线性变换
- APP免费
14.3 保守训练
- APP免费
14.4 子空间方法
- APP免费
14.5 DNN说话人自适应的效果
- APP免费
第15章 深层神经网络序列鉴别性训练
- APP免费
15.1 序列鉴别性训练准则
- APP免费
15.2 具体实现中的考量
- APP免费
15.3 无须词图的神经网络序列鉴别性训练
- APP免费
15.4 噪声对比估计
- APP免费
第16章 端到端模型
- APP免费
16.1 连接时序分类模型
- APP免费
16.2 带注意力机制的“编码-解码”模型
- APP免费
16.3 联合CTC-注意力模型
- APP免费
第V部分 复杂场景下的语音识别
- APP免费
第17章 深层神经网络中的表征共享和迁移
- APP免费
17.1 多任务和迁移学习
- APP免费
17.2 多语言和跨语言语音识别
- APP免费
17.3 语音识别中深层神经网络的多目标学习
- APP免费
17.4 使用视听信息的鲁棒语音识别
- APP免费
第18章 基于深度学习的单通道语音增强和分离技术
- APP免费
18.1 单通道语音增强技术
- APP免费
18.2 单通道多说话人的语音分离和标注置换问题
- APP免费
18.3 深度聚类
- APP免费
18.4 深度吸引子
- APP免费
18.5 排列不变性训练
- APP免费
18.6 将排列不变性训练用于多说话人语音识别
- APP免费
18.7 时域音频分离网络
- APP免费
第19章 远场语音识别的前端技术
- APP免费
19.1 远场识别的前端链路
- APP免费
19.2 DOA算法
- APP免费
19.3 波束形成的信号处理方法
- APP免费
19.4 结合信号处理和深度学习方法
- APP免费
19.5 前后端联合优化
- APP免费
第VI部分 口语理解及对话系统的深度学习实践
- APP免费
第20章 基于深度学习的口语理解
- APP免费
20.1 自然语言处理及深度学习
- APP免费
20.2 口语理解任务
- APP免费
20.3 基于深度学习的口语理解
- APP免费
第21章 对话状态跟踪及自然语言生成
- APP免费
21.1 口语对话系统概述
- APP免费
21.2 对话状态跟踪
- APP免费
21.3 自然语言生成
- APP免费
第22章 对话策略优化
- APP免费
22.1 对话策略及对话系统评估
- APP免费
22.2 数据驱动的对话策略训练
- APP免费
22.3 统计对话系统的冷启动技术
- APP免费
第VII部分 总结及展望
- APP免费
第23章 总结及未来研究方向
- APP免费
23.1 路线图
- APP免费
23.2 技术前沿和未来方向
- APP免费
缩略词表
- APP免费
作者简介
- APP免费
参考文献
更新时间:2021-01-05 18:15:41