全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括"深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。

作者

俞栋博士是国际电气电子工程师学会会士(IEEE  Fellow)、国际计算机学会杰出科学家(ACM  Distinguished Scientist)。他现任腾讯人工智能实验室副主任、腾讯公司杰出科学家,并兼任香港中文大学(深圳)、上海交通大学、浙江大学等多所高校的客座/兼职教授。加入腾讯前,他是微软雷德蒙研究院语音与对话系统首席研究员。他是语音识别和深度学习方向的著名学者,出版了两本专著和200多篇论文(google scholar 引用近3万)。他是80余项专利的发明人以及深度学习开源软件CNTK的发起人和主要作者之一。他在基于深度学习的语音识别和分离技术上的一系列开创性工作,极大的推动了语音处理领域的发展。他的工作获得了2005年ACMSE最佳论文奖以及2013年和2016年IEEE 信号处理学会最佳论文奖。俞栋博士曾担任IEEE语音语言处理专业委员会委员、IEEE西雅图分会副主席、和APSIPA杰出讲师,也曾任IEEE/ACM音频、语音及语言处理汇刊和IEEE信号处理杂志等期刊的副编辑、以及多个国际会议的技术委员会和组织委员会成员。

查看全部
目录

内容简介

推荐序

前言

符号

第1章 简介

1.1 自动语音识别:更好的沟通之桥

1.2 语音识别系统的基本结构

1.3 口语理解与人机对话系统

1.4 全书结构

第I部分 传统声学模型

第2章 混合高斯模型

第3章 隐马尔可夫模型及其变体

第II部分 深层神经网络在语音识别中的应用及分析

第4章 全连接深层神经网络

第5章 高级模型初始化技术

第6章 深层神经网络-隐马尔可夫模型混合系统

第7章 训练加速和解码加速

第8章 深层神经网络中的特征表示学习

第9章 深层神经网络和混合高斯模型的融合

第10章 VAD和唤醒词识别

第III部分 先进深度学习模型在语音识别中的应用

第11章 卷积神经网络

第12章 循环神经网络及相关模型

第13章 基于深度学习的语言模型

第IV部分 高级语音识别方法

第14章 深层神经网络的自适应技术

第15章 深层神经网络序列鉴别性训练

第16章 端到端模型

第V部分 复杂场景下的语音识别

第17章 深层神经网络中的表征共享和迁移

第18章 基于深度学习的单通道语音增强和分离技术

第19章 远场语音识别的前端技术

第VI部分 口语理解及对话系统的深度学习实践

第20章 基于深度学习的口语理解

第21章 对话状态跟踪及自然语言生成

第22章 对话策略优化

第VII部分 总结及展望

第23章 总结及未来研究方向

缩略词表

作者简介

参考文献

查看全部
书评
查看更多
请您登录后发表评论 登录 | 注册
我的评分:
提交
0/400