本书系统介绍了在农产品信息采集领域开展语音识别鲁棒性研究的基础、原理、方法和应用,以及该研究领域近年来取得的一些研究成果和技术。全书共分12章,内容包括农产品信息采集语音识别的起源、基于HMM的语音识别、手持设备的资源约束及语音识别应用部署、支持向量机的语音识别模型研究、支持向量机声学模型的分析及改进、噪声语音频谱幅度的非线性压缩方法评估、农产品信息采集语音识别语法规则、利用HTK搭建农产品价格语音识别系统、系统的三音子模型优化及特征规整、联合谱减增强和失真补偿的鲁棒性方法、基于统计模型的前端增强方法与失真补偿的结合、结论等。本书适合农产品信息采集领域从事语音识别技术研究和应用的科技人员阅读使用,也可作为高等学校相关专业的教学用书。
内容简介
前言
英文缩略词表
第1章 农产品信息采集语音识别的起源
1.1 研究背景及意义
1.2 国内外研究现状及发展动态分析
1.3 语音识别概述
1.4 语音识别及声学技术在农业领域的应用
第2章 基于HMM的语音识别
2.1 HMM的语音识别框架
2.2 HTK工具介绍
2.3 结论
第3章 手持设备的资源约束及语音识别应用部署
3.1 语音识别系统在手持设备和网络上的部署
3.2 嵌入式语音识别
3.3 结论
第4章 支持向量机的语音识别模型研究
4.1 支持向量机的理论基础
4.2 支持向量机模型参数的选择方法
4.3 结论
第5章 支持向量机声学模型的分析及改进
5.1 支持向量机声学模型的训练算法
5.2 支持向量机的Senone判别
5.3 改进的HMM/SVM混合识别模型
5.4 实验及结果
5.5 结论
第6章 噪声语音频谱幅度的非线性压缩方法评估
6.1 背景
6.2 非线性
6.3 实验及结果
6.4 结论
第7章 农产品信息采集语音识别语法规则
7.1 信息采集语音识别语法
7.2 语法文档及规则
7.3 结论
第8章 利用HTK搭建农产品价格语音识别系统
8.1 数据准备
8.2 创建单音素HMM模型
8.3 创建绑定状态的三音子
8.4 识别器评估
8.5 自适应HMM
8.6 自适应训练
8.7 总结
第9章 系统的三音子模型优化及特征规整
9.1 扩展的声/韵母建模基元
9.2 基于决策树的状态共享
9.3 增加高斯混合分量
9.4 倒谱特征归一化
9.5 实验及分析
9.6 总结
第10章 联合谱减增强和失真补偿的鲁棒性方法
10.1 谱减法
10.2 多带(Multiband)谱减法
10.3 MMSE谱减算法
10.4 实验
10.5 总结
第11章 基于统计模型的前端增强方法与失真补偿的结合
11.1 MMSE幅度谱估计
11.2 对数MMSE估计器
11.3 MMSE估计的实现和评估
11.4 实验
11.5 算法综合比较
11.6 总结
第12章 结论
12.1 本研究的主要工作
12.2 进一步的研究方向
参考文献

