现代语言信号处理

本书特色

[

本书系统介绍了语音信号处理的基础、原理、方法、应用、新理论、新成果与新技术,以及该研究领域的背景知识、研究现状、应用前景和发展趋势。
全书分三篇共17章。**篇语音信号处理基础,包括第1章绪论,第2章语音信号处理的基础知识;第二篇语音信号分析,包括第3章时域分析,第4章短时傅里叶分析,第5章倒谱分析与同态滤波,第6章线性预测分析,第7章语音信号的非线性分析,第8章语音特征参数检测与估计,第9章矢量量化,第10章隐马尔可夫模型;第三篇语音信号处理技术与应用,包括第11章语音编码,第12章语音合成,第13章语音识别,第14章说话人识别和语种辨识,第15章智能信息处理技术在语音信号处理中的应用,第16章语音增强,第17章基于麦克风阵列的语音信号处理。
本书体系完整,结构严谨;系统性强,层次分明;内容深入浅出,原理阐述透彻;取材广泛,繁简适中;内容丰富而新颖;联系实际应用。

]

作者简介

[

胡航,博士,哈尔滨工业大学电子信息学院副教授,主要教授《信号与系统》、《数字信号处理》等课程,研究方向为现代语音信号处理。

]

目录

目 录**篇 语音信号处理基础 第1章 绪论 11.1 语音信号处理的发展历史 11.2 语音信号处理的主要研究内容及发展 概况 31.3 本书的内容 7思考与复习题 8第2章 语音信号处理的基础知识 92.1 概述 92.2 语音产生的过程 92.3 语音信号的特性 122.3.1 语言和语音的基本特性 122.3.2 语音信号的时间波形和频谱特性 132.3.3 语音信号的统计特性 152.4 语音产生的线性模型 162.4.1 激励模型 172.4.2 声道模型 182.4.3 辐射模型 202.4.4 语音信号数字模型 212.5 语音产生的非线性模型 222.5.1 fm-am模型的基本原理 222.5.2 teager能量算子 222.5.3 能量分离算法 232.5.4 fm-am模型的应用 242.6 语音感知 242.6.1 听觉系统 242.6.2 神经系统 252.6.3 语音感知 26思考与复习题 29 第二篇 语音信号分析 第3章 时域分析 303.1 概述 303.2 数字化和预处理 313.2.1 取样率和量化字长的选择 313.2.2 预处理 333.3 短时能量分析 343.4 短时过零分析 363.5 短时相关分析 393.5.1 短时自相关函数 393.5.2 修正的短时自相关函数 403.5.3 短时平均幅差函数 423.6 语音端点检测 423.6.1 双门限前端检测 433.6.2 多门限过零率前端检测 433.6.3 基于fm-am模型的端点检测 433.7 基于高阶累积量的语音端点检测 443.7.1 噪声环境下的端点检测 443.7.2 高阶累积量与高阶谱 443.7.3 基于高阶累积量的端点检测 46思考与复习题 48第4章 短时傅里叶分析 504.1 概述 504.2 短时傅里叶变换 504.2.1 短时傅里叶变换的定义 504.2.2 傅里叶变换的解释 514.2.3 滤波器的解释 544.3 短时傅里叶变换的取样率 554.4 语音信号的短时综合 564.4.1 滤波器组求和法 564.4.2 fft求和法 584.5 语谱图 59思考与复习题 61第5章 倒谱分析与同态滤波 625.1 概述 625.2 同态信号处理的基本原理 625.3 复倒谱和倒谱 635.4 语音信号两个卷积分量复倒谱的性质 645.4.1 声门激励信号 645.4.2 声道冲激响应序列 655.5 避免相位卷绕的算法 665.5.1 微分法 675.5.2 *小相位信号法 675.5.3 递推法 695.6 语音信号复倒谱分析实例 705.7 mel频率倒谱系数 72思考与复习题 73第6章 线性预测分析 746.1 概述 746.2 线性预测分析的基本原理 746.2.1 基本原理 746.2.2 语音信号的线性预测分析 756.3 线性预测方程组的建立 766.4 线性预测分析的解法(1)—自相关和 协方差法 776.4.1 自相关法 786.4.2 协方差法 796.4.3 自相关和协方差法的比较 806.5 线性预测分析的解法(2)—格型法 816.5.1 格型法基本原理 816.5.2 格型法的求解 836.6 线性预测分析的应用—lpc谱估计和 lpc复倒谱 856.6.1 lpc谱估计 856.6.2 lpc复倒谱 876.6.3 lpc谱估计与其他谱分析方法的 比较 886.7 线谱对(lsp)分析 896.7.1 线谱对分析原理 896.7.2 线谱对参数的求解 916.8 极零模型 91思考与复习题 93第7章 语音信号的非线性分析 947.1 概述 947.2 时频分析 947.2.1 短时傅里叶变换的局限 957.2.2 时频分析 967.3 小波分析 977.3.1 概述 977.3.2 小波变换的定义 977.3.3 典型的小波函数 997.3.4 离散小波变换 1007.3.5 小波多分辨分析与mallat算法 1007.4 基于小波的语音分析 1017.4.1 语音分解与重构 1017.4.2 清/浊音判断 1027.4.3 语音去噪 1027.4.4 听觉系统模拟 1037.4.5 小波包变换在语音端点检测中的 应用 1037.5 混沌与分形 1047.6 基于混沌的语音分析 1057.6.1 语音信号的混沌性 1057.6.2 语音信号的相空间重构 1067.6.3 语音信号的lyapunov指数 1087.6.4 基于混沌的语音、噪声判别 1097.7 基于分形的语音分析 1107.7.1 概述 1107.7.2 语音信号的分形特征 1117.7.3 基于分形的语音分割 112思考与复习题 113第8章 语音特征参数估计 1148.1 基音估计 1148.1.1 自相关法 1158.1.2 并行处理法 1178.1.3 倒谱法 1188.1.4 简化逆滤波法 1208.1.5 高阶累积量法 1228.1.6 小波变换法 1238.1.7 基音检测的后处理 1248.2 共振峰估计 1258.2.1 带通滤波器组法 1258.2.2 dft法 1268.2.3 倒谱法 1278.2.4 lpc法 1298.2.5 fm-am模型法 130思考与复习题 131第9章 矢量量化 1329.1 概述 1329.2 矢量量化的基本原理 1339.3 失真测度 1349.3.1 欧氏距离—均方误差 1359.3.2 lpc失真测度 1359.3.3 识别失真测度 1379.4 *佳矢量量化器和码本的设计 1379.4.1 矢量量化器*佳设计的两个条件 1379.4.2 lbg算法 1389.4.3 初始码书生成 1389.5 降低复杂度的矢量量化系统 1399.5.1 无记忆的矢量量化系统 1409.5.2 有记忆的矢量量化系统 1429.6 语音参数的矢量量化 1449.7 模糊矢量量化 1459.7.1 模糊集概述 1469.7.2 模糊矢量量化 1479.8 遗传矢量量化 1489.8.1 遗传算法 1489.8.2 遗传矢量量化 150思考与复习题 151第10章 隐马尔可夫模型 15210.1 概述 15210.2 隐马尔可夫模型的引入 15310.3 隐马尔可夫模型的定义 15510.4 隐马尔可夫模型三个问题的求解 15610.4.1 概率的计算 15710.4.2 hmm的识别 15910.4.3 hmm的训练 16010.4.4 em算法 16110.5 hmm的选取 16210.5.1 hmm的类型选择 16210.5.2 输出概率分布的选取 16310.5.3 状态数的选取 16310.5.4 初值选取 16310.5.5 训练准则的选取 16510.6 hmm应用与实现中的一些问题 16610.6.1 数据下溢 16610.6.2 多输出(观察矢量序列)情况 16610.6.3 训练数据不足 16710.6.4 考虑状态持续时间的hmm 16810.7 hmm的结构和类型 17010.7.1 hmm的结构 17010.7.2 hmm的类型 17210.7.3 按输出形式分类 17310.8 hmm的相似度比较 174思考与复习题 175 第三篇 语音信号处理技术与应用 第11章 语音编码 17611.1 概述 17611.2 语音信号的压缩编码原理 17811.2.1 语音压缩的基本原理 17811.2.2 语音通信中的语音质量 17911.2.3 两种压缩编码方式 18011.3 语音信号的波形编码 18011.3.1 pcm及apcm 18011.3.2 预测编码及自适应预测编码 18311.3.3 adpcm及adm 18511.3.4 子带编码(sbc) 18711.3.5 自适应变换编码(atc) 18911.4 声码器 19111.4.1 概述 19111.4.2 声码器的基本结构 19211.4.3 通道声码器 19211.4.4 同态声码器 19411.5 lpc声码器 19511.5.1 lpc参数的变换与量化 19611.5.2 lpc-10 19711.5.3 lpc-10e 19811.5.4 变帧率lpc声码器 19911.6 各种常规语音编码方法的比较 20011.6.1 波形编码的信号压缩技术 20011.6.2 波形编码与声码器的比较 20011.6.3 各种声码器的比较 20111.7 基于lpc模型的混合编码 20111.7.1 混合编码采用的技术 20211.7.2 mplpc 20411.7.3 rpelpc 20711.7.4 celp 20911.7.5 celp的改进形式 21111.7.6 基于分形码本的celp 21311.8 基于正弦模型的混合编码 21411.8.1 正弦变换编码 21511.8.2 多带激励(mbe)编码 21511.9 极低速率语音编码 21711.9.1 400~1.2kb/s数码率的声码器 21711.9.2 识别-合成型声码器 21811.10 语音编码的性能指标 21911.11 语音编码的质量评价 22111.11.1 主观评价方法 22111.11.2 客观评价方法 22211.11.3 主客观评价方法的结合 22511.11.4 基于多重分形的语音质量评价 22611.12 语音编码国际标准 22711.13 语音编码与图像编码的关系 228小结 229思考与复习题 229第12章 语音合成 23112.1 概述 23112.2 语音合成原理 23212.2.1 语音合成的方法 23212.2.2 语音合成的系统特性 23412.3 共振峰合成 23512.3.1 共振峰合成原理 23512.3.2 共振峰合成实例 23712.4 lpc合成 23712.5 psola语音合成 23912.5.1 概述 23912.5.2 psola的原理 24012.5.3 psola的实现 24012.5.4 psola的改进 24212.5.5 psola语音合成系统的发展 24312.6 文语转换系统 24312.6.1 组成与结构 24312.6.2 文本分析 24412.6.3 韵律控制 24512.6.4 语音合成 24812.6.5 tts系统的一些问题 24812.7 基于hmm的参数化语音合成 24912.8 语音合成的研究现状和发展趋势 25312.9 语音合成硬件简介 255思考与复习题 256第13章 语音识别 25713.1 概述 25713.2 语音识别原理 26013.3 动态时间规整 26413.4 基于有限状态矢量量化的语音识别 26613.5 孤立词识别系统 26713.6 连接词识别 27013.6.1 基本原理 27013.6.2 基于dtw的连接词识别 27113.6.3 基于hmm的连接词识别 27313.6.4 基于分段k-均值的*佳词串分割及 模型训练 27313.7 连续语音识别 27413.7.1 连续语音识别存在的困难 27413.7.2 连续语音识别的训练及识别方法 27513.7.3 连续语音识别的整体模型 27613.7.4 基于hmm统一框架的大词汇非特定 人连续语音识别 27713.7.5 声学模型 27813.7.6 语言学模型 28013.7.7 *优路径搜索 28213.8 说话人自适应 28413.8.1 map算法 28513.8.2 基于变换的自适应方法 28513.8.3 基于说话人分类的自适应方法 28613.9 鲁棒的语音识别 28713.10 关键词确认 28913.11 可视语音识别 29113.11.1 概述 29113.11.2 机器自动唇读 29113.11.3 双模态语音识别 29313.12 语音理解 29613.12.1 map语义解码 29713.12.2 语义结构的表示 29713.12.3 意图解码器 298小结 299思考与复习题 299第14章 说话人识别 30014.1 概述 30014.2 特征选取 30114.2.1 说话人识别所用的特征 30114.2.2 特征类型的优选准则 30214.2.3 常用的特征参数 30314.3 说话人识别系统 30314.3.1 说话人识别系统的结构 30314.3.2 说话人识别的基本方法概述 30414.4 说话人识别系统实例 30514.4.1 dtw型说话人识别系统 30514.4.2 应用vq的说话人识别系统 30614.5 基于hmm的说话人识别 30714.6 基于gmm的说话人识别 31014.7 说话人识别中需进一步研究的问题 31214.8 语种辨识 313思考与复习题 316第15章 智能信息处理技术在语音信号 处理中的应用 31715.1 人工神经网络 31715.1.1 概述 31715.1.2 神经网络的基本概念 31915.2 神经网络的模型结构 32015.2.1 单层感知机 32015.2.2 多层感知机 32115.2.3 自组织映射神经网络 32315.2.4 时延神经网络 32415.2.5 循环神经网络 32515.3 神经网络与传统方法的结合 32515.3.1 概述 32515.3.2 神经网络与dtw 32615.3.3 神经网络与vq 32615.3.4 神经网络与hmm 32715.4 神经网络语音识别 32815.4.1 静态语音识别 32815.4.2 连续语音识别 33015.5 基于神经网络的说话人识别 33015.6 基于神经网络的语音信号非线性预测 编码 33215.6.1 语音信号的非线性预测 33215.6.2 基于mlp的非线性预测编码 33315.6.3 基于rnn的非线性预测编码 33415.7 基于神经网络的语音合成 33515.8 支持向量机 33615.8.1 概述 33615.8.2 支持向量机的基本原理 33715.9 基于支持向量机的语音分类识别 33915.10 基于支持向量机的说话人识别 34015.10.1 基于支持向量机的说话人辨认 34015.10.2 基于支持向量机的说话人确认 34015.11 基于混沌神经网络的语音识别 34215.11.1 混沌神经网络 34215.11.2 基于混沌神经网络的语音识别 34215.12 分形在语音识别中的应用 34415.13 智能优化算法在语音信号处理中的 应用 34415.14 各种智能信息处理技术的融合与 集成 34615.14.1 模糊系统与神经网络的融合 34715.14.2 神经网络与遗传算法的融合 34715.14.3 模糊逻辑、神经网络及遗传算法的 融合 34815.14.4 神经网络、模糊逻辑及混沌的 融合 34915.14.5 混沌与遗传算法的融合 349思考与复习题 350第16章 语音增强 35116.1 概述 35116.2 语音、人耳感知及噪声的特性 35216.3 滤波器法 35416.3.1 固定滤波器 35416.3.2 变换技术 35416.3.3 自适应噪声对消 35416.4 非线性处理 35716.5 基于相关特性的语音增强 35816.6 减谱法 35916.6.1 减谱法的基本原理 35916.6.2 减谱法的改进形式 36016.7 基于wiener滤波的语音增强 36116.8 基于语音产生模型的语音增强 36216.9 基于小波的语音增强 36416.9.1 概述 36416.9.2 基于小波的语音增强 36416.9.3 基于小波包的语音增强 36616.10 基于信号子空间分解的语音增强 36716.11 语音增强的一些新发展 370小结 371思考与复习题 372第17章 基于麦克风阵列的语音信号 处理 37317.1 概述 37317.2 麦克风阵列语音处理技术的难点 37417.3 声源定位 37517.3.1 去混响 37517.3.2 近场模型 37617.3.3 声源定位 37717.4 语音增强 38117.4.1 概述 38117.4.2 方法与技术 38217.4.3 应用 38617.4.4 本节小结 38717.5 语音盲分离 38717.5.1 瞬时线性混合模型 38817.5.2 卷积混合模型 39317.5.3 非线性混合模型 39517.5.4 需进一步研究的问题 396思考与复习题 396汉英名词术语对照 398参考文献 407

封面

现代语言信号处理

书名:现代语言信号处理

作者:胡航

页数:440

定价:¥65.0

出版社:电子工业出版社

出版日期:2014-07-01

ISBN:9787121226250

PDF电子书大小:71MB 高清扫描完整版

百度云下载:http://www.chendianrong.com/pdf

发表评论

邮箱地址不会被公开。 必填项已用*标注