数字语音信号的检测与处理——1.2
英语口头禅
首先简单介绍了语音信号和人类语音通信的高级模型,然后可以更详细地输入数字语音处理技术金字塔。 图1.5显示了我们“数字处理语音信号的基本概念的层次图”。 栈的底部是DSP理论、声学(语音生产)语言学)语音的语音编码)和感知)以语音、音节、单词、句子和最终含义)的形式进行数字语音处理的科学/技术。 这些有限的知识区域构成了信号处理的理论基础,这些信号处理被形成为将语音信号转换为更有用的形式
第1项第2项
演讲山9
嵌入在那里的信息。 第2章-5章介绍了DSP和语音科学的基本原理。
我们堆栈的第二层和第三层包括约束层,即图1.1的技术金字塔。 语音堆栈中的第二层包含一组语音信号的基本表示形式。 这些代表如下:
时间显示(包括声音波形本身)、
光谱显示(傅立叶宽度和相位)、
同类型表示(倒频谱),最后是
类似线性预测代码(LPC )的模型表示
根据整本书的介绍,由于每次演讲都有其优点和弱点,所以它们都被现代语音处理系统广泛应用。 第6-9章涉及语音信号的4种基本数字表示。
堆栈的第三层涉及将各种语音恢复信息集成到估计语音信号基本特性的算法中。 第2层和第3层由虚线分隔,这意味着计算语音表示的算法和提取语音特征的算法中使用这些表示的边界不是刚体。 语音处理算法的示例包括判断信号波形的分段是否应该按如下方式分割。
演讲、沉默、
有声或无声的声音或背景信号。
当所分析的信号段被分类为浊音语音时,各种速度算法(统称基音检测方法)有助于确定基音周期)或基音频率(不同算法),被称为个性热狗估计方法),使用感兴趣的语音段第10章中,我们将看到提取或估计特定语音特征的算法的性质和有效性在很大程度上取决于该算法的基础表现或表现。 第十章给出了基本表示在语音分析算法中的应用。
语音堆栈的第4层和顶层是语音处理的最终用户APP通讯套件。 该层代表了该技术的收益,包括语音编码、语音合成、语音识别与理解、说话人认证与识别、语言翻译、语音增强系统、语音加速与放慢系统等。 1.3节概述了其中的几个应用领域,11-14章详细论述了第三个主要应用领域:语音和语音编码11-12章、语音合成[13章]