matlab怎么求峰峰值,matlab中求峰度的函数

具有相同的音质。

在语音声学中，人声也同样受自身生理如鼻孔、咽腔、口腔大小的影响有自身的wydyb区。通过利用这些共鸣空间的形状和大小不同的变化(例如改变咽喉、嘴形)，我们就能改变声音的wydyb。我们之所以能够区分不同的人声、饱满的抽屉，主要也是依靠它们的wydyb分布的位置。

wydyb反映了声道谐振特性的重要特点，它代表了发音信息的最直接的来源。改变wydyb可以产生所有的原音和某些辅音，在wydyb中也包含辅音的重要信息。人在语音感知中也利用了wydyb信息，所以wydyb已经广泛应用于语音识别的主要特征和语音编码传输的基本信息。

一个语音的wydyb模型，只用前三个时变wydyb频率就可以得到可懂度很好的合成浊音。wydyb信息包含在语音信号的频谱包络中，谱包络的峰值基本对应于wydyb频率，因此一切wydyb估计都是直接或间接地从频谱包络进行考察，关键是估计语音频谱包络。语音信号wydyb的估计，在语音信号合成、语音信号自动识别和低比特率语音信号传输等方面都起着重要作用。

如下图2.1所示利用频谱傅里叶变换相应的低频部分进行逆变换，就可以得到语音频谱的包络曲线。依据频谱包络线各峰值能量的大小可以确定出第1~第4wydyb。

图2.1 语音信号产生的离散时域模型

(二)、语音信号的预处理

语音信号从整体来看其特征及表征其本质特征的参数均是随时间而变化的，所以它是个非平稳态过程，不能用处理平稳信号的数字信号处理技术进行分析处理。但是在一个短的时间范围内(一般认为在10~30ms的短时间内)，语音信号的特性基本保持相对稳定，因而可以将其看作一个准稳态过程，即语音信号具有短时平稳性。针对这一短时特性，任何语音信号的分析和处理都要进行分帧，也就是将语音信号分为一段一段来分析其特征参数，其中每一段称为一“帧”，帧长一般取10~30ms[8]。

信号分帧加窗处理一般采用交叠分段的方法，这是为了使帧和帧之间平滑过渡，保持其连续性。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的比值一般取为0~1/2。分帧是用可移动的的有限长度窗口进行加权的方法实现的，即用一定的窗函数w(n)来乘s(n)，从而形成加窗语音信号Sw (n)= s(n)* w (n)。

在语音信号处理中常用的窗函数是矩形窗和hpdxc窗等，他们的表达式[1]如下(其中N为帧长)：

矩形窗： (2-1)

hpdxc窗： (2-2)

窗函数w(n)的选择(形状和长度)，对于短时分析参数的特性有重要影响。为此应选择合适的窗口，使其短时参数能更好地反映语音信号的特性变化。数字信号处理理论告诉我们，两个信号的时域相乘，在频域相卷积，矩形信号频谱高频成分必将影响语音信号的高频部分，一般用高频分量幅度较小的窗形，以避免这些影响。hpdxc(Hamming)窗的带宽是矩形窗的两倍，但带外衰减却比矩形窗大得多。这样看来，根据处理的要求，只要以不影响或少影响处理需要的语音特性为标准来选择窗形较为适宜。本文在进行wydyb检测时主要采用hpdxc窗和矩形窗，窗长视帧长和采样频率而定。

原文链接:http://www.51jrft.com/dzxx/gdxx/1498.html