许多现代语音识别系统都使用频域特征。 个性化的咖啡豆频率倒谱系数(mfcc )首先计算信号的功率谱,通过滤波和离散馀弦变换提取特征。 本文重点介绍了提取mfcc特征的方法。
首先创建python文件,然后导入库文件from scipy.ioimportwavfilefrompython _ speech _ featuresimportmfcc。 logfbankimportmatplotlib.pylabasplt 1,首先创建python文件,然后创建库文件,from scipy.ioimportwavfilefrompython _ speech _ fean
读取音频文件:
samplimg_freq,audio=wav file.read (' data/input _ freq.wav ' ) )。
提取mfcc特征和滤波器特征:
MFCC_features=mfcc(audio,samplimg_freq ) ) ) ) ) ) ) )。
filter bank _ features=logfbank (audio,samplimg_freq ) ) ) ) ) ) ) ) ) ) ) ) ) )。
打印参数以确定可以生成的表单的数量。
打印((nm FCC : (nnumberofwindows=)、mfcc_features.shape[0] ) ) ) ) ) ) ) )。
print('lengthofeachfeature=',mfcc_features.shape[1]
打印((nfilterbank : (nnumberofwindows=),filterbank_features.shape [0] ) ) ) )。
print('lengthofeachfeature=',filterbank_features.shape[1] )。
可视化mfcc的特征。 将矩阵转换为时域水平:
mfcc_features=mfcc_features.t
PLT.matshow(mfcc_features ) )。
PLT.title(mfcc ) )。
可视化滤波器组的特征。 将矩阵转换为时域水平:
filter bank _ features=filter bank _ features.t
PLT.mat show (filter bank _ features ) )。
PLT.title('filterbank ' ) ) ) ) )。
plt.show () )
你想和很多网友交流吗?
点击这个留言吧!