librosa官网,python librosa

语音文本格式转化及在librosa库的语音文本输入要求

闲话少说，直接上料！

python的librosa库是语音模型进行语音特征提取的常见的库；但使用时请注意，librosa库仅支持wav格式的语音文件！！！如果你上传的文件格式为m4a，则可通过ffmpeg对语音文件的格式进行转换，前提是安装ffmpeg！！！

对于常见的苹果手机/电脑录音，音频格式为m4a；如果我们把它转化为wav格式，进行如下操作

ffmpeg -i 需要转化的文件名.m4a 目标文件名.wav

其中，目标文件名自己定义，转化后的wav格式文件自动保存到当前路径下。

ref : 安装ffmpeg的步骤

如果对你的语音转化有帮助，请关注本人blog；接下来，我会分享更多的关于NLP，ASR相关的博文；如对相关领域感兴趣，欢迎留言讨论～