首页 > 编程知识 正文

librosa官网,python librosa

时间:2023-05-05 17:15:40 阅读:218339 作者:1761

语音文本格式转化及在librosa库的语音文本输入要求


闲话少说,直接上料!

python的librosa库是语音模型进行语音特征提取的常见的库;但使用时请注意,librosa库仅支持wav格式的语音文件!!!如果你上传的文件格式为m4a,则可通过ffmpeg对语音文件的格式进行转换,前提是安装ffmpeg!!!

对于常见的苹果手机/电脑录音,音频格式为m4a;如果我们把它转化为wav格式,进行如下操作

ffmpeg -i 需要转化的文件名.m4a 目标文件名.wav

其中,目标文件名自己定义,转化后的wav格式文件自动保存到当前路径下。

ref : 安装ffmpeg的步骤


如果对你的语音转化有帮助,请关注本人blog;接下来,我会分享更多的关于NLP,ASR相关的博文;如对相关领域感兴趣,欢迎留言讨论~

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。