我最近在做语音深度学习的项目。 整理了语音数据注释工具和语音注释平台以供参考
语音注释工具praat praat是目前比较流行的专业语音处理软件,可以进行语音数据注释、语音录制、语音合成、语音分析等,具有免费、占用空间小、通用性强、可移植性好等特点
官网提供http://www.fon.hum.uva.nl/praat/
汉化版下载http://www.hejing zong.cn/blog/view blog _ 54.aspx # vidio
打开音频文件,然后单击“标记”(Annotate )将其变换为文本栅格文件
分为“层”,这里分为文本、性别、身份、噪音四层
按住Ctrl键同时选择音频文件和文本栅格文件,然后单击以查看“编辑”(View Edit )以开始标记
完成标记、保存
一般来说,Praat功能强大,但用作语音表示,操作不简单,难以管理大量的语音数据。 最近找到了几个数据标记平台。 每个自我研究的标记工具更简单,更容易使用。
语音数据注释平台京东仞智
京东仞智的工具是单独开发的,这也很容易开发和重用。 所有标注人员都在线回复,避免了数据泄露的问题。 顺便说一下,我们的初始数据是用算法跑的一次,所以准确率不是很高…但是京东仞智可以展示我们的书写结果。 记者简单修改后,效率会大幅提高。 协商后不用重新显示,所以报价也减少了一点。
今天我来介绍这两个…未完的手续=3=