数据标注,语音标注

我最近在做语音深度学习的项目。整理了语音数据注释工具和语音注释平台以供参考

语音注释工具praat praat是目前比较流行的专业语音处理软件，可以进行语音数据注释、语音录制、语音合成、语音分析等，具有免费、占用空间小、通用性强、可移植性好等特点

官网提供http://www.fon.hum.uva.nl/praat/

汉化版下载http://www.hejing zong.cn/blog/view blog _ 54.aspx # vidio

打开音频文件，然后单击“标记”(Annotate )将其变换为文本栅格文件

分为“层”，这里分为文本、性别、身份、噪音四层

按住Ctrl键同时选择音频文件和文本栅格文件，然后单击以查看“编辑”(View Edit )以开始标记

完成标记、保存

一般来说，Praat功能强大，但用作语音表示，操作不简单，难以管理大量的语音数据。最近找到了几个数据标记平台。每个自我研究的标记工具更简单，更容易使用。

语音数据注释平台京东仞智

京东仞智的工具是单独开发的，这也很容易开发和重用。所有标注人员都在线回复，避免了数据泄露的问题。顺便说一下，我们的初始数据是用算法跑的一次，所以准确率不是很高…但是京东仞智可以展示我们的书写结果。记者简单修改后，效率会大幅提高。协商后不用重新显示，所以报价也减少了一点。

今天我来介绍这两个…未完的手续=3=