首页 > 编程知识 正文

语音标注,语音软件有哪些

时间:2023-05-05 05:57:58 阅读:159495 作者:4499

人工智能行业普遍认为语音将成为下一个重要的技术平台,近年来,随着人工智能理论和技术的飞速发展,语音识别(ASR )、语音合成(TTS )技术不断取得突破。 虽然理论技术有了很大的进步,但在实际应用过程中不可避免地会出现数据标注这个话题,训练数据的准确性严重影响了算法模型的表达。

两个月前,Mozilla宣布推出开源语音识别数据集项目Common Voice的最新版本,使其成为目前世界上最大的人类语音数据集。 接下来,我们来谈谈这些语音数据集是如何产生的。

一篇文章详细介绍了语音标记工具Praat的使用方法。 我想说的是,Praat真的很难使用。 今天,我找到了一个可以在网上运行的语音数据标记工具。 由京东制作并开放。 可以自主配置

1 .配置标注工具

2 .预览标注工具会选择是否过帐。 也就是说,是否需要将语音转写为文字。 大部分都需要吧。 最长的声音切断时间:也就是说,根据素材的不同,最长需要显示几秒钟。 澄清这个定义,避免标记者切断太多声音。 选择或添加层次:系统默认给出常用角色、性别,可以根据你的需要添加或减少层次判断项目。 可对噪声、发音重复等情况进行特殊处理并填写具体书写规则,方便记者实时观看

接下来,请尝试刚才放置的标记工具。 可以过帐语音以标记角色、性别、噪音等。 虽然可以拖动时间段,也可以播放每个片段的音频,但是体验非常好,标记效率也大幅提高。

3 .上传标记对象数据此处不再赘述,根据系统要求上传标记对象音频数据。 给大家两个语音测试用

4 .发布注释项

在京东伉智这个平台上选一个标队做标,输入要求的合格率、工期要求等,与标队确定好价格和预付费就可以了。 工具使用费提供给平台,目前是免费的。 一般来说,它肯定比找其他加价平台便宜。

5 .检查并导出标注结果,标注团队完成标注后,可以在线检查标注结果,不合格则回滚,让标注团队重新标注。 结算后,可以导出数据。

我和一些标示小组联系过,过帐一个小时的语音大约需要150-200元。 当然,我们来看看具体需求和加价难度。 希望未来的大厂们能有更多的语音数据开源,推动科技进步,开源万岁!

3358 www.Sina.com/http://Biao.JD.com/business/center new

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。