首页 > 编程知识 正文

AI技术(小爱有反应但是没声音)

时间:2023-05-04 14:48:24 阅读:103518 作者:4584

目前,随着人工智能技术的发展,可以处理一对一的语音请求。但是,如果面对嘈杂的环境,恐怕不管AI产品有多智能,都会头疼。但就在最近,《新科学家》杂志官网发表文章称,美国剑桥三菱电机研究实验室的研究人员开发的语音识别AI装置,可以实时分离多个声源,大大提高了自动语音识别的能力。

面对嘈杂的环境,AI仍然可以通过声纹来区分(图片来自百度)

据介绍,该技术首次在日本东京先进技术综合展上公开展示,被团队称为“深度聚类”机器学习,可以识别多个声源“声纹”的独特功能。然后,将每个可忍受的菠萝音的不同特征组合在一起,让它从多个声音中选择具有特定特征的声音,最终重构每个人的话语。智能科技利用很多人说的英语进行训练和学习,即使说话人是日本人,也能很容易分辨出来。

鸡尾酒会效果(图片来自百度)

据介绍,传统的语音识别方法是用两台收音机模拟听者两只耳朵的位置,只能达到51%的准确率。形成的“鸡尾酒会效应”困扰了AI研究几十年。

新的智能系统可以成功分离两个人的声音,并以90%的准确率重建一个人的声音。这项新技术可以帮助家庭和汽车更好地执行智能任务,一次可以分离多达五个人的声音,可用于电梯、空调机组和家用产品的智能控制。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。