首页 > 编程知识 正文

系统的收敛域怎么求(系统函数求收敛域)

时间:2023-05-05 19:30:49 阅读:98073 作者:1507

在LiveVideoStackCon 2020北京站,我们邀请到了算法工程师的无声八宝粥,这是一段曾经为苹果、脸书和Zoom工作的音视频。易亚博士毕业于美国达拉斯德克萨斯大学,曾在统计信号处理研究实验室担任研究助理,专注于助听器中的语音数字信号处理算法。

2019年底,沉默的八宝粥加入了网易。其研究范围包括传统的信号处理算法和基于人工智能的算法。沉默八宝粥除了是人们口中的“程序员”之外,还有着嘻哈老师、国家二级乒乓球运动员等多重身份。并参加过顶级歌手的世界巡演.而当一个美国的医生从湾区来到大陆,他的生活发生了什么变化?

用沉默的八宝粥自己的话说,就是“系统依然收敛稳定”。

以下内容由LiveVideoStack与沉默八宝粥的一次访谈整理而成。

LiveVideoStack:在你众多的身份中,你更喜欢哪个“自我”,最满意哪个“自我”?在众多的标签中,开发人员/程序员处于什么样的位置?

无声八宝粥:最过瘾的可能是舞蹈家/编舞家的身份,最满意的应该是声学工程师的身份,因为我能从普通的声音中听到更多的信息,比如声音是否失真,每个人的音高基频,环境噪音的分贝数等等。

开发人员/程序员应该相当于我实现自己算法的一种方式。要将我听到和提出的算法应用到实践中,我需要自己去写。

LiveVideoStack:在美国学习和工作时,你最开心的时刻是什么?

无声八宝粥:应该是博士答辩结束,老板对我说“恭喜郝博士”的时候,提案成功的时候。

LiveVideoStack:加入E-Cloud后,你的生活发生了哪些变化,有哪些喜怒哀乐?

沉默八宝粥:其实没什么好担心的。如果你坚持,可能是工作时间的增加导致家庭和个人时间太少。

其实我喜欢的东西还挺多的。我以前没有去过中国的公司,但我已经准备好应对“糟糕的情况”。但在实际工作中,团队氛围、专业水平和我的适应状态都达到了很好的正反馈系统,用DSP术语来说还是收敛稳定的。

音频算法的迭代不是一个短、平、快的工程,需要耐心打磨和积累。网易就是这样一家企业,别出心裁的创新。这是我选择网易云信的最大原因。

LiveVideoStack:每周四在云信的程序员们分享进展如何,最近分享了哪些有趣的话题?

沉默八宝粥:我觉得周四的分享特别好,分享内容广而深。给我印象最深的是音频组同事谈到的音频信号问题分析。现场气氛很好,大家都在积极讨论。而且,分享之后,大家的反馈也表明,他们知道很多音频问题背后的具体原因。虽然分享最后有点像音频组的“甩锅大会”。

LiveVideoStack:你在FB、苹果等互联网公司工作时遇到过哪些令人印象深刻的技术问题,你是如何处理的?

无声八宝粥:当时在苹果,第一个落地的算法是结合了新传感器的音频算法。当时的难度挑战是相关论文很少,很多细节只能自己去探索。我的回答是“加班”。

我开玩笑的。我加班了几天,但关键策略不是急于求成,而是要把每个产品下传感器的所有指标都考虑进去,测试好,打好基础,做好前期工作,让计划非常可行。

苹果的音频实验室设备齐全,达到了“随你便”的境界,为工作提供了很多便利。

LiveVideoStack:关于基于AI的算法产品化,你有什么平台或产品让你欣赏?

无声八宝粥:在音频领域,虽然AI音频算法在产品落地上仍未普及,但谷歌近年来一直是该领域的佼佼者,亚马逊Lab126在该领域的研究也非常先进。

LiveVideoStack:“AI算法任务模块化”是什么概念,有哪些实际使用案例?

无声八宝粥:AI算法在实际应用中存在很多问题。在音视频算法中,用AI处理一个链接较长的算法问题时,模型的效果、泛化能力和计算复杂度都很麻烦。

如果遵循传统算法,则单独取出传统算法中适合AI的模块,由训练好的Model进行处理,可以在上述三个维度进行改进。

LiveVideoStack:在具体技术“产品化”的过程中,你遇到过哪些困难?

无声八宝粥:

主要的困难是算法的研究与产品的需求之间往往存在着差距,在云信的算法落地过程当中,稳定性和高可用性是我们的首要目标。

在此基础上,我们会不断地去match产品的需求,分清需求的重要程度,不断地对算法的细节进行调整。

LiveVideoStack:据您个人经验,中美科技公司将音频技术“产品化”的过程有何不同?

默默的八宝粥:其实中美公司在很多方面都已经比较接近了,在音频技术“产品化”方面,美国和国内公司相比,唯一的不同可能在于其音频技术产品化的流程比较清晰,音频相关的储备(比如音频工具、消声室、技术积累)比较完善。

云信目前也有很多音频相关储备,比如Soundbooth、人工头等工具,在传统3A算法和AI算法上都有可观的技术积累。

LiveVideoStack:就您个人经验,国内的公司需要如何快速弥补这一点不足;以及国内互联网公司又有哪些令你欣赏的优势呢?

默默的八宝粥:首先,这些不足没法快速弥补。

追赶的方式我认为还是积累更多相关的人才,还需要让更多追寻的乌龟认知到音频开发和其他开发的不同之处(开发周期长,需要时间打磨与积累)。

我认为国内现在最大的优势在于国家层面开始重视音视频技术,以及国内的消费能力和市场,这两点足以支撑音频领域的快速积累。

LiveVideoStack:您现阶段正在解决的问题?

默默的八宝粥:现在基于AI的音频算法产品化的过程中,瓶颈依然是算法的泛化能力和Model复杂度,我们现在所专注的就是在不影响算法表现的情况下去提高泛化能力、降低计算量。

LiveVideoStack:您下一阶段的研发目标?

默默的八宝粥:更深入的去“模块化”传统的音频算法,将更多的“小模块”用AI替代。

编辑:Coco Liang

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。