首页 > 编程知识 正文

语音识别技术(人工智能语音识别原理)

时间:2023-05-03 16:57:43 阅读:1130 作者:1863

1.什么是语义识别?

语义识别是自然语言处理技术的重要组成部分之一。语义识别的核心不仅仅是理解文本词汇的意义,还要理解这个词在句子和篇章中所代表的意义。这意味着语义识别在技术上要做到:在文本、词汇、句法、词法和章(段)级进行语义分析和消歧,以及相应的意义重组,从而达到识别本身的目的。

语义识别可以分为三个层次:

应用层:包括工业应用和智能语音交互系统/技术应用。

NLP技术层:包括以语言学、计算机语言等学科为背景,对自然语言进行词语解析、信息提取、时间因果关系、情感判断等技术处理。最终实现让计算机理解人类语言的自然语言认知,以及将计算机数据转化为自然语言的自然语言生成。

分词和信息提取:包括分词、词性标注、命名实体识别和词义消歧,从给定文本中提取重要信息。

句法分析和篇章理解:对篇章结构中一系列连续的分句、句子和段落的分析,包括时间、事件、因果关系等。甚至文字所承载的情感识别。

自然语言生成:以可读的方式从结构化数据中自动生成文本的过程。它包括三个阶段:文本规划(完成结构化数据中基本内容的规划)、句子规划(结合结构化数据中的句子来表达信息流)、实现(生成语法流畅的句子来表达文本)。

底层数据层:词典、数据集、语料库、知识图谱、外界的共同知识都是语义识别算法模型的基础。

语言本身的性质,如词性、词义、表意表达、复杂的构成逻辑等,决定了语义识别的难度。因此,语义识别技术还涉及语言学、计算机语言、数学、统计学、哲学、生物学等诸多广泛学科的支持:

音系学:指语言中发音的系统组织。

形态学:对构词法及其关系的研究。

句子:给定文本的哪个部分语法正确?

语义:给定文本的含义是什么?

语用学:文本的目的是什么?

二、语义识别应用场景

语义识别技术可以分析网页、文件、电子邮件、音频、论坛和社交媒体中的大量数据,应用广泛,可以直接应用于医疗、教育、金融等行业。还可以通过技术接口应用于所有智能语音交互场景,如智能家居、汽车语音、可穿戴设备、VR、机器人等。从交互方式上,也可以分为事实问答、知识检索、分类提问等。智能语音交互被认为是未来人工智能技术中最有前途的应用场景。

医疗:

电子病历系统:为医学专业人员提供实时语音听写和电子病历录入。

智能问诊/辅助诊断:直接服务C端用户或医疗专业人士,进行初步判断、分类科室、辅助诊断等。通过症状描述和关键词查询。

数据库查询:为临床专业人员提供语音导航、相关论文、文献数据库检索查询等。

教育:

口语测试:基于自然语言处理技术的口语测试。

适应性学习:通过人工智能技术、题库系统和算法模型,根据学生对考试中最后一道题的回答,自动调整学生需要回答的下一道题的难度和顺序,让每个学生都能有最适合自己的学习计划。

教育:以激发学生学习兴趣、培养学生综合能力为目标的机器人硬件产品,以及智能教育系统。

财务:

自动生成报告:处理结构化和非结构化的信息和数据,如公司年报、招股说明书、行业新闻、法律公告等。并以结构化的方式生成报告,为投资银行和证券研究机构提供服务。

风险控制

量化交易:利用自然语言处理、深度学习等AI技术进行量化交易模型的建立。

智慧投资:拥有更强大的计算机模型和人工智能技术的大量客户的财富画像,以及为客户量身定制的资产管理投资计划。

潜在客户/定制保险:

法律:

智能法律检索:数字法律文本、判决文件和其他法律资料的检索。

自动审查:审查、分析、研究法律文书、合同等文件,进行调查取证、尽职调查、合规审查、电子取证等。

智能文件起草:人工智能系统很可能会起草大部分交易文件和法律文件,甚至起诉书、备忘录和判决书,律师的角色将从起草者转变为审校。

在线法律服务/法律机器人:直接为终端用户提供一般法律咨询服务,如遗嘱、婚姻咨询、交通事故咨询等。

新闻/文学:

从新闻素材采集、智能编辑、自动写作、自动摘要生成,到智能新闻分发,语音/语义识别、AI翻译等技术正在新闻传播行业全面展开。据腾讯研究院测算,近8年来,新闻业收入减少三分之一,就业岗位减少1.7万个。

智能商务:

智能/虚拟客服:基于系统数据库和知识图谱,在与客户的对话中,我们可以得到客户的需求,并提供相应的答案来解决客户的问题。

舆情监测:通过自动抓取、分类聚类、话题检测、话题聚焦、跟踪网络舆情监测和新闻话题等。它可以形成分析。

报告,提出应对策略。

数据挖掘/智能营销:人工智能技术处理技术对于用户在互联网上留下的大量个人信息、登录信息、路径关系、社交关系、消费记录等数据有极高的处理效率,通过各种算法模型,达到数据挖掘,用户精准需求分析,自动化营销等目的。

翻译+:

基于深度学习技术的神经翻译技术(NMT),相比较于规则法(RBMT)、统计法 (SMT)两种机器翻译方法,最大的优点在于1.不在需要人为的去抽取特征;2.不需要进行词语切分、词语对齐、句法树设计等复杂的设计工作,而随着样本库的扩充和训练量的增加,其翻译能力得到正向提升。

未来,基于深度学习的翻译技术将更多的应用在会话、同声翻译、文本翻译等多种场景。

三、语义识别环境背景分析

语音识别、语义识别是自然语言处理最重要的两项技术,且联系紧密,在上述语义识别的广泛应用场景中,常常是语音、语义相互嵌套,共同作用的结果,大多数研究语义识别的公司也涉及到语音识别技术的研究,因而下述的分析中,涉及数据方面,我们更多的是放在自然语言处理层面来讨论的。

自然语言处理作为一项重要的人工智能技术之一,成为 2017年最炙手可热的领域,在整体上离不开政策上的支持,技术上的进展,市场应用的极高价值,资本投资等多方面的共同作用。

政策层面:政策引导是语义识别增长的外在驱动

人工智能作为国家战略发展规划之一,足见其重要性,在这个政策的纲领下,国家型自然科学基金、产业基金、地方政府财税优惠政策、人工智能相关实验室、科技产业园区等切实促进人工智能的发展落地,为自动驾驶、计算机视觉、语音/语义识别创业提供了更好的条件和基础设施。

经济层面:经济价值是语义识别发展的燃料

一方面,自然语言处理应用场景广泛,市场潜力和经济价值巨大,Global Market Insights的数据显示,2017-2024这七年,智能语音交互的全球市场,每年增长率将达到34.9%。据估算,2024年的全球市场规模,将达到720亿元。

另一方面,国内资本对于自然语言处理的投入也相当巨大,根据鲸准App数据统计,截止目前,自然语言处理已披露融资总额累计超 54 亿元。

自2015年以来,资本每年在自然语言处理领域的投资达到10亿元以上,2017年投资总额达到了18亿,从趋势上,近几年资本对于自然语言处理创业公司的关注度不断上升,资本投入也在加大(2015年5起、2016年12起、2017年1起未披露金额投资事件未计入下表统计)。

此外,在创业获投率上,自然语言处理相关公司的获投率达到惊人的50%以上。

社会层面:机遇与阻碍共存

自然语言处理技术的发展给生活带来极大的便利,人机交互更自然,更丰富。然而技术的逐渐深入,在创造更多经济价值的同时又不得不面对随之而来可能产生安全性、正确性、公平性、道德准则等问题。

技术层面:技术进步语义识别发展的核心

1. 数据量。

经过互联网、社交网络、行业信息化、云存储的发展,很多地方就积累了足够量的数据。当数据量不足时,自然语言处理还只能进行浅层模型分析,准确性上受到限制;当数据量增大,运用RNN、CNN为代表的神经网络深度算法模型对数据进行更复杂、精确的建模,从而使语言、语义的识别达到更好的效果。

2. 算法模型。

语义识别的实现离不开NLP语言处理任务系统,随着更大语料库的建设和语料库语言学的崛起,基于密集向量表征的神经网络在多种NLP任务上的应用获得优秀成果。

尽管深度学习算法模型并不是自然语言处理最佳的方式,但确是目前研究自然语言处理表现最好的方式,它在一定程度上缓解了词面不匹配、数据稀疏、语义鸿沟等问题。

四、自然语言处理创业数据与投资关注动态

1.自然语言处理创业数据

根据鲸准App数据统计,自2010年起,国内有关于自然语言处理的新创公司有179家,分别在2014年、2015年和2016年呈现公司成立激增的状态,而2017年公司创立有明显的下滑状态,分析原因,一方面如思必驰、云之声、助理来也等先发成立的初创公司在时间、技术、融资方面已经取得不小的优势,另一方面,在新技术应用场景开发、技术人才储备上有一个断档期。

2.自然语言处理相关标签热度

鲸准App近5个月的标签关注热度显示,自然语言处理整体关注度持续增长,其中语音识别关注度从7月以来增长明显,而机器翻译、语音个人助手的关注热度较之前有所下滑,其余语义识别、聊天机器人、智能客服、智能音响呈现稳定的波动和持续的关注状态。

3.科技巨头相关进展

虚拟助理,智能音箱,AI翻译……科技巨头今年在语音、语义识别领域有不少大进展。

苹果Siri,谷歌Assistant,微软bzdxl,三星Galaxy S8也在今年发布了自己的Bixby智能助理,京东、阿里巴巴、百度、联想、小米、出门问问和喜马拉雅等公司都相继发布和更新迭代了自己的智能音箱产品,抢占家庭场景入口;包括Google、Facebook、微软、百度、腾讯、搜狗在内的各大技术巨头却在不遗余力地推进深度学习在机器翻译领域的研发和应用……

4.自然语言处理创业代表厂商

国内最早的自然语言处理创业公司在经过几年的发展,已经在很多领域获得比较大的成果,各大厂商在识别技术上体现出来的差异性并不是太大,值得注意的是,语音识别、语义识别技术应该更加重视场景的垂直,在这方面,各大厂商各有定位和建树,因而,精准App数据中心只列举展示了数据库中所受关注度较高的项目(排名不分先后),如需了解更多优质早期项目,请下载关注鲸准App。

——END——

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。