首页 > 编程知识 正文

模块(模块和终端的区别)

时间:2023-05-04 01:03:03 阅读:78436 作者:699

机器能力是机器心下关注世界人工智能产业应用场景和商业化的内容账户。 欢迎关注和交流: almosthuman2017

这家蛰居两年的终端视觉公司,从首次发布会开始的两天内就获得了100多份订单。 什么样的新产品让产业如此兴奋呢?

执笔|王艺、藤子

11月1日,阅面技术在深圳举行成立两年来的首款新产品发布会,共发布三款产品:跨模态人脸识别引擎UniFace、基于UniFace的“星”AI芯片视觉模块,以及基于“星”的智能

发布会后,读了科技首席执行官在意的鞋,明确了机器的能力。 发布会的两天里,他们获得了100多份订单,但此时在意的鞋心掩饰不住兴奋。

阅面科技首席执行官在意的鞋

10多年前,心仪的鞋在上海交通大学博士毕业后,进入WiseNut从事搜索引擎和机器学习产品的开发。 随后,他加入阿里巴巴,领导包括自然语言处理和计算机视觉技术在内的算法团队,涉及搜索广告推荐、图像检索、图像过滤等。

2013年,令人在意的鞋创立了虚拟试穿APP“上街吧”。 这是一款集自然语言检索、虚拟试穿、服装搭配、精准购买为一体的手机APP,通过推荐和搜索技术,在影像处理技术的基础上,帮助女性进行服装搭配和在线购买。

2015年,互联网上的照片、视频数据大量出现,道路和公共场所的摄像头也非常普及。 但是,令人在意的鞋观察到这些设备不是智能的,或者当时的智能是“假智能”。 由于当时收集到图像信息后,放在服务器端或云端进行批处理,所以处理的目的仅限于图像检索级别。

在意的鞋基于计算机视觉技术判断,使终端设备具有真正的实时智能化能力,未来有很大的爆发潜力。 与此同时,移动APP应用市场开始疲软。 因此,在意的鞋不再“上街吧”,于2015年7月创立了阅读科技,专注于深度学习和计算机视觉,提供了嵌入式愿景方案。

人脸识别技术:重要的是平台之间、场景之间、领域之间

作为电脑视觉的重要分支,在意的鞋决定从脸部识别开始。 “脸部识别的意义在于,它将成为新的、统一的、唯一的ID。 它改造了大量的智能设备,人们无论是出入何处、登录还是认证,都是根据其ID实现的。 ”在意的鞋说。

基于人脸识别的情感识别引擎ReadFace是人脸识别技术推出的第一款产品,它起源于ReadFace的情感识别技术,人脸识别技术涵盖了性别、年龄等属性的识别,并逐渐发展成为当今的交叉模式人脸识别引擎UniFace。 令人在意的鞋认为,在反复研发的过程中,读脸技术经历了很多阶段。 首先是基础技术,支持人脸的各种基础属性,然后是识别技术。

在识别技术方面,阅读方面的技术多次在各国际评价中取得优异成绩。 例如,2017年5月,人脸检测平台FDDB的数据显示,阅面技术已经处于行业领先地位,接下来的6月,阅面技术人脸识别技术以99.82%的识别准确率获得LFW冠军。 但是,令人在意的鞋认为,脸部识别不仅仅局限于识别技术,脸部识别要走向实用化,还需要平台之间、领域之间、场景之间。

“LFW是一个比较标准的场景,在LFW之上达到非常高的水平,只是说明基础算法能力、算法团队很强,(读的是)没错。 但是,从算法到应用,从标准场景到实际场景,人脸的特质都会发生变化。 ”在意的鞋说。

例如,在无人零售的APP场景中,当照相机识别顾客的脸时,顾客通常不是从正面看照相机,而是在低头或低头的状态下从不同的角度进入照相机的范围。

即使人物正视照相机的应用场景,也有挑战。 例如,在人证的检查,也就是将身份证的照片和脸进行比较的情况下,存在年龄幅度的问题。 要识别幼儿园的孩子,基础数据和体系结构也与通用的识别模式不同。

令人在意的鞋认为通用的模型在一定程度上解决了精度。 在某些领域,如幼儿园儿童识别和无人零售人脸识别等,精度需要达到更高的水平。 因此,通用模型需要在小数据下迁移学习的能力,需要快速适应其他领域,使人脸识别技术满足特定场景的精度需求。

“所有基础模型都是基于千万规模的数据构建的,但在较小的领域中样本数据可能很少。 如何完全转移该模型的能力是我们研究的关键。 ”在意的鞋说。

令人在意的鞋子显示,面科技在发布会上发布的跨模态人脸识别引擎UniFace具有跨模态和迁移学习能力。 与当今主流算法不同,统一打破了不同传感器、不同环境、不同场景、不同领域人脸特征表达的限制。 例如,可以用可见光、红外线、3D这3种不同传感器识别相同的注册照片,实现以FaceID为连通的脸部的特征表现

“我们的算法可以在服务器上运行,可以在终端的DSP、VPU等专用芯片上运行,也可以在ARM Coretx-A7和A5等通用CPU核心上运行。 “我会介绍更多令人在意的鞋。

领先技术深度积累在嵌入式优化中,例如,在LFW中,统一精度在16位网络中为99.82%,在8bit网络中为99%以上,在1位网络中为95%以上。

他认为,移动端模型的优化不能以损失模型精度为前提,而在未来,要以 FaceID 打通人脸系统,移动端和云端就要具有同样的精度。

计算机视觉的三个爆发点:从人脸识别到数据采集再到人机交互

「人工智能落地到行业,一定需要入口,而这个入口一定是硬件,如同智能音箱是语音的入口。人脸识别作为计算机视觉的应用,它的入口在哪里?不是在远程某个服务器的某个 API 上,而是在真正进入家庭、社区、渗入生活方方面面的硬件上。」顺心的鞋子说。

这些硬件既可以是独立的摄像头,也可以是嵌入相机的设备或者其他设备。要实现人脸识别的广泛应用,不能单靠云端,因为云端的优势在于提供基础能力,所有的前端摄像头都需要具备智能的感知和认知层。人工智能技术或计算机视觉技术,正在逐渐贴近生活,向着简单便捷的方向发展是必然的趋势。

「之前的算法更多地是来源于实验室,部署在大型的计算中心、云端,需要很大的计算能力、功耗,无法走进人们的日常生活。」顺心的鞋子说,在这样的情况下,首先要解决算法贴近生活领域时的精度问题,并让高精度的算法以相对较低的成本、较低的功耗运行在贴近生活的设备上。

当各种设备具备视觉能力之后,所有的摄像头将不再是影像采集设备,而成为了数据采集的设备。很多数据采集手段将被视觉代替,摄像头不仅是摄像机,会成为传感器。「室内定位等问题,或者统计客流使用的 wifi 探针技术等,在未来全部会被视觉代替,这将成为计算机视觉未来很大的应用点和爆发点。」顺心的鞋子说。

「这种智能会带来全新的人机交互方式,我们从成立开始就一直认为以下三个点是未来最重要的应用爆发的三个点,人脸识别的需求在当下已经显现,基于视觉数据的分析 1-2 年后会爆发,而 3-5 年后的增长点则是人机交互。」顺心的鞋子分析道。

「繁星」终端视觉模块

「繁星」AI 芯片视觉模块系列正是基于这样的逻辑推出,可搭载适用于不同场景的算法 IP。目前主要包括:繁星-人脸识别模块、繁星-数据采集模块、繁星-人机交互模块。

繁星-人脸识别模块,通过宽动态 Sensor 获取图像或视频流,分析图像或视频流中的人脸图像进行检测和识别,输出结构化数据,可同时追踪和抓拍 30 人,抓取最清晰、角度最好的人脸,抓拍率 99%,误检率小于 0.5%,抓拍重复率低于 10%。同时,支持 2 万人内的完全本地人脸识别。支持本地特征提取后传云端,满足大于 2 万人的人脸识别场景。

繁星-数据采集模块,获取并分析图像或视频流中的人头和人脸信息,进行人数、人群属性以及轨迹分析。可实时记录 15 人运动轨迹及运动方向,可进行进出指定区域的人数统计,准确率达 95%。

繁星-人机交互模块,检测识别图像或视频流中的手势、人脸、人体,并转化为指令使得机器做出正确响应。能够达到毫秒级检测及追踪速度,支持掌、拳、V 字手型、伸掌、握拳、挥手等多种手势操控,具有高鲁棒性的人脸及人体检测追踪运算。

据阅面科技介绍,「繁星」AI 芯片视觉模块尺寸为 38mm×38mm×1.6mm,由 Sensor+ISP+VPU+嵌入式深度学习视觉算法组成,在本地集成了阅面科技的深度学习视觉处理算法,本地深度学习处理功耗仅为 0.5W,整体阳光的哈密瓜功耗小于 2.5W。

此外,「繁星」AI 芯片视觉模块支持外接视频输入以及结构化数据的实时输出,既可以作为独立 AI 摄像头嵌入到各种设备中即插即用,也可以作为视觉协处理器。例如,传统摄像机加入「繁星」AI 芯片模块,就能摇身一变,成为一个拥有视觉算法能力的智能 AI 相机。而且摄像头厂商在设计搭载「繁星」的摄像头时,不需要重新设计模具。

推出满足未来趋势和潮流的产品

产品的推出,并非易事。「从成立到现在,很长一段时间,我们都在进行技术研发,不仅涉及算法,还涉及与硬件层的衔接、系统层的应用。我们花了很大的精力进行基础研发,经过长时间积累,希望我们推出的产品能改变行业,增加行业产品迭代的效率或创新能力。」顺心的鞋子说。

而为了给下游摄像头厂商吃颗定心丸,也为了树立「繁星」的使用样板。阅面科技采用自身的「繁星」数据采集模块研发了一款名为「阅客」的智能客群分析摄像机,并连接了阅面科技自身搭建的垂直行业云,并配有手机 App,用户能够通过该 App 实时观察到客群分析情况。利用「繁星」的本地计算能力,阅客可以轻松进行实时客流计数、会员/熟客管理、轨迹管理等功能,商家能实时掌握顾客属性和行为。目前,「阅客」已和苏宁、软通动力、淘咖啡等品牌达成合作。

顺心的鞋子认为,UniFace、「繁星」、「阅客」这三款产品是层层递进的关系,算法——基于算法的硬件——基于硬件的产品。通过这三款产品,阅面科技能将很大部分的视觉识别能力搬至终端;降低 AI 硬件的构建成本,降低技术的使用门槛;方便垂直行业快速开发场景化的智能视觉产品。这意味着,非 AI 技术的行业商家也能轻松开发和部署人脸识别产品和系统,以消费级的价格,做到专业安防级的能力(举例来讲,具备人脸抓拍功能的安防摄像头成本是普通摄像头的 3-5 倍,而使用「繁星」,可以将 AI 摄像头的成本控制在与普通摄像头相近的范围)。

阅面科技成立于 2015 年,对于市场上的计算机视觉公司来说,并不算早。当前在计算机视觉市场上,也有不少的玩家。通常来说,一个新进入的公司要想在这个竞争格局中生存下来,差异化是重要的选择。

然而,顺心的鞋子却表示,「对我们而言,公司发展重点不是差异化,而是思考这个领域产品形式的终极形态」,在顺心的鞋子看来,他们对行业的认知、技术的出发点、产品的出发点、以及未来解决方案的出发点,都是基于对行业终极形态的思考构建的。「我们希望推出的产品能够满足未来的趋势和潮流。如果其他公司与我们认知一致,那我们就比谁走得快;如果我们认为的终极形态跟别人不一样,也还是会根据自己的认知走下去。」顺心的鞋子总结道。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。