首页 > 编程知识 正文

智能感知与建模(ocr什么意思)

时间:2023-05-06 17:33:45 阅读:80164 作者:1998

资料来源:环球时报

【环球时报科技报道记者hpdlm】将JPG、PDF等格式文件和社交、视频等软件APP的信息转换为语音,有助于降低盲人使用电脑的门槛,理解更复杂的页面和场景。 这是达摩院视觉实验室和浙江大学联合研究的OCR技术取得的重大突破,通过复杂的排版实现了段落和表的顺序识别,整体识别精度达到了99%以上。

这项技术是“阅读光计划”成果的一部分。 12月3日,在“智能辅助视觉障碍文化服务研讨会”上,中国盲文图书馆、浙江大学、阿里巴巴合作启动“阅读光计划”,促进数字化能力与社会应用场景的结合,为1732万盲人提供更加友好的数字

据介绍,“阅读光计划”的第一个成果是,AlibabaCloud、浙江大学和中国盲文图书馆共同建设了“智能家居馆”,计划为盲人捐赠5000台天猫精灵智能扬声器。 优酷依托技术积累和内容资源,建设中盲图和无障碍电影网络观看平台,未来3年将推出100部无障碍电影; 阿里达摩院将与浙江大学合作,向中国盲文图书馆输出最新的OCR屏幕技术方案; 钉钉将协助中国盲文图书馆完成基于信息无障碍的智能办公系统升级。

基于OCR技术的信息化阅读

OCR,光学字符识别,光学字符识别是指利用光学技术和计算机技术对文档数据的图像文件进行分析、识别处理,取得字符和版面设计信息的过程。

文字识别是计算机视觉研究领域的分支之一也是人工智能的基本课题之一OCR技术最初用于邮政系统的邮政编码数字识别等活字文字识别,实现了邮件的自动分类功能。 随着光学成像设备(扫描仪、数码相机、手机等)的迅速发展,OCR的应用领域越来越广泛,涵盖了车牌识别、证书识别、票据识别等多个场景。

2018年,淘宝天猫上线“听图购物”计划“读光OCR”,将照片信息准确地转换为语音,让盲人可以用耳朵购物。 同时,熟练使用淘宝的盲人迅速增加,据推测盲人每天有8000件以上的购物。

阿里的OCR技术使手机淘宝具备了自动识别图像的能力。 阿里达摩院资深算法专家、阿里OCR技术总监背后宝马表示,阿里技术团队从2010年开始致力于解决图像中的文字问题,在深度学习技术还不成熟时,主要采用MQDF等传统OCR技术,淘宝

目前,阿里达尔马院正在“输出”这项技术成果。 中国盲文图书馆的自我钻研软件“阳光阅读屏”将JPG、PDF等格式文件、社交、音频等软件APP的信息转换为语音,大大降低了盲人使用电脑的门槛。

智能家居将成为盲人的“眼镜”

位于中国盲文图书馆五楼的“智能家居馆”,由中国盲文图书馆与浙江大学、阿里巴巴共同建设,以“居家无障碍”为理念,以智能家居为核心,为盲人提供无障碍的居家生活体验。 是国内第一个面向残疾人的智能家居体验中心。

目前,“智能家居馆”以天猫精灵智能扬声器为控制中心,与传感器、眼灯、扫地机器人等30多种智能家居硬件连接,在安全、照明、娱乐、循环控制等方面实现了无障碍未来将常设在图书馆内,对外展示智能家居产品如何切实应用于残疾人的生活场景,促进智能家居产品为残疾人提供更广泛的服务。

例如,对盲人来说,寻找遥控器进行操作可能是常有的事。 有了语音控制和智能家电,只要动动嘴,“把客厅的空调调到26度”、“开扫地机器人”、“家电按指令工作”的在家生活环境对盲人更友好。

同时,智能家居馆还原了家庭生活的场景,营造了客厅、餐厅、卧室、办公室等场景。 以天猫精灵智能扬声器为中心,控制包括传感器、扫地机器人、电视、饮水机在内的约30个家电产品,从安全、清洁、照明、厨房、娱乐、循环控制6个模块进行智能改造,成为用户的

中国残联理事、中国盲协主席的粗心太阳镜在会上表示,目前我国有1700多万盲人,智能家居可以让盲人拥有科技“眼镜”。

未来,中国盲文出版社会将在天猫精灵开设专区,盲人可通过天猫精灵获得资源服务,预计约13000种有声读物125303将聚合约60000小时。 电子盲文5401种约5亿字。

中国盲文出版社、浙江大学、阿里巴巴也将推进更多图书馆无障碍阅览室,设置天猫精灵角,让盲人更多体验。

AlibabaCloud智能副总裁、阿里巴巴技术公益委员会秘书长强航表示,此次阿里巴巴与中国盲文图书馆、浙江大学的合作,只是“读光计划”的出发点。 “未来,我们将与更多的伙伴合作,探索更多的需求场景,将科学技术应用于更广泛的公益领域,以解决数字鸿沟、教育、医疗、环境保护等难题,在为社会服务的过程中体现科学技术的价值和科学技术的温度。 ”

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。