首页 > 编程知识 正文

历届中国科学院院士名单(邬贺铨院士提出的技术发展)

时间:2023-05-05 10:17:13 阅读:98465 作者:2594

来源:数据视图

近日,由中国国际大数据产业博览会组委会主办、Data View(北京)传媒科技有限公司承办的“永不落幕的数字博览会”2020系列活动——“大数据产业生态创新发展峰会”在北京举行。

本次大会汇聚了中国科学院院士、政府嘉宾、大数据龙头企业代表,围绕加快数字产业化、助推产业数字化、构建大数据新产业新模式、新业态,探讨未来大数据产业生态建设和发展的机遇与挑战。中国工程院院士Wsdhm在会上发表了《数据价值挖掘的挑战》主题演讲。

数据融合和利用首先需要标准和规范。

wsdhm院士表示,数据融合的运用首先需要标准和规范,实现数据可见性、数据可理解性、数据可链接性、数据可信性、数据互操作性和数据安全性。

wsdhm院士通过实例具体介绍,以色列首都特拉维夫将所有交通摄像头的视频合成一个完整的视频,就像市领导乘坐直升机俯视城市一样,可以看到不同时间标有不同颜色的交通管制和交通事故,通过5G和4G实时发送给行人和司机,供大家自主选择出行路线,这就是数据可视性;除了核酸检测,新冠肺炎的诊断可能还需要CT。一个肺可以做300张CT图像,300张CT图像可以缩小到一个肺。然后看肺有没有纤维化,肺的周边怎么样,可以让数据通俗易懂;展现去年和今年的欧洲航空形势,把所有飞机上的数据连接起来,形成航空的数字孪生交通镜,就有了大局;现代建筑中散落着许多古罗马遗迹。如果你想看古罗马的样子,现在可以把这些遗迹的照片组合成一个视频,再把分散在时空中的照片组合起来,生成一个反映古罗马街景的视频。这就是数据互操作性。

关于数据的可信度和安全性,wsdhm院士特别提到,如果数据本身不完整,或者有很多错误,那么这种数据挖掘是没有用的,需要数据质量管理技术,能够按照规定的程序对数据进行适当的标记、保存和记录,在生命周期中能够受到亲属关系元数据的保护和绑定。在数据安全方面,要实现精细化的权限管理和审核,定期评估分类标准,测试合规性。

数据挖掘面临计算算法的挑战。

wsdhm院士说,数据挖掘首先要建立一个数据模型。构建数据模型的前提需要知道模型的开发背景和目的,谁来训练模型,数据从哪里来,模型的有效性如何。需要注意算法的完整性、可解释性、公平性和适应性。同时,模型在开发后需要不断地测试、迭代和改进。

目前,该算法主要采用深度神经网络。深度神经网络经历了两代。第一代主要是知识驱动,即专家系统,找出专家经验,然后进行逻辑推理。现在是第二代人工智能,大数据来了,是数据驱动的。wsdhm院士认为两者都不够完整。“目前,大数据有很多应用。我称之为大数据、大计算能力、小任务、大量数据和非常强大的计算能力。其实只做了一件小事,稳定性不够。不知道为什么,可解释性差,应用场景窄。如何解决这个问题?最好是小数据、小计算能力、大任务。”凯特尔骄傲的院士说,现在要发展到第三代,既需要知识,也需要数据驱动,很多人说要用内脑去应用人的认知机制。虽然很难,但这个方向还是需要的。

wsdhm院士表示,大数据分析不能只依靠中心云,而要经常使用边缘云,因为边缘云可以就近处理,适合一些对数据测试比较敏感的业务,包括我们的生产线,有些数据不能送到很远的地方处理,所以不能起到实时的作用,只能总结经验。有时,如果需要实时性,中心云的部分功能会沉入边缘云。如果一切都想要云边协同,但这是具有挑战性的,那么如何协同,如何分配这种计算能力,是大数据挖掘需要解决的问题。

g-caption">

  现在是大数据、大算力、小任务,大数据也不见得那么全面,人工智能会误判,而且模型准确性也不是想象中那么好,人工智能需要大量标注或清洗的数据,但很多时候只有小数据,怎么在小数据、小算力的情况下边提高人工智能的分析能力,这是大数据分析面临的挑战。

  大数据融合需要人与数据融合

  wsdhm院士认为,很多大数据融合需要人与数据融合。把人的数据跟客观的东西融合在一起,把人的经验介入到大数据分析过程,但是人不能永远介入,什么时候什么场景下能介入,这是需要经验的。大数据分析不是不需要人,也不是大数据、工业互联网时代的工人、工程师没用了,里面还需要用到工程师和工匠的精神。

  数据只有融合才有价值,但融合就涉及到隐私和商密保护问题。wsdhm院士谈到,每个企业都希望用别人的企业的数据,不愿意把自己的数据拿出去,总觉得这是商业秘密,那怎么做融合?怎么做到既融合又不会泄露每个企业的商业秘密,这是可以做到的,也有很多很多方案,比如采用多方计算的方式。

  此外,大数据分析本身会用很多软件,包括很多开源软件,可以网上宕下来,但是开源软件漏洞很多,而且版本升级太频繁,需要检查它的安全性,采用也可能会出问题。如果用自然语言直接生成代码,当然反过来就能从代码判决出原来这个软件的意图,如果能知道这个软件意图,那就能知道有没有加入其它不该加入的东西,就能确保代码是可信的。另外一种,大家往往为了怕数据泄露和篡改,采用加密手段,加了密的数据是比较难进行安全扫描的,不过加密也不是万能的,还得从开始作为内生的设计上让它更安全。

  演讲的最后,wsdhm院士总结谈到,智慧城市的管理和工业互联网里有很多需要数据融合应用的场景,多元异构的数据融合能够盘活数据,通过数据挖掘开发数据的价值,发挥数据作为生产要素的作用。但是数据挖掘和人工智能的分析要面对海量的处理能力、云边端的协同、建模、小数据、人与数据的融合、数据自身安全、隐私和商密保护等挑战,我们需要从基础理论跟工程实践多方面来研究数据价值挖掘的问题,要开发出更高效的大数据和人工智能分析技术,整个大数据的创新还是任重道远。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。