公司发展历程简介范文,知识图谱技术原理介绍

目录1 .网络概述2 .语义网概述3 .知识地图概述4 .参考文献

1 .网络概览

1990年，清洁万宝路Berners-Lee在欧洲粒子物理实验室(CREN )实现了万维网(WWW )原型系统。的万宝路认为，网络是一个相互链接的超文本文件系统，可以通过互联网访问。为此，他设计超文本标记语言(HTML )来写网络中的文档。为了统一识别网络中的文件，轻快的万宝路提出了通用文件标识符(UDI )。随后，UDI发展为统一资源定位符(URL )，并且URL逐渐被统一资源标识符(URI )替换。 URI可以识别任何资源。由于URI限于ASCII字符集的子集，因此提出了国际化资源标识符(IRI )，IRI可以容纳包含汉字等的通用字符集。这是为了让互联网用户按照规格访问网络中的文件。的万宝路及其合作方设计了超文本传输协议(HTTP )。 HTTP是基于TCP的APP应用层协议，是请求/响应协议。网站(Web站点)是指互联网上的某个计算机系统，实现HTTP服务终端接口，可以由互联网用户使用Web浏览器显示的HTML文件和其他可访问的文件等除了实现HTTP客户端接口外，浏览器还必须能够以该格式显示接收到的网页。 1990年底，轻快的万宝路在CREN上实现了第一个浏览器和第一个HTTP服务器软件，开发了世界上第一个网站。这也标志着网络的诞生[4]。

作为一种网上分布式信息系统，万维网具有跨平台和开放等特性，具有很好的易用性和可扩展性，使万维网迅速发展成为人类历史上最大的超媒体信息系统。

2 .语义网简介经典网络是相互链接的超媒体文件系统，计算机很难理解这些文件的内容，很难重用和集成网络中的数据，提供更有用的信息服务。 W3C于2001年成立了语义网(Semantic Web )，共同开发了一系列技术规格。这使得计算机能够容易地理解符合语义网技术规范的数据，并且允许在不同的APP应用之间更容易地共享和复用彼此的数据[4]。也就是说，语义网提供数据共享和交换，而网络只是文档共享和交换。下图为W3C显示的语义网技术堆栈[6]。

语义网以资源描述框架(RDF )为基础。 RDF是一个通用的数据模型，以三个组为数据单元描述资源类型和属性。一个RDF三元组由主语、谓语和宾语构成。 URI可以出现在三向轴中的任何位置。空白节点不能用作谓词。空白节点只能标识为局部资源，没有URI全局标识能力。字面只表现为宾语，通常表示字符串、实数等基本类型的数据。

本体(ontology )在语义网络中起重要作用。在信息技术领域，本体概念用于知识表示，一个本体是共享概念模型表示的形式化规约。在语义网上，RDF数据中使用的类型和属性也需要提供明确的形式化约定，只有这样，APP应用程序才能理解数据的含义。通常，一组相关的类和属性称为术语表。 W3C在语义网络技术体系中采用本体规约词汇表。为此，W3C开发了rdf方案和owl(web主体语言)。各机构可以使用rdf方案或OWL来表示各自领域的本体，并在网上公开共享。域主体中的类型和属性可以描述事物及其联系，形成RDF数据。 rdf方案和OWL都定义了一些推理规则，使用推理技术使信息提供者无需罗列所有信息。

3 .知识图概述知识图以结构化的形式描述客观世界中的概念、实体及其关系，以更接近人的认知世界的形式表达信息，提供更好地组织、管理、理解海量信息的能力，人工智能是实现真正意义理解、记忆、推理的重要基础。

知识图由节点和边缘组成，节点可以是实体或抽象的概念，而边缘可以是实体之间的关系或实体的属性。知识地图的初始理念来自语义网络，其最初理想是将基于文本链接的网络转化为基于实体链接的语义网络[5]。

1989年，透明的万宝路Berners-Lee提出建立全球化的以“链接”为中心的信息系统，每个人都可以通过添加链接将自己的文档嵌入到链接中。 1994年，他还提出网络不仅仅是网页之间的链接。网页中描述了现实世界的实体和概念，包括语义信息，不同网页上的语义信息被隔离，机器不能从网页中有效地识别这些语义。 1998年，清明万宝路Berners-Lee提出了语义网的概念。语义网仍然基于图和链接的组织方式。但是，图中的节点不仅表示网页，还表示客观世界的实体和概念，超链接也添加了语义描述，表示实体之间的关系。语义网的本质是数据的互联网。

2012年谷歌发布了知识搜索产品3354谷歌知识地图，提出了“Things，Not Strings”的理念。 “知识图谱”的正确使用，广泛用于学术界和工业界，是各类结构化知识库的总称[1]。知识地图可以看作是语义网的简化商业实现[5]。知识地图以更接近人类认知世界的形式呈现网络信息，提供了更好地组织、管理、理解网络海量信息的能力[2]。知识地图是人工智能研究和智能信息服务的基础核心技术，能够赋予智能体精确搜索、深入理解和逻辑推理等能力，广泛应用于搜索引擎、答疑系统、智能交互系统和推荐系统等任务[1]。

知识图谱是人工智能的重要研究领域——知识工程的研究领域，是利用知识工程构建大规模知识资源的杀手锏应用

[2]。20世纪50年代，基于规则的理想主义思想在自然语言处理领域盛行。1970年，人们提出专家系统，其基本思想是：专家是基于大脑中的知识来决策的，因此人工智能的核心应该是用计算机符号表示这些知识，并通过推理机模仿人脑对知识进行处理。20世纪90年代，研究者认识到简单语言规则的堆砌无法实现对人类语言的真正理解。在大数据时代，通过对从大规模数据的自动或半自动学习和统计，深度学习在视觉、听觉等感知处理中取得突破性进展，使得人工神经网络获得了人工智能研究的核心地位。
数据驱动的经验主义思想是实现数据智能的可行路径，以深度学习为代表的经验主义思想，在处理感知、识别和判断等方面表现突出，能够帮助构建聪明的人工智能，但在模拟人的思考过程、处理常识知识和推理，以及理解人的语言方面仍然举步维艰。为此，我们需要探索如何充分发挥实现经验主义思想和理性主义思想的优势，融合数据智能和知识智能。以自然语言处理为例，目标就是更好地将结构化知识图谱融入自然语言处理深度学习模型中[1]。

4. 参考文献

[1]《知识图谱与深度学习》.刘知远, 2012.
[2]《知识图谱发展报告2018》,中国中文信息学会.
[3] A survey on knowledge graphs: representation,acquisition and applications. 2020.
[4]《语义网技术体系》
[5]《知识图谱：方法、实践与应用》第2章,2019
[6] https://www.w3.org/2007/Talks/0130-sb-W3CTechSemWeb