,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/4/11,0,知识图谱,知识图谱,1,知识,图谱(,Knowledge Graph,)是一种揭示实体之间关系的语义网络。,2012,年,5,月,17,日,,Google,正式提出了知识图谱的概念,其初衷是优化搜索引擎返回的结果,增强用户搜索质量及体验。,知识图谱(Knowledge G,2,知识,图谱以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。,知识图谱以结构化的形式描述客观世界,3,知识,图谱,本质,上是一种语义网络,其中的节点代表实体(,Entity,)或者概念(,Concept,),边代表实体,/,概念之间的各种语义关系。,知识图谱本质上是一种语义网络,,4,知识图谱的发展历史,1,第一阶段(,1955,年,1977,年),第一,阶段是知识图谱的起源阶段,在这一阶段中研究者们提出了引文网络和语义网络的概念,知识图谱的发展历史1第一阶段(1955年1977年),5,2,第二阶段(,1977,年,2012,年),第二,阶段是知识图谱的发展阶段,语义网络得到快速发展,“知识本体”的研究开始成为计算机科学的一个重要领域,知识图谱吸收了语义网、本体在知识组织和表达方面的理念,使得知识更易于在计算机之间和计算机与人之间交换、流通和加工。,2第二阶段(1977年2012年),6,3,第三阶段(,2012,年至今),第三,阶段是知识图谱的繁荣阶段,,2012,年谷歌提出,Google Knowledge Graph,,知识图谱正式得名,谷歌通过知识图谱技术改善了搜索引擎性能。在人工智能的蓬勃发展下,知识图谱涉及的知识抽取、表示、融合、推理、问答等关键问题得到一定程度的解决和突破,知识图谱成为知识服务领域的一个新热点,3第三阶段(2012年至今),7,知识图谱的类型,(,1,)事实知识,事实,知识是知识图谱中最常见的知识类型。大部分事实都是在描述实体的特定属性或者关系,例如:三元组(柏拉图,出生地,雅典)中的“出生地”就是其中一个属性。,知识图谱的类型(1)事实知识,8,(,2,)概念知识,概念,知识分为两类,一类是实体与概念之间的类属关系,另一类是子概念与父概念之间的子类关系。,(2)概念知识,9,(,3,)词汇知识,词汇,知识主要包括实体与词汇之间的关系(实体的命名、称谓、英文名等)以及词汇之间的关系(同义关系、反义关系、缩略词关系、上下位词关系等)。例如,(“,Plato,”,中文名,柏拉图)、(赵匡胤,庙号,宋太祖)、(妻子,同义,老婆)。,(3)词汇知识,10,(,4,)常识知识,常识,是人类通过身体与世界交互而积累的经验与知识,是人们在交流时无须言明就能理解的知识。例如,我们都知道鸟有翅膀、鸟能飞等;又如,如果,X,是一个人,则,X,要么是男人要么是女人。常识知识的获取是构建知识图谱时的一大难点。,(4)常识知识,11,知识图谱的重要性,知识,图谱已成为推动机器基于人类知识获取认知能力的重要途径,并将逐渐成为未来智能社会的重要生产资料。,知识图谱的重要性 知识图谱已成,12,1,知识图谱是人工智能的重要基石,2,知识图谱推动智能应用,3,知识图谱是强人工智能发展的核心驱动力之一,1知识图谱是人工智能的重要基石,13,知识表示和知识建模,知识表示,与知识建模是知识图谱中的重要内容,在构建知识图谱的时候,首先要建立知识表达的数据模型,也就是知识图谱的整个数据组织体系。,知识表示和知识建模 知识表示与知,14,知识表示,学习主要是面向知识图谱中的实体和关系进行表示学习,使用建模方法将实体和向量表示在低维稠密向量空间中,然后进行计算和推理。,知识表示学习主要是面向知识图谱中,15,知识,是人类在认识和改造客观世界的过程中总结出的客观事实、概念、定理和公理的集合。知识具有不同的分类方式,例如,按照知识的作用范围可分为常识性知识与领域性知识。知识表示是将现实世界中存在的知识转换成计算机可识别和处理的内容,是一种描述知识的数据结构,用于对知识的描述或约定。,知识是人类在认识和改造客观世,16,知识表示方法,知识表示方法主要分为基于符号的知识表示方法与基于表示学习的知识表示方法。,(,1,)基于符号的知识表示,方法,基于符号的知识表示方法分为一阶谓词逻辑表示法、产生式规则表示法、框架表示法与语义网络表示法。,知识表示方法知识表示方法主要分为基于符号的知识表示方法与基,17,(,2,)基于表示学习的知识表示方法,早期,知识表示方法与语义网知识表示法通过符号显式地表示概念及其关系。事实上,许多知识具有不易符号化、隐含性等特点,因此仅通过显式表示的知识无法获得全面的知识特征。此外,语义计算是知识表示的重要目标,基于符号的知识表示方法无法有效计算实体间的语义关系。,(2)基于表示学习的知识表示方法,18,技术发展趋势,(,1,)符号与表示学习的融合统一,(,2,)面向事理逻辑的知识表示,(,3,)融合时空间维度的知识表示,(,4,)融合跨媒体元素的知识表示,技术发展趋势(1)符号与表示学习的融合统一,19,知识建模,知识,建模是通过各种知识获取方法获得突发事件领域的主要概念和概念之间的关系,用精确的语言加以描述的过程。,知识建模 知识建模是通过各种知,20,知识,建模是指建立知识图谱的数据模型,即采用什么样的方式来表达知识,构建一个本体模型对知识进行描述。,知识建模是指建立知识图谱的数据模型,21,知识,建模一般有自顶向下和自底向上两种构建方法。自顶向下的方法是指在构建知识图谱时首先定义数据模式即本体,一般通过领域专家人工编制。从最顶层的概念开始定义,然后逐步细化,形成结构良好的分类层次结构,。,知识建模一般有自顶向下和自底向上,22,知识建模方法,知识,建模目前的实际操作过程,可分为手工建模方式和半自动建模方式。手工建模方式适用于容量小、质量要求高的知识图谱,但是无法满足大规模的知识构建,是一个耗时、昂贵、需要专业知识的任务;半自动建模方式将自然语言处理与手工方式结合,适于规模大且语义复杂的知识图谱。,知识建模方法 知识建模目前的,23,(,1,)手工建模方式,手工,建模方式过程主要可以分为,6,个步骤:明确领域本体及任务、模型复用、列出本体涉及领域中的元素、明确分类体系、定义属性及关系和定义约束条件,。,(1)手工建模方式,24,(,2,)半自动建模方式,半自动,建模方式先通过自动方式获取知识图谱,然后再进行大量的人工干预。运用自然语言处理技术半自动建模的方法可以分为,3,大类:基于结构化数据的知识建模方法、基于半结构化数据的知识建模方法和基于非结构化数据的知识建模方法。,(2)半自动建模方式,25,(,3,)知识建模评价,对,知识建模质量评价也是知识建模的重要组成部分,通常与实体对齐任务一起进行。质量评价的作用在于可以对知识模型的可信度进行量化,通过舍弃置信度较低的知识来保障知识库的质量。,(3)知识建模评价,26,知识抽取,知识,抽取指从不同来源、不同结构的数据中进行知识提取,形成知识的过程。为了提供令用户满意的知识服务,知识图谱不仅要包含其涉及领域已知的知识,还要能及时发现并添加新的知识。,知识抽取 知识抽取指从不同来源、不同,27,第七章-知识图谱课件,28,实体抽取,实体,抽取也被称为命名实体识别(,Named Entity Recognition,,,NER,),指从原始数据中自动识别出命名实体。,实体抽取 实体抽取也被称为命名,29,实体,抽取的方法主要有基于规则与词典的方法、基于机器学习的方法以及面向开放域的抽取方法。,实体抽取的方法主要有基于规,30,关系抽取,关系,抽取的目标是抽取语料中命名实体的语义关系。实体抽取技术会在原始的语料上标记一些命名实体。为了形成知识结构,还需要从中抽取命名实体间的关联信息,从而利用这些信息将离散的命名实体连接起来,这就是关系抽取技术。,关系抽取 关系抽取的目标是抽取语料中命名实,31,属性抽取,实体,的属性可以使实体对象更加丰满。属性抽取的目的是从多种来源的数据中抽取目标实体的属性内容。实体的属性可以看作是连接实体与属性值的关系,因此,在实际应用中,一些学者将属性抽取问题转化为关系抽取问题。,属性抽取 实体的属性可以使,32,知识存储,知识,存储是针对知识图谱的知识表示形式设计底层存储方式,完成各类知识的存储,以支持对大规模数据的有效管理和计算。,知识存储 知识存储是针对知识图谱的知,33,知识,存储的对象包括基本属性知识、关联知识、事件知识、时序知识和资源类知识等。知识存储方式的质量直接影响知识图谱中知识查询、知识计算及知识更新的效率。,知识存储的对象包括基,34,从,存储结构划分,知识存储分为基于表结构的存储和基于图结构的,存储,。,从存储结构划分,知识存储分为基于表结构的存,35,知识存储工具,知识,图谱的存储并不依赖特定的底层结构,一般的做法是按数据和应用的需求采用不同的底层存储,甚至可以基于现有的关系数据库进行构建,。,1,关系型数据库,2,图数据库,知识存储工具 知识图谱的存储并,36,知识融合,知识,融合即合并两个知识图谱(本体),基本的问题是研究将来自多个来源的关于同一个实体或概念的描述信息融合起来的方法。,知识融合 知识融合即合并两个知识,37,知识,融合的概念最早出现在霍尔萨普尔(,Holsapple,)和温士顿(,Whinston,)在,1983,年发表的文章,A Software Tools For Knowledge Fusion,中,并在,20,世纪,90,年代得到研究者的广泛关注。,知识融合的概念最早出现在霍尔萨,38,知识,融合是面向知识服务和决策问题,以多源异构数据为基础,在本体库和规则库的支持下,通过知识抽取和转换获得隐藏在数据资源中的知识因子及其关联关系,进而在语义层次上组合、推理、创造出新知识的过程,并且这个过程需要根据数据源的变化和用户反馈进行实时动态调整。,知识融合是面向知识服务和决策,39,知识推理,知识,图谱的表示(,Representation,)指的是用什么数据结构来表示一个知识图谱。顾名思义,知识图谱是以图的方式来展示知识,但是这并不代表知识图谱必须采用图的表示。从图的角度看,知识图谱是一个语义网络,即一种用互联的节点和边来表示知识的结构。,知识推理 知识图谱的表示(Rep,40,语义网络,中的语义主要体现在图中边的含义上,为了赋予这些边语义,研究人员先是提出了术语语言(,Terminological Language,),并最终提出了描述逻辑(,Description Logic,),描述逻辑是一阶谓词逻辑的一个子集,推理复杂度是可判定的(,Decidable,)。,W3C,采用了以描述逻辑为逻辑基础的本体语言,OWL,(,Ontology Web Language,)作为定义,Web,术语的标准语言,还推出了另外一种用于表示,Web,本体的语言,RDF Schema,(简称,RDFS,)。,语义网络中的语义主要体现在图中,41,并行知识推理,现有,的并行推理方法主要集中在前向链推理,即应用推理规则到知识图谱生成新的三元组,所以对于动态知识图谱的推理处理效果不佳。另外,前向链推理会导致知识图谱存储大量冗余知识,也不利于高效的知识检索和查询。,并行知识推理 现有的,42,知识图谱的应用,知识,图谱的应用场景很多,在不同行业、不同领域都有广泛应用,知识图谱在商业领域的应用主要体现在语义搜索和问答系统这两方面。,知识图谱的应用 知识图谱,43,语义搜索,语义,搜索的研究涉及多个领域,包括搜索引擎、语义网、数据挖掘和知识推理等。运用的主要方法有图论、匹配算法和逻辑(特别是描述逻辑、模糊逻辑等方法)。,语义搜索 语义搜索的研究涉及多个,44,问答系统,问答,系统也是知识图谱应用较为广泛的领域,问答系统需要理解查询的语义信息,将输入的自然