当前位置: 首页 > news >正文

知识图谱构建技术综述

摘要

*知识图谱为实现语义化智能搜索以及知识互联打下了基础,。,
*随着知识的发展,传统的基于模板和规则构建的知识图谱已经被深度学习所替代。

  • 知识组织得原则中:知识的充分性、有序性和标准化规则。
  • 深度学习的效果在很大程度上依赖大规模的样本、缺乏先验知识。导致某些结果可能背离人类知识和先验知识
  • 深度学习不具备因果推理性,缺乏可解释性。
  • 端到端学习,人们无法清楚的解释每一个参数的意义。
  • 知识图谱用于深度学习时候的可解释性、因果推断性、指导性

知识图谱的定义和架构

  • 知识图谱旨在从多种类型的复杂数据中抽取概念、实体和关系。是事物关系的可计算模型。
    在这里插入图片描述
    在这里插入图片描述

知识图谱的体系架构

  • 第一部分:源数据的获取:即在各个类型的数据中获取最有用的资源信息。
  • 第二部分:知识融合:用于关联多数据源的知识,扩大知识范围。
  • 第三部分:知识的计算和知识的应用。
  • 在这里插入图片描述

知识图谱的构建技术

  • 知识图谱从多种数据源中提取知识并存入知识图谱,是构建大规模知识图谱的基础。
  • 知识融合可以解决不同知识图谱异构问题。
  • 知识计算是知识图谱的主要输出能力。

知识抽取

  • 命名实体识别
  • 关系抽取
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述

关系抽取

  • 基于传统规则和模板的方法
  • 基于传统机器学习的方法
    • 有监督
    • 半监督
    • 无监督三类。
  • 基于深度学习的方法
    • 流水线方法:CNN、RNN及其改进模型
    • 实体关系联合抽取
      • 基于参数共享的实体关系联合抽取
      • 基于序列标注的实体关系联合抽取。
      • 在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述

    知识融合

    • 本体融合
      • 本体集成和本体映射两大类。
        在这里插入图片描述

本体映射

  • 基于NLP的方法

  • 基于结构的方法

  • 基于实例的方法

  • 综合方法

    • 数据融合
      • 实体合并
      • 实体对齐
      • 实体属性融合等方面
  • 知识图谱的对齐算法可以分为3类:

    • 成对实体对齐
    • 局部实体对齐
    • 全局实体对齐。

知识推理

  • 知识推理根据已经有得实体关系信息来推断新得事实结论,从而进一步丰富知识图谱,满足上游任务得需求。
  • 基于逻辑规则的推理
    • 谓词逻辑推理
    • 本体推理
    • 随机推理
  • 本体寻路算法: 该算法通过一系列并行优化技术实现大规模的知识图谱
  • 双层随机游走算法:利用无向图来表示知识图谱
    • 全局模式和局部模式2中角度下对路径特征进行评估。提高了算法的准确率和召回率。
  • 基于分布式特征表示的推理
    • 基于翻译模型的知识推
    • 基于张量分解的知识推理
    • 基于语义匹配模型的知识推理
      • 提出 DistMult模型
  • 基于深度学习的推理。
    在这里插入图片描述

深度学习指导

在这里插入图片描述

深度学习推理

  • 图网络相对于普通的神经网络具有归纳推广和组合概括能力

存在困难和挑战

  • 对于知识抽取技术,现有的实体关系联合抽
    取技术并未解决关系重叠问题
    ,算法准确率和召回率都较低。
  • 基于开放域的关系抽取还处于初级阶段多语种、大范围的多元实体关系抽取是当前面临的主要困难之一
  • 无监督关系抽取具有较高的可移植性,和泛化性,为开发域关系抽取任务提供了新的思路。
  • 对于知识融合技术,实体对齐是最主要的手段,如何实现高质量的实体对齐、共指消解是一项巨大的挑战,开放领域下的实体对齐、共指消解以多源数据库融合是当前主要的研究重点
  • ,如何在短文本情况下准确地将实体链接到知识库中亟需解决
  • 小样本学习应用到实体对齐是重要的研究方向
  • 对于知识推理技术,现有的知识推理技术大多只关注静态数据,忽略了时间信息,知识图谱的信息应该随着时间的推移而变化,因此,动态知识图谱推理还需要进行研究探索
  • ,将知识图谱应用于深度学习还处于起步阶段

结束语

经验

到此为止,慢慢的沿着综述将各种模型都给建立一波,并将其全部都搞通搞精通,完全理解透彻。

  • 经验,找到解决关系重叠有没有好的方法,根据啥进行重叠以下都行的样子与打算。
    • 给代码敲打熟悉,然后给综述性文章看个四五篇,然后开始自己找两三个自己现成的方法,自己搞研究,将其全部都搞定都行啦的样子域打算。

自己研究

可以先将动态知识图谱作为自己的研究方向。

http://www.lryc.cn/news/10025.html

相关文章:

  • 环境变量和进程地址空间
  • 【数据结构】栈和队列
  • sql复习(视图、Top-N分析、其他数据库对象)
  • 2023年私募股权基金研究报告
  • Redis单点故障+红锁原理
  • 数据库中的存储过程
  • 基于 VPX 总线的工件台运动控制系统研究与开发-DSP+FPGA硬件架构(一)
  • Android 9.0 根据包名授予app所需的权限
  • 如何将Python包发布到PyPI上,使用pip安装自己的库
  • 【Git】git常用命令总结
  • Cortex-M0中断控制和系统控制
  • 科技云报道:2023,云计算的风向变了
  • 工程管理系统源码-专注项目数字化管理-工程管理
  • Nacos详细使用操作文档(图文详细)
  • 如何评价2023年美赛ABC题目
  • Win10显示dds及tga缩略图
  • Lesson5.1---Python 之 NumPy 简介和创建数组
  • Exchange 2013升级以及域名绑定等若干问题
  • linux安装jenkins
  • 【MySQL】MySQL表的增删改查(CRUD)
  • GCC for openEuler 数据库性能优化实践
  • 【C++】类和对象(第二篇)
  • MySQL数据库(数据库约束)
  • Hive的安装与配置
  • 关于医院医用医疗隔离电源系统应用案例的分析探讨
  • 【LeetCode】剑指 Offer 07. 重建二叉树 p62 -- Java Version
  • ERROR 1114 (HY000): The table ‘tt2‘ is full
  • 考了PMP证后工资大概是多少 ?(含pmp资料)
  • 基于国产龙芯 CPU 的气井工业网关研究与设计(一)
  • 40/365 javascript 数据类型