Fork me on GitHub

电力行业知识资源建设及场景化应用

以下文章来源于 https://zhuanlan.zhihu.com/p/636272955

导读 电力大数据时代的来临,使得基于人工智能、云计算、物联网的技术在电力行业之中得到了广泛的应用。而对于各个行业的创新与发展而言,知识图谱技术成为全新动力,针对电力领域知识图谱方面的研究却很少。本文聚焦在电力行业,以整合行业内知识资源为目标构建知识图谱,提供了场景化专业知识搜索、精准知识推送、决策支持等形态的知识应用,服务于该行业内的从业人员、企业机构及行业决策者。本文将分享知识图谱在电力行业应用上的一些探索和实践。

今天的分享围绕下面四部分展开:

  1. 电力知识体系构建

  2. 电力知识图谱构建

  3. 应用场景

  4. 落地应用及感受


分享嘉宾|张涛 英大传媒投资集团有限公司编审

编辑整理|侯红梅

出品社区|DataFun


01/电力知识体系构建

在做知识图谱的构建过程中,我们首先要做的就是知识建模。

1. 电力知识数据

电力行业数据与电力知识数据不同。电力行业数据包括电力运行数据、营销数据和管理数据,是由电力生产产生的数据;电力知识数据以服务电力行业生产为目标,在电力生产中形成的科学、系统、公开、可确权的数据。为什么要说可确权呢?因为从出版的角度,我们做的是知识的生产和传播,因此我们要将所传播的知识进行分享,就必须要确定知识的版权归属,后期才能更好地进行知识运营

2.多维知识体系构建

在知识图谱的构建过程中,我们首先要确定知识图谱的用途。因此,我们确定了三大目标:

  • 第一,利用不同的电力行业的知识资源。把人物与机构相关联,实现对机构和人物的成果画像和评价。
  • 第二,结合业务场景来推送专业的知识内容。我们采用的是直接推送内容的方式,这样可以提高知识的搜索效率。这里的直接推送指的是一个片段的知识内容,即碎片化了的知识,这样就避免了知识的二次搜索。
  • 第三,充分利用我们在电力行业70年的深耕所形成的专业知识内容,建立基础的知识体系和知识库,之后可以形成知识服务的产品,实现知识共享和定制化服务。

在知识图谱构建过程中,主要涉及到三方面的人员:

  • 一线业务专家,前期确定场景和需求,后期对成果进行确认,当然,在中间过程中也需要提供咨询服务。
  • 专业人员,起到桥梁作用和整体把控,主要将需求转化为知识图谱构建人员能够理解的思路、方法,最终确定方案以实现我们的目标。
  • 计算机技术人员,负责知识的建模、融合和存储,使其最终使用电力行业的知识资源将人物与机构相关联,实现人物和机构的成果画像。

电力知识建模采用的是自顶向下的方法,首先为知识图谱定义数据模式,数据模式从最顶层概念构建,逐步向下细化。在构建过程中采用的是人工+计算机+专家审核的方式。

  • 人工建立基本的体系框架,同时结合各种场景化的应用,使该体系更加完善。
  • 专家审核并确认人工建立的体系框架。
  • 计算机自动提取,利用计算机进行自动提取使其对确定的体系框架进行深层次的挖掘。

没有完全用计算机的自动提取是因为计算机的自动提取受限于它所学的资源和内容,这样形成的体系有一定的局限性。

3. 多维电力知识体系构建:五个维度

在知识建模初期,采用人工结合场景化的应用和各个企业情况,最终基于两大原则构建了5大体系。

基于学科原则:

  • 电力专业:依托《中国电力百科全书》,形成了9卷、92个分支、6200个条目的完整电力学科类体系。

基于场景原则(4个体系,1100个知识模块):

  • 电力生产:电力生产发输变配用的维度,涉及到的各领域知识。
  • 岗位培训:结合岗位培训的维度,涉及各岗位应知应会的相关内容。
  • 基建:从电力建设的维度,从勘测、设计、施工到最后的验收。
  • 设备:交直流设备以及用电防侧的一些设备。

针对基于场景的知识体系,我们通过人工+计算机的方式最终形成了规模为20多万个实体,30万个相互间的关系的知识模块。

02 /电力知识图谱构建

1.知识来源

在具体的知识图谱的构建过程中,我们首先确定了构建的原则------保证专业性、权威性以及可确权。

数据来源,我们使用的是公开的数据:

  • 文献、成果、专利、图书和标准,用来作为人物、机构画像。
  • 知识内容碎片化,从图书和标准中选取内容,主要做专业知识的精准推送。
  • 多源异构知识资源,包括音视频、图书中照片、新闻中的图片等,用来丰富专业知识库。

2. 知识结构化

  • 原则:基于电子化图书,即XML电子文件格式,大大提升了知识获取和知识融合的效率和准确率。

为了知识获取能够碎片化和保证知识的准确性,我们的质量保证措施如下:

  • 制定加工规范:依据新闻出版总署对于电子书基本的标准,制定了加工规范。对科技图书最多的图表公式、符号等,均细化要求,并且我们对表中的数据也进行了解析和拆解,进行不同深度的加工,保证获取最细碎片化的内容。
  • 质量检查:采用人工+计算机的方式进行质量检查,保证加工质量的规范性、完整性、准确性和有效性。

3. 电力知识数据解析和关联

在知识融合的过程中,我们要做数据的解析和关联。我们对内容进行了解析和拆解,同时,对于不同的图书,我们也确定了不同的加工深度,保证获取到合理的最细碎片化的内容。

数据解析:根据前面制定的加工规则,知识图谱技术人员对数据进行正确地解析。

关于知识层次的关联,我们做了两方面:

  • 体系间的关联,通过实体来进行关联。
  • 体系自身的知识关联,将上下级和同级的知识点提取出来,形成同级推荐和上下级推荐。

  • 知识属性关联:针对电力设备确定了11类属性,包括定义、组成、分类、特点等,这样在内容解析的时候,对不同的相关内容打上属性、标签,从而形成对某类设备的全方位的属性关联。

03 /应用场景

1.个人成果汇总

第一个应用是个人成果汇总,应用场景如下:

  • 个人职称申报材料收集:个人职称申报过程中需汇总很多资料,通过我们这个系统,可以方便地将所涉及的成果进行一键导出。
  • 筛选推荐领域专家:可以筛选和推荐相关领域的专家。
  • 查找相近领域专家:输入两个专家的名字或通过进一步的探索,能够找到和这个专家相关联的其他专家。

2. 专业知识学习

第二个应用是可以进行专业知识学习,通过应用场景确定相应知识体系,从而定位最精准的知识内容、也通过知识推荐结果的返回提升了用户的交互体验。

  • 用户输入检索的关键词,通过确定具体应用场景,用户可以选择不同知识体系(如电力生产、岗位培训、基建等)的相关内容,可以快速地定位到最精准的知识内容。

  • 知识推荐:可获取与其关联的同级、上下级的知识内容,很方便地实现了知识相互、上下和溯源的探索。这样我们可以拓展知识的广度和深度。

在知识学习过程中,我们可以充分利用知识图谱的直观性、趣味性的特点,形成知识图谱和知识点之间的互动。

  • 在可视化知识图谱中,我们以树状层次结构及网状关联关系展示,因此你可以看到你搜索的某一点在整个知识体系中的位置和关系,帮助理清知识脉络,同时也可以进入到相应的内容页。
  • 在知识内容详情页中,我们也可以直接链接到知识图谱。

3. 岗位培训

第三个应用是岗位培训:

  • 在搜索框输入所在岗位和级别就可以快速地查阅你需要掌握的知识内容。该应用有两方面的助力:首先是为员工自学提供便利,助力员工技能等级提升;同时,有利于跨岗位、跨专业学习。

4. 通用专业知识服务

第四个应用是通用专业知识服务:

  • 作为基础知识图谱库,我们提供底层的知识体系和知识内容。
  • 在该服务的基础上,可以快速搭建并形成自己的知识库和知识体系,也可以以不同形式打印和下载关注的知识内容,也可作为知识传播的产品,来为各个企业提供服务。

5. 电力生产决策支持

第五个应用是做电力生产的辅助决策支持:

  • 在电力生产答疑或缺陷故障处理过程中,能快速地提供准确的电力知识数据。
  • 利用电力的标准,为他们的标准编写和宣贯提供支持。
  • 将年鉴、年报、内部已有文件等各类电力数据提取出来,快速形成数据知识产品,以提供更专业的知识服务,这样也可以挖掘内部自有数据,快速形成统计及情报分析文档,提升企业数据资产的价值。

04 /落地应用及感受

1.落地应用-中国电力百科网

落地应用一是外网部署的中国电力百科网,主要有以下三个模块:

  • 知识图谱模块,实现了专家、机构的成果画像。
  • 知识地图模块,主要实现了专业知识学习、岗位培训和专业知识库输出等功能,该模块将于今年推出。
  • 电力标准术语查询。

2.落地应用-国网甘肃电力、国网山东电力

落地应用二是内网部署的国网甘肃电力和国网山东电力,主要服务于他们内部系统基础知识的查询和搜索工作。

3.感受

做某垂直领域的知识图谱的工作时,有三个关键点:

  • 高质量的专业数据资源,这样可以保证知识获取和搜索的准确性。
  • 结合实际应用场景来构建相关知识图谱,并持续优化和完善知识图谱,这样我们后期图谱技术才能不断进步,对行业生产有更好的助力作用。技术一定要和业务数据捆绑,这样才能产生更多的价值。
  • 专注的行业团队,对后期成果的运行和持续使用非常关注,这样才能使产品更符合实际需求。

这里有一点建议,在做某垂直领域的知识图谱或构建自己的信息库时,建议与专业的出版机构合作,因为他们有专业、权威、可靠的海量数据资源,同时他们了解相关领域,也更关注后期产品的运营。



本文地址:https://www.6aiq.com/article/1686471031531
本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出