当前位置: 首页 > news >正文

【知识图谱系列】(实例)python操作neo4j构建企业间的业务往来的知识图谱

本章节通过聚焦于"金额"这一核心属性,构建了一幅知识图谱,旨在揭示"销售方"与"购买方"间的商业互动网。在这张图谱中,绿色节点象征着购买方,而红色节点则代表了销售方。这两类节点间的紧密连线,不仅映射了双方在市场活动中的合作桥梁,还特别以不同颜色编码的线条区分了交易的规模等级:细分为1000万级别、2000万级别、5000万级别乃至8000万级别的交易纽带,以此精准描绘出商业交易的多样性和规模层次。

目录

一、结果

二、数据

三、DataToNeo4jClass1.py

四、invoice_neo4j1.py 

一、结果

二、数据

三、DataToNeo4jClass1.py

# -*- coding: utf-8 -*-
from py2neo import Node, Graph, Relationship,NodeMatcherclass DataToNeo4j(object):"""将excel中数据存入neo4j"""def __init__(self):"""建立连接"""link = Graph("http://localhost:7474", auth=("neo4j", "123456789Xx"))self.graph = link#self.graph = NodeMatcher(link)# 定义label,定义标签self.buy = 'buy'#购买方self.sell = 'sell'#销售方self.graph.delete_all()#删除已有的节点和关系、清空self.matcher = NodeMatcher(link)#定义一个matcher,一会定义关系的时候要用#NodeMatcher是从py2neo中导入的    后续帮助做匹配#下边注释掉的是一些官方的小例子,做测试的时候可以试一试##Node是从py2neo中导入的"""#创建节点node3 = Node('animal' , name = 'cat')node4 = Node('animal' , name = 'dog')  node2 = Node('Person' , name = 'Alice')node1 = Node('Person' , name = 'Bob')  #创建关系、边r1 = Relationship(node2 , 'know' , node1)    r2 = Relationship(node1 , 'know' , node3) r3 = Relationship(node2 , 'has' , node3) r4 = Relationship(node4 , 'has' , node2) #create就是实际的添加到图当中   self.graph.create(node1)self.graph.create(node2)self.graph.create(node3)self.graph.create(node4)self.graph.create(r1)self.graph.create(r2)self.graph.create(r3)self.graph.create(r4)"""def create_node(self, node_buy_key,node_sell_key):"""建立节点"""for name in node_buy_key:buy_node = Node(self.buy, name=name)#第一个参数是标签,第二个参数是名字self.graph.create(buy_node)for name in node_sell_key:sell_node = Node(self.sell, name=name)self.graph.create(sell_node)def create_relation(self, df_data):"""建立联系"""      m = 0for m in range(0, len(df_data)):#遍历数据中的每一条数据try:    print(list(self.matcher.match(self.buy).where("_.name=" + "'" + df_data['buy'][m] + "'")))print(list(self.matcher.match(self.sell).where("_.name=" + "'" + df_data['sell'][m] + "'")))rel = Relationship(self.matcher.match(self.buy).where("_.name=" + "'" + df_data['buy'][m] + "'").first(),df_data['money'][m], self.matcher.match(self.sell).where("_.name=" + "'" + df_data['sell'][m] + "'").first())self.graph.create(rel)except AttributeError as e:print(e, m)

四、invoice_neo4j1.py 

# -*- coding: utf-8 -*-
from dataToNeo4jClass.DataToNeo4jClass1 import DataToNeo4j
import os
import pandas as pd
#pip install py2neo==5.0b1 注意版本,要不对应不了invoice_data = pd.read_excel('./Invoice_data_Demo.xls', header=0, engine='xlrd')
#print(invoice_data)#可以先阅读下文档:https://py2neo.org/v4/index.htmldef data_extraction():"""节点数据抽取"""# 取出购买方名称到listnode_buy_key = []for i in range(0, len(invoice_data)):#遍历数据node_buy_key.append(invoice_data['购买方名称'][i])#里边有重复值node_sell_key = []for i in range(0, len(invoice_data)):node_sell_key.append(invoice_data['销售方名称'][i])#里边有重复值# 用set去除重复的发票名称node_buy_key = list(set(node_buy_key))node_sell_key = list(set(node_sell_key))# value抽出作nodenode_list_value = []for i in range(0, len(invoice_data)):for n in range(1, len(invoice_data.columns)):# 取出表头名称invoice_data.columns[i]node_list_value.append(invoice_data[invoice_data.columns[n]][i])# 去重node_list_value = list(set(node_list_value))# 将list中浮点及整数类型全部转成string类型node_list_value = [str(i) for i in node_list_value]return node_buy_key, node_sell_key,node_list_valuedef relation_extraction():"""联系数据抽取"""links_dict = {}sell_list = []money_list = []buy_list = []for i in range(0, len(invoice_data)):#遍历数据money_list.append(invoice_data[invoice_data.columns[19]][i])#金额列sell_list.append(invoice_data[invoice_data.columns[10]][i])#销售方方名称列buy_list.append(invoice_data[invoice_data.columns[6]][i])#购买方名称列# 将数据中int类型全部转成stringsell_list = [str(i) for i in sell_list]buy_list = [str(i) for i in buy_list]money_list = [str(i) for i in money_list]# 整合数据,将三个list整合成一个dictlinks_dict['buy'] = buy_listlinks_dict['money'] = money_listlinks_dict['sell'] = sell_list# 将数据转成DataFramedf_data = pd.DataFrame(links_dict)#print(df_data)return df_datarelation_extraction()
create_data = DataToNeo4j()create_data.create_node(data_extraction()[0], data_extraction()[1])
create_data.create_relation(relation_extraction())

http://www.lryc.cn/news/388770.html

相关文章:

  • 解决MySQL删除/var/lib/mysql下的所有文件后无法启动的问题
  • 探索WebKit的Flexbox奇境:CSS Flexbox支持全解析
  • Unity--协程--Coroutine
  • 详解COB显示屏的技术特点
  • 富唯智能推出的AMR复合机器人铝板CNC上下料方案
  • springcloud-config服务器,同样的配置在linux环境下不生效
  • 写代码,为什么还需要作图?
  • 一句话介绍什么是AI智能体?
  • 32.哀家要长脑子了!
  • Vue2 - 项目上线后生产环境中去除console.log的输出以及断点的解决方案
  • phpword生成PDF
  • Linux进程优先级
  • 每日一题——Python实现PAT乙级1096 大美数(举一反三+思想解读+逐步优化)3千字好文
  • 无锁编程——从CPU缓存一致性讲到内存模型(1)
  • C++编程(七)继承
  • 【ACM_2023】3D Gaussian Splatting for Real-Time Radiance Field Rendering
  • 【TB作品】atmega16 计算器,ATMEGA16单片机,Proteus仿真
  • C++的IO流操作
  • MacOS升级指定Python版本的pip
  • 音频Balance源码总结
  • CesiumJS【Basic】- #043 绘制脉冲线(Entity方式)- 需要自定义着色器
  • Linux命令 wc(word count)-l(lines)用于统计文件中的行数。
  • 数据结构 - C/C++ - 链表
  • sheng的学习笔记-AI-高斯混合模型(GMM)
  • OFDM的缺点与关键技术
  • 电脑录音软件哪个好?7款录制音频工具大盘点,赶快学起来!(2024)
  • 【Android面试八股文】你说你使用Leakcanary进行内存泄漏检测,那你能说一说Leakcanary的原理吗?
  • 蒂升电梯职业性格和Verify认知能力SHL测评答题攻略及薪资待遇解密!
  • window上部署sql server改动端口、和sqlserver的一些还原、批量插入存储过程的命令
  • 【单片机与嵌入式】stm32串口通信入门