当前位置: 首页 > news >正文

基于Kettle开发的web版数据集成开源工具(data-integration)-应用篇

目录

  • 📚第一章 基本流程梳理
    • 📗页面基本操作
    • 📗对应后台服务流程
  • 📚第二章 二开思路
    • 📗前端
    • 📗后端

🔼上一集:基于Kettle开发的web版数据集成开源工具(data-integration)-介绍篇

*️⃣主目录:ETL&ELT专栏

📚第一章 基本流程梳理

📗页面基本操作

登录开始->新建项目->保存项目->运行项目开始(问题还是挺多的,不过主要还是借鉴任务编排这一块,无伤大雅)
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

select role_name,`describe` from dp_portal_role

📗对应后台服务流程

参照页面基本操作,梳理后台对应的服务及表等
在这里插入图片描述

  • 项目主要对应两种表
    • 项目信息表 dp_portal_project :项目编号、名称、描述、类型、状态,分组编号、名称
    • 项目附件信息表 dp_portal_project_file :项目编号、项目文件内容project_file、项目版本号;其中project_file字段通过JSON串存放项目内容
  • 运行项目
    • 调用更新项目信息接口 ProjectServiceApiController.updateSelective
    • 前端通过调用websocket服务,调用运行接口 ProjectExecutorController.executeById
      • @MessageMapping@SendToUser注解是用来处理WebSocket消息并实现广播或点对点消息推送的:
        1. WebSocket客户端向服务器发送一条指向/executeById路径的消息。
        2. 服务器端通过@MessageMapping找到并执行executeById方法。
        3. 方法内部完成业务逻辑处理后,返回的结果会被自动通过WebSocket协议推送给对应用户,即在每个已认证用户的特定通道上发布结果。
          在这里插入图片描述
          在这里插入图片描述
      • projectExecutorService.asyncExecuteByFile
        • executeByFile.execute.start()
          • 构建TransMeta 对象,buildTransMeta(jsonxml)
          • 设置本地引擎执行
          • 创建执行器
          • 启动
        • 调用Kettle本地引擎
          在这里插入图片描述

📚第二章 二开思路

通过上面的流程梳理,发现任务编排工作流主要在前端,各种字段属性和kettle对应都是前端传给后台的,后台直接保存的JSON串,我这里只需要任务编排这块功能,springcloud也用不到,后面如果借鉴该项目,大概要做哪些事?

📗前端

应该可以直接复用,我们用的也是vue2+element架构

📗后端

该项目涉及的技术组件比较多,用到了springcloud,相对来说有点麻烦,到了具体开发阶段,涉及的就比较多了,下一步可以先简单点,就导出一个作业文件,提取相关代码,能够成功执行作业之后,在开始大刀阔斧的开展工作,一步一步推进:

  • kettle本地引擎执行代码
  • 作业文件组装、转换代码
http://www.lryc.cn/news/273690.html

相关文章:

  • 51单片机三种编译模式的相互关系
  • java 千帆大模型 流式返回
  • 全新互联网洗衣洗鞋小程序平台新模式
  • js 对于一些脚本中对于url的一些参数获取
  • IEDA中tomcat日志乱码解决
  • 计算机网络实验(六):三层交换机实现VLAN间路由
  • Flutter中showModalBottomSheet的属性介绍和使用
  • 机器学习 -- k近邻算法
  • 安全测试之SSRF请求伪造
  • php composer安装
  • 【MyBatis】MyBatis基础操作
  • Automatic merge failed; fix conflicts and then commit the result.如何处理
  • 一文读懂 $mash 通证 “Fair Launch” 规则(幸运池玩法解读篇)
  • Qt3D QGeometryRenderer几何体渲染类使用说明
  • pandasDataFrame读和写csv文件
  • 力扣122. 买卖股票的最佳时机 II
  • Go语言断言和类型查询
  • 02 Deep learning algorithm
  • 代码随想录算法训练营第二十四天 | 回溯算法
  • Spring Cloud Gateway 缓存区异常
  • Spring Boot依赖版本声明
  • Java项目:109SpringBoot超市仓管系统
  • 【React系列】Redux(三) state如何管理
  • 3D 纹理的综合指南
  • LLM之RAG实战(十一)| 使用Mistral-7B和Langchain搭建基于PDF文件的聊天机器人
  • VLOOKUP的使用方法
  • 数据加密、端口管控、行为审计、终端安全、整体方案解决提供商
  • 编码器原理详解
  • linux下docker搭建mysql8
  • 书生·浦语大模型实战1