当前位置: 首页 > news >正文

一百二十、Kettle——用kettle把Hive数据同步到ClickHouse

一、目标

用kettle把hive数据同步到clickhouse,简单运行、直接全量导入数据

工具版本:kettle:8.2     Hive:3.1.2     ClickHouse21.9.5.16

二、前提

(一)kettle连上hive

 

(二)kettle连上clickhouse

 

三、实施步骤

(一)打开kettle,新建转换任务。拖拽表输入、字段选择、表输出控件

1.表输入控件:在输入控件模块

2.字段选择控件:在转换控件模块

3.表输出控件:在输出控件模块

 (二)配置表输入控件,尤其注意SQL里的字段类型转换

可以修改步骤名称为hive输入,选择hive数据库连接,然后写查询SQL语句

注意:hive里的string类型字段,需要转换为类似varchar(50)的具体大小的varchar字段

经测试:

--int字段、float、timestamp字段都可以直接用
--string字段   cast(device_no as varchar(50))

 (三)配置字段选择控件

1.在选择和修改页面,点击获取选择的字段

2.在元数据模块,点击获取改变的字段。修改相应的字段,比如字段名、字段类型、字段格式等等

(四)配置表输出控件

1.在主选项页面

(1)可以修改步骤名称为clickhouse输出

(2)选择连接对应的clickhouse数据库、目标模式就是数据库名、目标表为表名

(3)勾选指定数据库字段

(4)勾选使用批量插入

 2.在数据库字段页面

点击获取字段,检查相同字段名是否映射

 (五)Ctrl+S保存,给kettle任务命名,然后点击运行。

运行成功!

(六)在clickhouse表里检查数据,验证一下 

 这样,用kettle从hive导入click house就成功了。

注意点有两个,一是kettle的版本问题,二是从hive导入click house一定要注意字段的类型转换。

乐于奉献共享,帮我你我他!!!

http://www.lryc.cn/news/92191.html

相关文章:

  • PyTorch 提示和技巧:从张量到神经网络
  • 第五期:字符串的一些有意思的操作
  • 使用Anaconda3结合vscode来实现django项目的建立(绝好的介绍)20230608
  • 【软件测试】软件测试的基本概念和开发模型
  • 接口测试 —— 接口测试定义
  • 2015 年一月联考逻辑真题
  • 基于GD32的定时器不完全详解--定时、级联
  • Clion开发STM32之ESP8266系列(四)
  • 降本增效,StarRocks 在同程旅行的实践
  • INTP型人格适合选择哪些专业?
  • 【LeetCode热题100】打卡第16天:组合总和
  • tinkerCAD案例:1.戒子环
  • RPC接口测试技术-Tcp 协议的接口测试
  • MyBatis Plus基本用法-SpringBoot框架
  • 指针--指针变量的定义和初始化
  • Web基本概念
  • Niagara—— Texture Sample 与 Particle Subuv 区别
  • 如何在食品行业运用IPD?
  • 如何用pandas进行条件分组计算?
  • tomcat如何调优,涉及哪些参数?
  • java培训机构学校教学教务选课管理平台springboot+vue
  • 半导体(TSS)放电管的两大选购注意事项及选型小策略
  • 05-使用Vue3 + Vue CLI 实现前端模块的搭建
  • 3.1 增加多进程执行playwright
  • 关于单片机的时钟浅谈及STM32F103/F030单片机的内外时钟切换问题
  • centos6.10环境下安装php7.4(基于WLNMP包)
  • Qt使用第三方库openssl进行RSA加密解密操作详解
  • 激发数学思维:GPT-4实证研究探索挑战性数学问题
  • 如何配置IP地址
  • CentOS + Nginx 环境自动申请和部署Let‘s Encrypt免费SSL证书教程