当前位置: 首页 > news >正文

clickhouse从mysql同步数据到clickhouse的几种方式

背景

我们的业务数据一般来说都是放在Mysql中的,而我们要分析的数据一般都存放在clickhouse中,所以如何把数据从mysql同步到ck,就变成了一个必须的步骤,本文简单记录下几种同步的方式

mysql数据同步到clickhouse

方式一:
在clickhouse中独立创建一个ck的表,对应着mysql的一张表数据,然后使用定时任务比如每天或者每小时从mysql中查询一天的增量或者一小时的增量数据插入到ck中,这种方式比较容易理解和实现
方式二:
使用canel+kafka同步二进制binlog的方式同步数据,具体来说是把每条db的变更转换成kafka的记录,然后消费kafka消息把数据插入到ck中
方式三:
使用ck提供的mysql引擎表

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],...
) ENGINE = MySQL('host:port', 'database', 'table', 'user', 'password'[, replace_query, 'on_duplicate_clause'])
SETTINGS[ connection_pool_size=16, ][ connection_max_tries=3, ][ connection_wait_timeout=5, ][ connection_auto_close=true, ][ connect_timeout=10, ][ read_write_timeout=300 ]
;

方式四:
使用ck提供的当前还处于实验阶段的MaterializedMySQL引擎

CREATE DATABASE mysql ENGINE = MaterializedMySQL('localhost:3306', 'db', 'user', '***');

方式五:
通过把mysql表导出成Tsv文件,然后通过clickhouse-client工具把TSV文件的数据导入到ck的表中.

参考文献:

https://clickhouse.com/docs/zh/engines/database-engines/materialized-mysql

http://www.lryc.cn/news/252697.html

相关文章:

  • “滑动窗口”算法实例
  • 分布式搜索引擎elasticsearch(一)
  • PTA 7-236 验证哥德巴赫猜想
  • 微信小程序 纯css画仪表盘
  • 成为AI产品经理——模型稳定性评估(PSI)
  • 操作系统——进程同步
  • 如何能够对使用ShaderGraph开发的Shader使用SetTextureOffset和SetTextureScale方法
  • 力扣572:另一棵树的子树
  • Linux系统中进程间通信(Inter-Process Communication, IPC)
  • 【React + Typescript】使用WebPack包管理、各种扩展插件组成的初始模板,开源协议:CC-BY-4.0
  • python 制作3d立体隐藏图
  • layui+ssm实现数据批量删除
  • 国产AI边缘计算盒子,双核心A55丨2.5Tops算力
  • C++作业4
  • 计算机网络(二)| 物理层上 | 数据通信基础知识 调制 频率范围 信噪比
  • [STM32-1.点灯大师上线】
  • Web测试自动化工具Selenium的使用
  • VUE2+THREE.JS 按照行动轨迹移动人物模型并相机视角跟随人物
  • Hadoop YARN组件
  • Java架构师技术架构路线
  • guacamole docker一键部署脚本
  • 蓝桥杯算法心得——想吃冰淇淋和蛋糕(dp)
  • LLM之RAG实战(二):使用LlamaIndex + Metaphor实现知识工作自动化
  • 【容器】Docker打包Linux操作系统迁移
  • redis基本数据结构
  • Learning Normal Dynamics in Videos with Meta Prototype Network 论文阅读
  • Unity 关于SpriteRenderer 和正交相机缩放
  • HarmonyOS应用开发者基础认证考试(98分答案)
  • Ubuntu20.04 Kimera Semantic运行记录
  • 服务器RAID系统的常见故障,结合应用场景谈谈常规的维修处理流程