当前位置: 首页 > news >正文

TiDB 的MPP架构概述

MPP架构介绍:

如图,TiDB Server 作为协调者,首先 TiDB Server 会把每个TiFlash 拥有的region 会在TiFlash上做交换,让表连接在一个TiFlash上。另外 TiFlash会作为计算节点,每个TiFlash都负责数据交换,表连接,聚合等等。

每个TiFlash在MPP架构里面称为一个MPP worker。

MPP的特点:

1.适合大量的join聚合查询

2.所有MPP计算是在内存中执行的,数据不落地。

3.只支持等值连接,不支持不等值连接(这意味着有一些sql用不了MPP,这时候可以使用参数:Enforce_mpp 强制使用MPP,但不支持等值连接就是不支持,执行后会警告)。


MPP的执行流程:

首先,在这个SQL中,有一个表连接,两个过滤条件,一个聚合条件 。

TiFlash在存储数据的时候会把数据分别存储在不同的TiFlash上,这个SQL的执行流程是:

1.在每个TiFlash 中过滤出order表里面 dic列的前三个字母是7c0的数据放到内存中。把product表里面pct_date列大于‘2021-09-30’ 的数据放到内存中(并行执行)

2. 数据交换(减少网络交换),让表连接在本节点执行,对每一张表的连接项(pid)取一个hash函数,如取模。将数据根据hash值 进行数据交换,让hash值相同的数据在一个节点上。

3. 对group by进行提速,也是进行数据交换,对state取hash函数,把hash函数相等的放在一个节点。

 4.把TiFlash的数据返回到TiDB Server

 

 总结:TiDB的MPP架构充分利用了TiFlash并行计算的功能, 当一个复杂的SQL语句过来的时候(能够使用MPP),先利用表连接的条件把连接条件Hash值相同的数据放到一个节点上,防止网络交换严重,处理了过滤条件后,如有聚合条件,再利用聚合条件的字段进行数据交换,把聚合条件字段hash值相同的数据放到同一个数据节点中,最后每个TiFlash把计算好的数据返回给TiDB Server。

http://www.lryc.cn/news/512273.html

相关文章:

  • Leetcode 10-正则表达式匹配/ 剑指 Offer 19. 正则表达式匹配
  • FFmpeg 编码和解码
  • kali当中web扫描工具的用法
  • 深度剖析 Android Animation 框架
  • 泰山派GPIO子系统驱动---亮灯
  • 【C#特性整理】C#特性及语法基础
  • Presence:Colyseus用于管理实时分布式数据的工具
  • Ubuntu 搭建SVN服务
  • HTML速查
  • day-102 二进制矩阵中的最短路径
  • SQL Server大批量数据插入
  • 在 Ubuntu 下通过 Docker 部署 Caddy 服务器
  • ZooKeeper注册中心实现
  • 数仓建模:如何进行实体建模?
  • Python编程技术
  • 「Mac玩转仓颉内测版55」应用篇2 - 使用函数实现更复杂的计算
  • map参数详解
  • OSI 七层模型 | TCP/IP 四层模型
  • 高转速风扇|无刷暴力风扇方案设计
  • GPU 进阶笔记(三):华为 NPU/GPU 演进
  • 计算机网络 (13)信道复用技术
  • 数据库约束和查询
  • 网工日记:FTP两种工作模式的区别
  • NLP模型工程化部署
  • 分布式版本管理工具——git 中忽略文件的版本跟踪(初级方法及高级方法)
  • 【LangChain】Chapter4 - Question and Answer Over Documents
  • TCP/IP 协议演进中的瓶颈,权衡和突破
  • 软件测试面试八股文,查漏补缺(附文档)
  • IDEA工具使用介绍、IDEA常用设置以及如何集成Git版本控制工具
  • YOLOv10-1.1部分代码阅读笔记-transformer.py