当前位置: 首页 > news >正文

ClickHouse--分布式查询多副本的路由规则

前言

在集群情况下,数据写入可以有写本地表和写分布式表2种方案,但是面向集群查询时,只能通过Distributed表引擎实现。

本文主要介绍分布式查询多副本的路由规则。

该配置项为:load_balance=random/nearest_hostname/in_order/first_or_random

一、多副本的路由规则

查询数据时,如果一个分片shard有多个副本repIica,那么Distributed表引擎就需要面对副本选择的问题,选择查询究竟在哪个副本上执行。ck的负载均衡算法有以下四种:

  • random

  • nearest_hostname

  • in_order

  • first_or_random

  1. random

这是默认的负载均衡算法。在ck的服务节点中,有一个errors_count全局计数器,当服务发生任何异常时,技术器加1。randdom算法会选择errors_count最小的那个repIica,如果多个repIica的errors_count相同,则在这几个里随机选择一个。

  1. nearest_hostname

选择errors_count最小的那个,如果多个errors_count相同,则选择集群配置中host名称和当前host名称最相似的那个。相似比较的规则是与当前host的名称,按字节进行逐位对比,找到不同字节最少的那个。

例如当前host是a.bc.de,那么,a.bc.df就比a.bf.hh要更加相似。

a.bc.de

a.bc.df

a.bf.hh

  1. in_order

选择errors_count最小的那个,如果多个errors_count相同,则按照集群配置顺序选择。

  1. first_or_random

选择errors_count最小的那个,如果多个errors_count相同,则按照集群配置顺序选择第一个,如果第一个不可用,则随意选择一个其他的。

总结起来:其实这4个负载算法中,都是优先选择errors_count最小的那个,如果多个errors_count相同时,再根据不同的负载算法来选择。

拓展:对于集群的每一个查询,errors_count 都会更新一次,但 estimated_recovery_time 会根据需求重新计算,所以可能会出现这样的情况,当 errors_count 非零、estimated_recovery_time 为零时,下次查询会把 errors_count 置为零,并且尝试使用副本,就好像没有错误一样。

二、如何设置errors_count,确保生效

errors_count默认不开启

Hedged requests for remote queries. When setting use_hedged_requests enabled (off by default), allow to establish many connections with different replicas for query. New connection is enabled in case existent connection(s) with replica(s) were not established within hedged_connection_timeout or no data was received within receive_data_timeout. Query uses the first connection which send non empty progress packet (or data packet, if allow_changing_replica_until_first_data_packet); other connections are cancelled. Queries with max_parallel_replicas > 1 are supported. #19291 (Kruglov Pavel). This allows to significantly reduce tail latencies on very large clusters.

翻译:

远程查询的对冲请求。当将use_hedged_requests设置为启用(默认情况下为禁用)时,允许与不同副本建立多个连接以进行查询。如果在hedged_connection_timeout内未建立与副本的现有连接或在receive_data_timeout中未接收到数据,则启用新连接。查询使用发送非空进度包(或数据包,如果allow_changing_replica_until_first_data_packet)的第一个连接;其他连接被取消。支持max_paralle_replicas>1的查询。这允许在非常大的集群上显著减少尾部延迟。

使用场景:若将一个CK集群中的某个分片的某个副本停服(或者挂起),使之处于一个假死状态,无法对外提供服务,无法接受插入、查询请求等;如果未设置use_hedged_requests=1,还是会有1/副本数 的概率往停服的副本上发送,从而导致请求超时报错等问题

http://www.lryc.cn/news/36510.html

相关文章:

  • Linux 常用命令总结
  • 超分扩散模型 SR3 可以做图像去雨、去雾等恢复任务吗?
  • STM32Cube STM32MP157 M4端CAN通讯实战
  • npm install报错unable to resolve dependency tree
  • 力扣sql简单篇练习(二十六)
  • 2022年全国职业院校技能大赛(中职组)网络安全竞赛试题A模块第九套解析(详细)
  • C++回顾(十六)—— 异常处理机制
  • 【100个 Unity实用技能】 | Unity 在代码中 动态改变RectTransform位置及宽高 的方法整理
  • 哈希表的实现
  • 搞懂海明码
  • 数据库:Mysql数据库安装及使用
  • 【冲刺蓝桥杯的最后30天】day7
  • REG.EXE修改注册表-解决win10微软输入法默认中文,将其全局修改为英文
  • hive之正则函数研究学习regex/regex_replace/regex_extract
  • Codeforces Round 854 by cybercats (Div. 1 + Div. 2) C、D1
  • API 网关日志的价值,你了解多少?
  • 华大单片机、STM32单片机如何做printf串口打印格式化输出
  • unity 面试汇总
  • Spring SpringBoot中使用Mybatis-plusDemo1
  • 【18.04Ubuntu中解决无法识别显示屏】
  • Python 协程详解,都在这里了
  • 百家号如何写文章赚钱,百家号写文章真的赚钱?
  • 【HDFS】datanodeReport RPC优化
  • 【数据结构】研究链表带环问题
  • 数据仓库的设计思想
  • 【JavaSE】数组的定义与使用详解
  • Kubernetes14:Helm为了部署像微服务这种的大型项目
  • 2.3操作系统-存储管理:页式存储、逻辑地址、物理地址、物理地址逻辑地址之间的地址关系、页面大小与页内地址长度的关系、缺页中断、内存淘汰规则
  • 设计模式3——结构型模式
  • css——图片缩放,拉伸,变形的解决办法