当前位置: 首页 > news >正文

GaussDB分布式数据倾斜处理

常规数据倾斜巡检
在库中表个数少于1W的场景,直接使用倾斜视图查询当前库内所有表的数据倾斜情况
SELECT * FROM pgxc_get_table_skewness ORDER BY totalsize DESC;在库中表个数非常多(至少大于1W)的场景,因PGXC_GET_TABLE_SKEWNESS涉及全库查并计算非常全面的倾斜字段,所以可能会花费比较长的时间(小时级),请根据PGXC_GET_TABLE_SKEWNESS视图定义,直接使用table_distribution()函数自定义输出,减少输出列进行计算优化,例如SELECT schemaname,tablename,max(dnsize) AS maxsize, min(dnsize) AS minsize 
FROM pg_catalog.pg_class c 
INNER JOIN pg_catalog.pg_namespace n ON n.oid = c.relnamespace 
INNER JOIN pg_catalog.table_distribution() s ON s.schemaname = n.nspname AND s.tablename = c.relname 
INNER JOIN pg_catalog.pgxc_class x ON c.oid = x.pcrelid AND x.pclocatortype = 'H' 
GROUP BY schemaname,tablename;

建议:
分布健选择:

  1. 字段的值尽量离散;
  2. 选择分布健唯一键;
  3. 根据业务场景选择多的字段作为分布健。
http://www.lryc.cn/news/521381.html

相关文章:

  • 代码随想录Day34 | 62.不同路径,63.不同路径II,343.整数拆分,96.不同的二叉搜索树
  • vue.js辅助函数-mapMutations
  • Vue3组件设计模式:高可复用性组件开发实战
  • PHP 8.4 安装和升级指南
  • 什么是 OpenResty
  • Windows图形界面(GUI)-QT-C/C++ - QT控件创建管理初始化
  • 【计算机网络】lab8 DNS协议
  • 了解linux中的“of_property_read_u32()”
  • iOS - Objective-C 底层中的内存屏障
  • 阿里云服务器扩容系统盘后宝塔面板不显示扩容后的大小
  • c语言——【linux】多进程编程 【进程的创建,相关shell指令,进程状态切换,回收资源,守护进程等】
  • macos 搭建 ragflow 开发环境
  • 信创改造-龙蜥操作系统搭载MySql、Tomcat等服务
  • Java 数据结构 队列之双端队列 常用方法 示例代码 及其实现
  • 【原创】大数据治理入门(2)《提升数据质量:质量评估与改进策略》入门必看 高赞实用
  • arcgis中生成格网矢量带高度
  • 使用gtsam添加OrientedPlane3Factor平面约束因子
  • 换了城市ip属地会变吗?为什么换了城市IP属地不变
  • 移远通信多模卫星通信模组BG95-S5获得Skylo网络认证,进一步拓展全球卫星物联网市场
  • IntelliJ IDEA Type Hierarchy Scope Pattern 学习指南
  • 简聊MySQL并发事务中幻读、虚读问题的解决方案
  • 【搭建JavaEE】(2)Tomcat安装配置和第一个JavaEE程序
  • 【Qt】01-了解QT
  • websocket股票行情接口
  • 朴素贝叶斯分类器
  • 智能化植物病害检测:使用深度学习与图像识别技术的应用
  • vim基本命令(vi、工作模式、普通模式、插入模式、可视模式、命令行模式、复制、粘贴、插入、删除、查找、替换)
  • Qt 自动根据编译的dll或exe 将相关dll文件复制到目标文件夹
  • 探索新能源汽车“芯”动力:AUTO TECH China 2025广州国际新能源汽车功率半导体技术展盛况空前
  • Kafka权威指南(第2版)读书笔记