当前位置: 首页 > article >正文

慢SQL调优(二):大表查询

最近在工作中写SQL出现几次慢SQL的BUG,总结下来归根到底就是因为大表的原因~这表有多大呢,执行 select COUNT(1) FROM  `position`  是出不来结果滴,每天保底新增1000条数据,可想而知有多大了,所以多次踩坑了这张表。所以,这里总结一下,希望大家以后在开发中都可以注意一下,废话不多说直接开始~~

案例一

SQL-1

SELECT DISTINCT CONCAT_WS('_', p.type, p.drive_license) AS type_drive_license
FROM (SELECT DISTINCT position_idFROM position_viewWHERE `date` > '2025-05-03'AND user_id = 1474358820237239206
) sub
INNER JOIN `position` p ON p.id = sub.`position_id`;

 SQL-2

SELECT DISTINCTCONCAT_WS('_', p.type, p.drive_license) AS type_drive_license
FROMposition_view pvINNER JOIN `position` p ON p.id = pv.`position_id`;
WHEREpv.`date` > '2025-05-03'AND pv.user_id = 1474358820237239206

 这两个SQL最大的区别就是第一个SQL首先通过子查询查询筛选出满足条件的在查询,第二个直接通过内连接直接查询满足条件的数据。看似都可以实现功能,但是第二个就出现了慢SQL的问题,因为大表进行内连接,可能会出现全表扫描。所以采用第一种SQL

推荐选择

  • 对于大表,推荐使用 第一条 SQL(子查询)
  • 对于小表或中间结果较小的场景,推荐使用 第二条 SQL(直接连接)

案列二

  SELECTtype,title,description,regionName,mobileFROM (SELECTp.`type`,p.`title`,p.`description`,r.`fullname` AS regionName,p.`mobile`,p.`create_time`,ROW_NUMBER() OVER (PARTITION BY p.`mobile` ORDER BY p.`create_time` DESC) AS rnFROMposition pINNER JOINregion r ON p.region_id = r.id<where>p.`status`='ONLINE'AND p.`create_time` > #{date}<if test="config.types != null and config.types.size() > 0">AND p.`type` IN<foreach collection="config.types" item="type" open="(" close=")" separator=",">#{type}</foreach></if><if test="config.sources != null and config.sources.size() > 0">AND p.`source` IN<foreach collection="config.sources" item="source" open="(" close=")" separator=",">#{source}</foreach></if></where>) AS subWHEREsub.rn = 1LIMIT #{config.queryCount}

性能提升原因分析(添加 AND p.create_time > #{date} 后)

核心原因:数据量级爆炸性减少

  1. 时间范围大幅缩小

    • 原始查询:需处理整个 position 表的历史数据(可能上亿条)

    • 添加条件后:仅处理最近 #{date} 之后的数据(可能仅几万条)

    • 效果:扫描行数从指数级降至线性级

  2. 窗口函数计算量骤减

    原始:需对全表手机号去重排序(海量排序+分组操作)

    • 添加条件后:仅需处理最近数据中的手机号

    • 效果:排序内存需求下降,避免磁盘临时文件

因为只需要查询1000条最新的数据,职位表每天都有新增1000条数据,所以只查询date天内的数据就可以,有效避免了慢SQL的问题。还有就是窗口函数很容易造成全表扫描,一定到关注性能

总结

在开发中,对于需要操作大表的SQL,特别要注意去正式环境运行一下SQL有没有SQL性能问题,上线之前规避问题,优化~~~

http://www.lryc.cn/news/2399277.html

相关文章:

  • 【C++】—— 从零开始封装 Map 与 Set:实现与优化
  • 内网穿透之Linux版客户端安装(神卓互联)
  • 开疆智能Profinet转Profibus网关连接CMDF5-8ADe分布式IO配置案例
  • 华为云Flexus+DeepSeek征文|Flexus云服务器单机部署+CCE容器高可用部署快速搭建生产级的生成式AI应用
  • 扫地机产品--材质传感器算法开发与虚拟示波器
  • [蓝桥杯]上三角方阵
  • 60天python训练计划----day44
  • 【JAVA版】意象CRM客户关系管理系统+uniapp全开源
  • API异常信息如何实时发送到钉钉
  • Python爬虫(48)基于Scrapy-Redis与深度强化学习的智能分布式爬虫架构设计与实践
  • AtCoder Beginner Contest 407 E - Most Valuable Parentheses
  • (1-6-3)Java 多线程
  • java31
  • 多模态之智能数字人
  • 界面组件DevExpress WPF中文教程:Grid - 如何识别行和卡片?
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(三十)
  • AI基础知识(LLM、prompt、rag、embedding、rerank、mcp、agent、多模态)
  • [蓝桥杯]高僧斗法
  • pycharm F2 修改文件名 修改快捷键
  • Python Flask中启用AWS Secrets Manager+AWS Parameter Store配置中心
  • 机器学习与深度学习10-支持向量机02
  • 《深入解析UART协议及其硬件实现》-- 第二篇:UART硬件架构设计与FPGA实现
  • java swing 晃动鼠标改变背景颜色
  • HikariCP 可观测性最佳实践
  • 简简单单探讨下starter
  • PyTest框架学习
  • SIP、SAP、SDP、mDNS、SSH、PTP
  • 【AI学习笔记】Coze工作流写入飞书多维表格(即:多维表格飞书官方插件使用教程)
  • System.Threading.Timer 和 System.Timers.Timer
  • 在 Windows 系统下配置 VSCode + CMake + Ninja 进行 C++ 或 Qt 开发