当前位置: 首页 > news >正文

MySQL追梦旅途之性能优化

1、索引优化

索引可以显著加速查询操作,但过多或不适当的索引也会带来负面影响(如增加写入开销)。因此,选择合适的索引至关重要。

创建索引:

为经常用于WHERE子句、JOIN条件和ORDER BY排序的列创建索引。

CREATE INDEX idx_last_name ON employees (last_name);

复合索引:

如果多个列经常一起出现在查询条件中,考虑创建复合索引。

first_name, last_name复合索引,即使 where first_name 也会走复合索引,但是where last_name不行

CREATE INDEX idx_composite ON orders (customer_id, order_date);

覆盖索引:

确保索引包含所有需要返回的数据列,从而避免回表查找。

意思是索引里面是你需要查询的字段,比如product_name

CREATE INDEX idx_covering ON products (category_id, price, product_name);索引`first_name`, `last_name`即使last_name不是索引第一个,但是查询里面有last_name,所以走索引
如果查询字段存在索引里面没有的字段(不包括主键)则不会走索引
SELECT last_name FROM `123`.`Employees` WHERE last_name=''

索引维护:

定期分析和优化索引,删除不再使用的索引以减少不必要的开销。

2、查询优化

优化SQL查询可以帮助减少执行时间和资源使用。

避免全表扫描:

尽量使用索引来限制扫描范围,避免对大表进行全表扫描。

EXPLAIN  SELECT birth_date,first_name FROM Employees WHERE last_name=''

全表扫描

减少结果集大小:

只选择需要的字段,而不是使用SELECT *。

优化连接(JOIN):

确保参与连接的列上有适当的索引,并且尽可能缩小连接前的结果集。

SELECT o.order_id, c.customer_name 
FROM orders o JOIN customers c ON o.customer_id = c.customer_id 
WHERE o.status = 'shipped';

预过滤:在执行连接之前,尽可能地减少每个表中的行数。你可以通过添加更严格的WHERE子句条件来实现这一点。比如,如果只需要特定日期范围的数据,就在连接之前用WHERE子句限定日期范围。

示例:

场景描述:

在一个电子商务系统中,有orders(订单表)和products(商品表)。我们想要获取在过去一个月内购买了特定类别商品的所有订单详情。如果不进行预过滤,这将涉及到两个大表之间的全表扫描和连接。

SELECTo.order_id,p.product_name,o.order_date 
FROMorders oJOIN order_items oi ON o.order_id = oi.order_idJOIN products p ON oi.product_id = p.product_id 
WHEREo.order_date >= '2024-11-01' AND p.category = 'Electronics';

首先对products表按照商品类别进行预过滤,然后再执行连接操作。这样可以大大减少需要连接的数据量。

-- 用一个临时表做中间数据
WITH FilteredProducts AS (SELECTproduct_id,product_name FROMproducts WHEREcategory = 'Electronics'
)SELECTo.order_id,fp.product_name,o.order_date 
FROMorders oJOIN order_items oi ON o.order_id = oi.order_idJOIN FilteredProducts fp ON oi.product_id = fp.product_id 
WHEREo.order_date >= '2024-11-01';

分页:对于大型结果集,考虑使用分页技术来限制每次查询返回的行数。这对于前端展示大量数据尤其有用。

聚合:如果可能的话,在连接之前对数据进行聚合。这意味着可以在连接前就计算出统计信息,如SUM、COUNT等,从而减少连接操作的数据量。

示例:

场景描述:

假设有一个电子商务平台,其中有两个表——orders(订单表)和order_items(订单详情表)。orders表存储了每个订单的基本信息,而order_items表则记录了每个订单中购买的商品详情以及单价等信息。现在想要获取每个用户的总消费金额。

SELECTo.user_id,SUM( oi.quantity * oi.price ) AS total_spent 
FROMorders oJOIN order_items oi ON o.order_id = oi.order_id 
GROUP BYo.user_id;

首先在order_items表上根据order_id聚合出每个订单的总金额,然后再与orders表连接,并最终按用户ID分组计算总消费额:

WITH OrderTotals AS (SELECTorder_id,SUM( quantity * price ) AS order_total FROMorder_items GROUP BYorder_id
)SELECTo.user_id,SUM( ot.order_total ) AS total_spent 
FROMorders oJOIN OrderTotals ot ON o.order_id = ot.order_id 
GROUP BYo.user_id;

临时表或CTE(Common Table Expressions):有时将中间结果存储在临时表或使用公用表表达式(CTE)可以简化查询逻辑,并且允许你更早地应用过滤条件。

使用EXPLAIN分析查询计划:

通过EXPLAIN关键字查看MySQL如何执行查询,识别潜在问题。

EXPLAIN SELECT * FROM orders WHERE order_date > '2024-01-01';

3、缓存

大部分没有应用场景,命中率不高,消耗内存

利用缓存机制可以减少重复查询数据库的次数,降低负载。

查询缓存(Query Cache)

虽然MySQL 8.0版本之后官方已经移除了内置查询缓存功能,但在某些场景下仍可以通过第三方工具实现类似效果。

应用级缓存

在应用程序层面使用Redis、Memcached等内存存储来缓存频繁访问的数据。

4、硬件优化

硬件升级可以直接影响数据库性能。

**增加内存:**更多的RAM意味着更大的缓冲池(InnoDB Buffer Pool),从而减少磁盘I/O。

**SSD硬盘:**相比于传统HDD,固态硬盘(SSD)提供更快的读写速度,尤其适合随机访问模式。

**多核CPU:**对于高并发工作负载,多核心处理器能够更好地处理并发请求。

5、数据库参数调整

根据具体的使用场景调整MySQL配置参数,可以进一步提升性能。

innodb_buffer_pool_size:

设置InnoDB存储引擎使用的缓存大小,默认值通常是物理内存的70%-80%。

query_cache_size:

配置查询缓存(Query Cache)大小的参数,虽然MySQL 8.0后不再支持,但对于老版本,可以根据实际情况设置查询缓存大小。

max_connections:

根据预期的最大并发连接数调整最大连接数限制。

thread_cache_size:

设置线程缓存大小,以快速响应新连接。

http://www.lryc.cn/news/504225.html

相关文章:

  • 【机器学习】【无监督学习——聚类】从零开始掌握聚类分析:探索数据背后的隐藏模式与应用实例
  • 基于深度Q网络(Deep Q-Network,DQN)的机器人路径规划,可以自定义地图,MATLAB代码
  • Python-从文件中读取数据-Sat-Sun
  • 测试工程师的职业规划
  • 使用 Puppeteer 快速上手 Node.js 爬虫
  • 浏览器的跨域问题与解决方案
  • MyBatis一二级缓存的区别?
  • [2024-12 CISCN 长城杯] Crypto
  • pytorch bilstm crf的教程,注意 这里不支持批处理,要支持批处理 用torchcrf这个。
  • Python毕业设计选题:基于django+vue的疫情数据可视化分析系统
  • tomcat被检测到目标URL存在htp host头攻击漏洞
  • 1.初识python
  • 【密码学】ZUC祖冲之算法
  • Python面试常见问题及答案8
  • ASP.net Core EntityFramework Code EF code 汇总
  • u3d动画系统五【StateMachineBehaviour类】
  • IS-IS协议
  • 使用C++实现RSA加密解密
  • C++归并与快速
  • 金蝶云苍穹踩过的坑(慢慢更新)
  • AndroidStudio——安卓项目结构与文件介绍
  • 华为自反ACL实验
  • yml和xml分别代表什么
  • Qt多线程编程
  • springboot438校园志愿者管理系统(论文+源码)_kaic
  • PostgreSQL 常用运维SQL整理
  • Debezium Oracle CTAS 解析器实现:基于 ANTLR 的 CREATE TABLE AS SELECT 语句解析
  • 从零开始学docker(五)-可用的docker镜像
  • 力扣——322. 零钱兑换
  • .Net_比对Json文件是否一致