当前位置：首页 > article >正文

orm详解--查询执行

article 2025/8/20 15:59:57

深入解析 Django ORM 查询执行阶段的核心机制，包括查询集的惰性特性、表达式树构建、SQL 编译过程及优化原理。以下是详细分析：

一、查询集（QuerySet）的惰性执行机制

1. 惰性特性的底层实现

核心类：django.db.models.query.QuerySet
关键属性：
- query：存储查询逻辑的 django.db.models.sql.Query 对象
- _result_cache：结果缓存（初始为 None，首次求值后填充）

惰性触发逻辑：

# 创建查询集（未执行 SQL）
qs = Book.objects.filter(author="Doubao")# qs.query 对象此时包含：
# {
#   'model': Book,
#   'where': [AND, =(author, "Doubao")],
#   'limit': None,
#   'offset': None,
#   'order_by': []
# }

2. 链式操作原理

每次调用 filter()、exclude()、order_by() 等方法时：
1. 创建新的 QuerySet 对象
2. 复制原 QuerySet 的 query 对象
3. 在新 query 对象上添加操作

示例代码：

qs1 = Book.objects.filter(author="Doubao")  # QuerySet A
qs2 = qs1.order_by("-price")               # QuerySet B（复制 QuerySet A 的 query 并添加排序）# qs2.query 现在包含：
# {
#   'model': Book,
#   'where': [AND, =(author, "Doubao")],
#   'order_by': ["-price"]
# }

二、查询表达式树（Query Expression Tree）

1. 核心组件

WhereNode 类：表示 SQL 的 WHERE 子句
- 操作类型：AND、OR、NOT
- 子节点：可以是其他 WhereNode 或具体条件
Lookup 类：表示具体的查询条件（如 author="Doubao"）
- 包含：字段、操作符（如 exact、gt）、值

2. 复杂查询树构建示例

# Python 查询
books = Book.objects.filter(Q(author="Doubao") & Q(price__gt=50) | Q(published_date__year=2023)
)# 对应的表达式树结构（简化表示）：
# WhereNode(connector=OR):
#   ├─ WhereNode(connector=AND):
#   │    ├─ Lookup(field=author, lookup=exact, value="Doubao")
#   │    └─ Lookup(field=price, lookup=gt, value=50)
#   └─ Lookup(field=published_date__year, lookup=exact, value=2023)

三、SQL 编译过程

1. 触发编译的操作

以下方法会触发 SQL 编译和执行：

迭代操作：for book in queryset
切片操作：queryset[0:10]（带步长的切片会强制求值）
聚合方法：count()、exists()、aggregate()
获取单个对象：first()、last()、get()

2. SQLCompiler 工作流程

核心类：django.db.backends.*.compiler.SQLCompiler
编译步骤：
1. 生成 SELECT 列表：根据 values() 或模型字段确定返回列
2. 构建 FROM 子句：处理表名和别名
3. 编译 WHERE 子句：将 WhereNode 转换为 SQL 条件
4. 处理 JOIN：根据关联关系生成 INNER JOIN/LEFT OUTER JOIN
5. 添加 LIMIT/OFFSET：处理分页逻辑
6. 生成 ORDER BY：根据 order_by() 生成排序规则

3. 参数化查询实现

所有动态值通过占位符传递，防止 SQL 注入：

# Python 查询
Book.objects.filter(title__contains="Django")# 生成的 SQL（PostgreSQL 示例）
SELECT "books"."id", "books"."title"
FROM "books"
WHERE "books"."title" LIKE %s;# 参数：['%Django%']

四、聚合查询的实现

1. annotate() 方法

实现原理：
1. 在 SELECT 列表中添加聚合表达式
2. 自动添加 GROUP BY 子句（如果需要）

示例：

# 查询每本书的评论数
books = Book.objects.annotate(review_count=Count("reviews"))# 生成的 SQL（简化）
SELECT "books"."id", "books"."title", COUNT("reviews"."id") AS "review_count"
FROM "books"
LEFT OUTER JOIN "reviews" ON ("books"."id" = "reviews"."book_id")
GROUP BY "books"."id";

2. F() 表达式与数据库计算

作用：直接在 SQL 中引用字段值，避免 Python 层面的数据传输

示例：

# 将所有书的价格提高 10%
Book.objects.update(price=F("price") * 1.1)# 生成的 SQL
UPDATE "books" SET "price" = "books"."price" * 1.1;

五、优化机制

1. 查询缓存

一级缓存：QuerySet._result_cache
- 首次求值后缓存结果
- 重复访问直接返回缓存

示例：

qs = Book.objects.all()
list(qs)  # 执行 SQL 并缓存结果
list(qs)  # 直接从缓存获取，不执行 SQL

2. 延迟加载与预加载

延迟加载（Lazy Loading）：

book = Book.objects.first()
reviews = book.reviews.all()  # 触发额外 SQL 查询

预加载（Eager Loading）：

# 使用 prefetch_related() 减少查询次数
books = Book.objects.prefetch_related("reviews")
for book in books:reviews = book.reviews.all()  # 无需额外查询

六、源码分析示例

1. QuerySet.filter() 方法

# django/db/models/query.py
class QuerySet:def filter(self, *args, **kwargs):return self._filter_or_exclude(False, *args, **kwargs)def _filter_or_exclude(self, negate, *args, **kwargs):clone = self._chain()  # 创建 QuerySet 副本clone.query.add_q(Q(*args, **kwargs))  # 添加查询条件到 query 对象if negate:clone.query.negate()return clone

2. SQLCompiler.as_sql() 方法

# django/db/backends/sqlite3/compiler.py
class SQLCompiler:def as_sql(self):# 生成 SELECT 列表select, select_params = self.get_select()# 生成 FROM 子句from_, from_params = self.get_from_clause()# 生成 WHERE 子句where, where_params = self.compile(self.query.where)# 生成 ORDER BY 子句order_by, order_params = self.get_order_by()# 组装完整 SQLsql = "SELECT %s FROM %s" % (select, from_)if where:sql += " WHERE %s" % whereif order_by:sql += " ORDER BY %s" % order_byreturn sql, select_params + from_params + where_params + order_params

七、常见性能陷阱与优化

1. N+1 查询问题

问题场景：

# 触发 1 次查询获取所有书
books = Book.objects.all()# 遍历每本书时触发 N 次查询获取作者
for book in books:print(book.author.name)  # 每次循环触发一次 SQL

优化方案：

# 使用 select_related() 减少查询次数到 1 次
books = Book.objects.select_related("author")
for book in books:print(book.author.name)  # 无需额外查询

2. 过度使用 values()

错误做法：

# 返回字典，失去模型方法
data = Book.objects.values("id", "title")

优化方案：

# 使用 only() 仅加载需要的字段，保留模型实例
books = Book.objects.only("id", "title")

查看全文

http://www.lryc.cn/news/2387140.html

运行打印Hello World启动了多少线程？

C++项目中调用C＃DLL的的方式

咳嗽止咳药笔记250526 , 磷酸苯丙哌林 , 喷托维林 , 右美沙芬

vue pinia 独立维护,仓库统一导出

网络的协议和标准

十六进制字符转十进制算法

跟Gemini学做PPT：汇报背景图寻找指南

java交易所，多语言，外汇，黄金，区块链，dapp类型的，支持授权，划转，挖矿（源码下载）

(已开源-CVPR2024) RadarDistill---NuScenes数据集Radar检测第一名

【MySQL】数据库基础数据类型

中小企业AI算力如何选？【显卡租赁】VS【自建服务器】

OpenHarmony 4.1版本应用升级到5.0版本问题记录及解决方案

std::initialzer_list 与花括号{}数据列表

萤石云实际视频实时接入（生产环境）

QT中常用的类

Docker系列（四）：容器操作全栈技术指南 --- 从入门到生产级管控

poppler_path 是用于 Python 库如 pdf2image 进行 PDF 转换时

鸿蒙OSUniApp 开发的多图浏览器组件#三方框架 #Uniapp

MongoDB 错误处理与调试完全指南：从入门到精通

React从基础入门到高级实战：React 核心技术 - 表单处理与验证深度指南

【C++】stack，queue和priority_queue（优先级队列）

ubuntu中上传项目至GitHub仓库教程

[Java实战]Spring Boot整合达梦数据库连接池配置（三十四）

windows 下用yolov5 训练模型给到opencv 使用

Spark集群架构解析：核心组件与Standalone、YARN模式深度对比(AM，Container，Driver，Executor)

Linux Kernel调试：强大的printk（二）

Kafka Kraft模式集群 + ssl

[crxjs]自己创建一个浏览器插件

类的设计模式——单例、工厂以及建造者模式

STM32之看门狗（IWDG）