当前位置：首页 > news >正文

Django Aggregation 使用指南

news 2025/6/28 14:34:11

Django Aggregation 使用指南

在构建Django应用时，我们经常需要对数据库中的数据进行汇总或聚合操作。例如，计算某个字段的平均值、最大值或最小值。这篇文章将详细介绍如何在Django中使用聚合查询，并结合实例进行说明。

聚合查询简介

Django提供了强大的数据库查询API，可以创建、检索、更新和删除单个对象。除此之外，有时我们需要通过汇总或聚合对象集合来获取派生值。本文将介绍如何使用Django查询来生成和返回聚合值。

示例模型

我们以以下模型为例，这些模型用于跟踪一系列在线书店的库存：

from django.db import modelsclass Author(models.Model):name = models.CharField(max_length=100)age = models.IntegerField()class Publisher(models.Model):name = models.CharField(max_length=300)class Book(models.Model):name = models.CharField(max_length=300)pages = models.IntegerField()price = models.DecimalField(max_digits=10, decimal_places=2)rating = models.FloatField()authors = models.ManyToManyField(Author)publisher = models.ForeignKey(Publisher, on_delete=models.CASCADE)pubdate = models.DateField()class Store(models.Model):name = models.CharField(max_length=300)books = models.ManyToManyField(Book)

常见聚合查询示例

以下是一些常见的聚合查询示例：

计算所有书籍的总数：
```
Book.objects.count()
```

计算某出版社出版的书籍总数：

Book.objects.filter(publisher__name="BaloneyPress").count()

计算所有书籍的平均价格：

from django.db.models import Avg
Book.objects.aggregate(Avg("price"))

计算所有书籍的最高价格：

from django.db.models import Max
Book.objects.aggregate(Max("price"))

计算每个出版社的书籍数量：

from django.db.models import Count
pubs = Publisher.objects.annotate(num_books=Count("book"))

按书籍数量排序的前5个出版社：

pubs = Publisher.objects.annotate(num_books=Count("book")).order_by("-num_books")[:5]

聚合方法详解

Django提供了两种生成聚合值的方法：

对整个查询集生成汇总值：
```
from django.db.models import Avg
Book.objects.aggregate(Avg("price"))
```
这将计算所有书籍价格的平均值。
对查询集中的每个对象生成独立的汇总值：
```
from django.db.models import Count
books = Book.objects.annotate(num_authors=Count("authors"))
```
这将为每本书添加一个字段，表示其作者的数量。

高级用法

结合多个聚合：

from django.db.models import Avg, Max, Min
Book.objects.aggregate(Avg("price"), Max("price"), Min("price"))

基于注释值进行过滤：

Book.objects.annotate(num_authors=Count("authors")).filter(num_authors__gt=1)

注释和过滤的顺序：

注释和过滤的顺序对查询结果有很大影响。例如：
```
Publisher.objects.annotate(num_books=Count("book")).filter(book__rating__gt=3.0)
```
与：
```
Publisher.objects.filter(book__rating__gt=3.0).annotate(num_books=Count("book"))
```
这两种查询的结果可能会有所不同，因为注释和过滤的顺序不同。

结合具体实例

我们通过以下代码实现了对Twitter数据的聚合查询：

from django.db.models import Count, Avg
from .models import TwAuthors, TwTweets# 获取每个作者的平均推文数
authors = TwAuthors.objects.annotate(avg_tweets=Avg('twtweets__id'))# 获取推文数量最多的前5个作者
top_authors = TwAuthors.objects.annotate(num_tweets=Count('twtweets')).order_by('-num_tweets')[:5]

这段代码展示了如何利用Django的聚合查询功能，获取每个作者的平均推文数，并找出推文数量最多的前5个作者。

`annotate`和`aggregate`：区别

在Django中，annotate和aggregate是用于生成汇总值的两种不同方法，主要区别在于它们的作用范围和结果类型。

1. `annotate`

作用范围：对每个对象单独计算汇总值。
返回结果：返回一个新的QuerySet，每个对象都会附带一个额外的属性，该属性是通过计算汇总值生成的。
使用场景：当你需要对查询集中的每个对象进行汇总计算时使用。例如，你可能想知道每本书有多少个作者。

示例代码：

from django.db.models import Count# 查询每本书的作者数量
books = Book.objects.annotate(num_authors=Count('authors'))
for book in books:print(book.name, book.num_authors)

2. `aggregate`

作用范围：对整个QuerySet进行汇总计算。
返回结果：返回一个字典，键是汇总值的名称，值是计算的汇总值。
使用场景：当你需要对整个查询集进行汇总计算时使用。例如，你可能想知道所有书籍的平均价格。

示例代码：

from django.db.models import Avg# 计算所有书籍的平均价格
average_price = Book.objects.aggregate(Avg('price'))
print(average_price)

结合实例

假设我们有一个包含书籍信息的数据库，并且我们想获取一些汇总信息：

使用`annotate`：

我们想知道每个出版社出版的书籍数量：

from django.db.models import Countpublishers = Publisher.objects.annotate(num_books=Count('book'))
for publisher in publishers:print(publisher.name, publisher.num_books)

每个Publisher对象将会有一个num_books属性，表示该出版社出版的书籍数量。

使用`aggregate`：

我们想知道所有书籍的最高价格、最低价格和平均价格：

from django.db.models import Avg, Max, Minprice_summary = Book.objects.aggregate(max_price=Max('price'),min_price=Min('price'),avg_price=Avg('price')
)
print(price_summary)