当前位置: 首页 > news >正文

SQL聚合函数:SUM与COUNT的区别

在 SQL 中,SUMCOUNT(*)COUNT(1)COUNT(column) 都是聚合函数,但它们的作用和计算逻辑有本质区别:


1. SUM(column)

  • 作用:对指定列的所有非 NULL 数值求和。
  • 特性
    • 仅适用于数值类型列(如 INT, FLOAT 等)。
    • 忽略 NULL,仅计算有效数值。
  • 示例
    -- 假设表 sales 有列 amount: [100, NULL, 50]
    SELECT SUM(amount) FROM sales; -- 结果:150
    

2. COUNT(*)

  • 作用:统计表中总行数(包括所有列值为 NULL 的行)。
  • 特性
    • 不关心具体列内容,直接计数所有行。
    • 性能通常最优(数据库引擎会优化)。
  • 示例
    -- 假设表 sales 有 3 行(其中一行全为 NULL)
    SELECT COUNT(*) FROM sales; -- 结果:3
    

3. COUNT(1)

  • 作用:统计表中总行数(等价于 COUNT(*))。
  • 特性
    • 1 是一个常量表达式,不引用任何列。
    • 执行结果和性能与 COUNT(*) 完全相同(现代数据库优化后无差别)。
  • 示例
    SELECT COUNT(1) FROM sales; -- 结果:3(与 COUNT(*) 一致)
    

为什么 COUNT(*)COUNT(1) 一样?
数据库引擎在处理时,二者都会被优化为直接统计行数,无需检查列值。优先推荐 COUNT(*)(语义更明确)。


4. COUNT(column)

  • 作用:统计指定列中非 NULL 值的数量
  • 特性
    • 仅计数该列不为 NULL 的行。
    • 如果列包含 NULL,结果会小于 COUNT(*)
  • 示例
    -- 假设表 sales 有列 product: ["A", NULL, "B"]
    SELECT COUNT(product) FROM sales; -- 结果:2(忽略 NULL)
    

⭐ 关键区别总结

函数作用是否忽略 NULL性能建议
SUM(column)对数值列求和忽略 NULL 值仅用于数值列
COUNT(*)统计所有行数不忽略 NULL 行✅ 优先使用
COUNT(1)统计所有行数(同 COUNT(*)不忽略 NULL 行= COUNT(*)
COUNT(column)统计列的非 NULL 值数量忽略 NULL 值需注意 NULL 影响

🚨 常见误区

  1. COUNT(*) vs COUNT(1)

    • 二者性能无差异,但 COUNT(*) 更符合语义(统计行数)。
  2. COUNT(column) 可能返回比预期小的值

    • 如果列包含 NULL,结果会减少,例如:
      -- 表中 100 行,其中 10 行 column_x 为 NULL
      COUNT(*)      --> 100
      COUNT(column_x) --> 90
      
  3. COUNT 与字符串/日期列

    • COUNT(column) 可用于任何数据类型(不限于数字),但仍会忽略 NULL

💡 使用建议

  • 统计总行数 → COUNT(*)
  • 统计某列有效值数量 → COUNT(column)(注意 NULL 影响)
  • 避免 COUNT(非索引列) 对大表扫描,可考虑用索引列替代优化性能。
http://www.lryc.cn/news/614769.html

相关文章:

  • 算法训练之字符串
  • 04--模板初阶(了解)
  • 常见数据结构介绍(顺序表,单链表,双链表,单向循环链表,双向循环链表、内核链表、栈、队列、二叉树)
  • VMware使用NAT模式,使本机与虚拟机在不同的网络,并且虚拟机可以上网
  • VSCode 禁用更新检查的方法
  • C++归并排序
  • Flutter开发 Switch、SwitchListTile的基本使用
  • 机器学习概念1
  • 关于 Rust 异步(无栈协程)的相关疑问
  • 书生浦语第五期-L1G3-LMDeploy 课程
  • AI入门学习--如何对RAG测试
  • 讲一讲@ImportResource
  • 触觉导航新突破:Contactile 触觉传感器推动机器人 “零示教” 实现复杂曲面作业
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘transformers’问题
  • 线程同步相关知识
  • 构建高可用架构:ZDNS GSLB 在多数据中心场景下的应用与 F5 替换实践
  • Linux网络--1、网络基础
  • Java零散知识点
  • Claude Code:智能代码审查工具实战案例分享
  • 阶段二测试
  • 华为网路设备学习-28(BGP协议 三)路由策略
  • Latex中公式部分输入正体的字母\mathrm{c}
  • v-model双向绑定指令
  • 【工作笔记】Docker Desktop一直转圈加载不出来然后报错
  • 数据结构---二叉树(概念、特点、分类、特性、读取顺序、例题)、gdb调试指令、时间复杂度(概念、大O符号法、分类)
  • CSS:BFC
  • 深入解析Linux信号处理机制
  • DeepSeek辅助编写的带缓存检查的数据库查询缓存系统
  • 三方相机问题分析七:【datespace导致GPU异常】三方黑块和花图问题
  • Sum of Three Values(sorting and searching)