当前位置：首页 > news >正文

1661. 每台机器的进程平均运行时间

news 2025/8/2 17:39:04

1. 题解

# Write your MySQL query statement below
select machine_id,round(sum(case when activity_type = 'end' then timestamp else -timestamp end)/ count(distinct process_id), 3) as processing_time
from activity
group by machine_id

a. 整体查询概览

首先，让我们看看整个 SQL 查询的结构：

SELECTmachine_id,ROUND(SUM(CASE WHEN activity_type = 'end' THEN timestamp ELSE -timestamp END) / COUNT(DISTINCT process_id), 3) AS processing_time
FROM activity
GROUP BY machine_id;

这个查询的目标是：

从 activity 表中获取数据。
按 machine_id 分组。
计算每个机器的 processing_time，具体方法是对处理时间进行特定的计算和汇总。
将计算结果进行四舍五入，保留三位小数。
将结果命名为 processing_time，并显示 machine_id 和对应的 processing_time。

接下来，我们将逐步解释关键部分，特别是你关注的那一行：

SUM(CASE WHEN activity_type = 'end' THEN timestamp ELSE -timestamp END
) / COUNT(DISTINCT process_id)

b. 逐步解析

1. `SUM(...)`

SUM 是一个聚合函数，用于计算指定列或表达式的总和。在这里，SUM 计算的是 CASE 表达式的结果总和。

示例：
如果有三个数 2, 3, 5，那么 SUM(2, 3, 5) 的结果是 10。

2. `CASE WHEN activity_type = 'end' THEN timestamp ELSE -timestamp END`

这是一个 CASE 表达式，用于根据条件对每一行的数据进行不同的处理。

结构解释：

CASE WHEN condition THEN result1 ELSE result2 END

这意味着：

- 如果满足 condition 条件，则取 result1。
- 否则，取 result2。

在你的查询中：

WHEN activity_type = 'end' THEN timestamp

- 如果 activity_type 的值是 'end'，则返回 timestamp 的值。

ELSE -timestamp

- 如果 activity_type 不是 'end'，则返回 -timestamp（timestamp 的相反数）。

举例说明：

假设有以下几行数据：

activity_type	timestamp
start	1000
end	1500
start	2000
end	2500

应用 CASE 表达式后：

第一行 (start, 1000) => -1000
第二行 (end, 1500) => 1500
第三行 (start, 2000) => -2000
第四行 (end, 2500) => 2500

这样，SUM(CASE…) 将计算为：(-1000) + 1500 + (-2000) + 2500 = 1000

3. `/ COUNT(DISTINCT process_id)`

这部分是将上一步 SUM 的结果除以某个值。具体来说：

COUNT(DISTINCT process_id) 是一个聚合函数，用于计算唯一的 process_id 的数量。

解释：

COUNT(*) 会计算表中的所有行数。
COUNT(column_name) 会计算该列中非 NULL 值的数量。
COUNT(DISTINCT column_name) 会计算该列中唯一（不重复）的非 NULL 值的数量。

举例说明：

假设在一个分组中，process_id 的值为：[1, 2, 2, 3]

COUNT(process_id) 会是 4，因为有 4 个非 NULL 值。
COUNT(DISTINCT process_id) 会是 3，因为唯一的 process_id 是 1、2、3。

4. 结合起来理解整个表达式

现在，我们将整个表达式结合起来解释：

SUM(CASE WHEN activity_type = 'end' THEN timestamp ELSE -timestamp END
) / COUNT(DISTINCT process_id)

步骤解析：

CASE 表达式为每一行生成一个值：

- 如果 activity_type 是 'end'，则使用该行的 timestamp。
- 否则，使用该行的 -timestamp（负值）。

SUM(...) 将所有这些值相加：

- 这实际上是在计算每个 machine_id 的总处理时间。
- 例如，针对开始 (start) 和结束 (end) 活动，将结束时间减去开始时间，得到每个过程的处理时间。

COUNT(DISTINCT process_id) 计算每个 machine_id 下的唯一过程数量：

- 这可能代表不同的任务、作业或操作。

将总处理时间除以过程数量：

- 这计算了每个 machine_id 的平均处理时间。

进一步解释：

为何用 -timestamp？

假设 activity 表记录了机器的活动日志，每个过程有一个 start 和一个 end 活动。timestamp 代表活动发生的时间点。

通过将 start 的 timestamp 设为负值，end 的 timestamp 设为正值，当你对它们求和时，就得到：

[
\text{总处理时间} = (\text{end}_1 + \text{end}_2 + \dots) - (\text{start}_1 + \text{start}_2 + \dots)
]

这相当于计算所有过程的结束时间总和减去开始时间总和，进而得到总的处理时间。

为何除以 COUNT(DISTINCT process_id)？

这一步计算的是每个过程的平均处理时间。通过将总处理时间除以过程的数量，你得到每个 machine_id 平均每个过程花费的时间。

用具体数据举例：

假设 activity 表中有以下数据：

machine_id	process_id	activity_type	timestamp
1	100	start	1000
1	100	end	1500
1	101	start	2000
1	101	end	2500
2	200	start	3000
2	200	end	3500

对于 machine_id = 1:

CASE 结果：

- (start, 1000) => -1000
- (end, 1500) => 1500
- (start, 2000) => -2000
- (end, 2500) => 2500

SUM(CASE...): (-1000) + 1500 + (-2000) + 2500 = 1000
COUNT(DISTINCT process_id): 2 (process_id 100 和 101)
processing_time: 1000 / 2 = 500

对于 machine_id = 2:

CASE 结果：

- (start, 3000) => -3000
- (end, 3500) => 3500

SUM(CASE...): (-3000) + 3500 = 500
COUNT(DISTINCT process_id): 1 (process_id 200)
processing_time: 500 / 1 = 500

最后，ROUND(..., 3) 将结果四舍五入到小数点后三位，比如 500 会变成 500.000。

c. 小结

这个表达式的目的是：

计算每个 machine_id 的总处理时间：

- 将结束时间相加，开始时间相减，得到总的运行时间。

计算每个 machine_id 的平均每个过程的处理时间：

- 将总处理时间除以该机器完成的唯一过程数量。

最终结果是每台机器平均每个过程的处理时间，保留三位小数。

查看全文

http://www.lryc.cn/news/607647.html

系统开机时自动执行指令

基于python大数据的招聘数据可视化及推荐系统

算法思想之多源 BFS 问题

【Node.js安装注意事项】-安装路径不能有空格

PNP机器人机器人学术年会展示灵巧手动作捕捉方案。

MySQL分析步

Android签名轮转

Conda install安装了一些库，如何撤销操作

第13届蓝桥杯Python青少组中/高级组选拔赛（STEMA）2022年3月13日真题

外卖“0元购”退场后，即时零售大战才刚开始

CORS模块：你的跨域快速通行证 [特殊字符]

抢占先机，PostgreSQL 中级专家认证的职业跃迁

学习：入门uniapp Vue3组合式API版本（17）

Linux文件系统：从内核到缓冲区的奥秘

如何创建一个飞书应用获取自己的飞书AppID和AppSecret？

力扣面试150题--数字范围按位与

QPS 与 TPS 的详细解释及核心区别

gdrcopy 原理、安装与示例

国内短剧CPS系统开发：技术架构与商业化实践

将 YOLOv11 的 .pt 模型转换为 YOLOv8 格式需要特定的处理流程机器学习计算机视觉cv

【数据分享】中国27省乡镇（街道）级人口密度数据集（2000年）

【Open3D】基础操作之三维变换

【数据分享】南海综合波浪数据（1945-2018 年）（获取方式看文末）

Servlet作用域，监听器，JSP九大内置对象

python基础语法4，函数（简单易上手的python语法教学）课后习题

WooCommerce 与 ERP 系统集成解决方案

1. 题解

a. 整体查询概览

b. 逐步解析

1. SUM(...)

2. CASE WHEN activity_type = 'end' THEN timestamp ELSE -timestamp END

3. / COUNT(DISTINCT process_id)

4. 结合起来理解整个表达式

c. 小结

相关文章：

1. `SUM(...)`

2. `CASE WHEN activity_type = 'end' THEN timestamp ELSE -timestamp END`

3. `/ COUNT(DISTINCT process_id)`