当前位置：首页 > news >正文

PyTorch 张量的分块处理介绍

news 2025/7/16 19:25:08

分块处理是将大型张量分解成较小的块，以便更高效地进行计算，减少内存占用，特别适用于处理超大张量的场景（如深度学习中的大批量数据或大型模型训练）。

PyTorch 提供了多种方法来分块张量，包括 chunk、split、unfold 等。以下是这些方法的介绍及其适用场景。

1. 使用 `torch.chunk`

功能
将张量沿指定维度分成 指定数量的块。

语法

torch.chunk(input, chunks, dim=0)

input：输入张量。
chunks：将张量分成的块数。
dim：指定分块的维度。

示例

x = torch.arange(12).reshape(3, 4)  # 一个 3x4 的张量
print(x)# 沿第 0 维（行）分成 3 块
chunks = torch.chunk(x, chunks=3, dim=0)
for i, chunk in enumerate(chunks):print(f"Chunk {i}:\n{chunk}")

2. 使用 `torch.split`

功能
将张量沿指定维度分成 指定大小的块。每块的大小可以不相同。

语法

torch.split(input, split_size_or_sections, dim=0)

split_size_or_sections：可以是整数（每块的大小）或列表（每块的大小分别定义）。
dim：指定分块的维度。

示例

x = torch.arange(12).reshape(3, 4)# 沿第 1 维（列）分成大小为 2 的块
chunks = torch.split(x, 2, dim=1)
for i, chunk in enumerate(chunks):print(f"Chunk {i}:\n{chunk}")# 指定块的大小分别为 1 和 3
chunks = torch.split(x, [1, 3], dim=1)
for i, chunk in enumerate(chunks):print(f"Chunk {i}:\n{chunk}")

3. 使用 `torch.unfold`

功能
从张量中提取 滑动窗口 块，适用于卷积、时间序列等需要处理局部区域的场景。

语法

torch.unfold(input, dimension, size, step)

dimension：滑动窗口应用的维度。
size：窗口大小。
step：滑动步长。

示例

x = torch.arange(1, 10).reshape(1, 1, 3, 3)  # 3x3 张量
print("Original tensor:\n", x)# 滑动窗口大小为 2x2，步长为 1
unfolded = x.unfold(2, 2, 1).unfold(3, 2, 1)
print("Unfolded tensor shape:", unfolded.shape)
print("Unfolded tensor:\n", unfolded)

注： x.unfold(2, 2, 1)中第一个2为维度，第二个2为窗口大小，1为滑动步长。

4. 分块处理的优化场景

(1) 内存优化

当内存不足以加载整个大张量时，将其分块并逐块处理可以显著减少内存占用。

(2) 并行处理

将张量分块后，可以将各个块分配到不同的设备（如多 GPU）进行并行计算，提高计算效率。

(3) 数据流批处理

在训练深度学习模型时，可将大批次数据分块处理，避免一次性加载超大批次导致显存溢出。

5. 分块与重组

分块后常需要对处理后的块进行重组，以恢复原始张量的形状。PyTorch 提供以下方法：

(1) `torch.cat`

将多个张量按指定维度连接。

x1 = torch.tensor([[1, 2]])
x2 = torch.tensor([[3, 4]])
result = torch.cat([x1, x2], dim=0)
print(result)  # tensor([[1, 2],#         [3, 4]])

(2) `torch.stack`

将多个张量堆叠到新的维度上。

x1 = torch.tensor([1, 2])
x2 = torch.tensor([3, 4])
result = torch.stack([x1, x2], dim=0)
print(result)  # tensor([[1, 2],#         [3, 4]])

(3) `torch.reshape`

用于恢复分块前的形状。

chunk = torch.arange(12).reshape(3, 4)
flattened = chunk.flatten()
restored = flattened.reshape(3, 4)
print(restored)

6. 总结

chunk：按块数分割张量，块大小可能不均。
split：按块大小分割张量，可以自定义每块的大小。
unfold：生成滑动窗口块，适用于局部区域计算。
分块优化场景：适用于内存优化、并行计算和大批次数据处理。

查看全文

http://www.lryc.cn/news/518294.html

在Ubuntu中使用systemd设置后台自启动服务

mongodb清理删除历史数据

C++字体库开发之字体回退策略十六

IO进程day3

【多线程初阶篇¹】线程理解| 线程和进程的区别

wireshark排除私接小路由

Docker 从入门到精通

uni app 写的小游戏，文字拼图？文字拼写？不知道叫啥

Qt监控系统远程网络登录/请求设备列表/服务器查看实时流/回放视频/验证码请求

案例研究：UML用例图中的结账系统

二叉树的层次遍历

docker推送本地仓库报错

Python中的asyncio：高效的异步编程模型

Oopsie【hack the box】

详细介绍 React 中 i18n 的完整使用流程：

部署：上传项目代码配置数据库

C++—9、如何在Microsoft Visual Studio中调试C++

11. C 语言作用域与变量使用技巧

【机器学习案列】学生抑郁可视化及预测分析

Perl语言的循环实现

SpringBoot项目——使用Spark对爬虫爬取下的数据进行清洗

分布式锁 Redis vs etcd

《深度剖析：开源与闭源模型，AI舞台上的不同角色》

Angular结合C#

Spring——自动装配

Servlet与JSP：Java的秘密花园入口

【Linux】Linux常见指令（上）

ELFK日志采集实战

Kubernetes 使用自定义资源（CRD）扩展API

用户使用LLM模型都在干什么？

1. 使用 torch.chunk

2. 使用 torch.split

3. 使用 torch.unfold