当前位置: 首页 > news >正文

共享内存和Pytorch中的Dataloader结合

dataloader中通常使用num_workers来指定多线程来进行数据的读取。可以使用共享内存进行加速。
代码地址:https://github.com/POSTECH-CVLab/point-transformer/blob/master/util/s3dis.py

文章目录

    • 1. 共享内存和dataloader结合
      • 1.1 在init中把所有的data存储到共享内存中
      • 1.2 在getitem从共享内存中读出data
    • 2. 怎么查询key在不在共享内存中
    • 3. 共享内存的地址是什么,怎么查看
    • 4. 共享内存有多大
    • 5. 共享怎么删除

1. 共享内存和dataloader结合

class S3DIS(Dataset):def __init__(self, split='train', data_root='trainval', test_area=5, voxel_size=0.04, voxel_max=None, transform=None, shuffle_index=False, loop=1):super().__init__()self.split, self.voxel_size, self.transform, self.voxel_max, self.shuffle_index, self.loop = split, voxel_size, transform, voxel_max, shuffle_index, loopdata_list = sorted(os.listdir(data_root))data_list = [item[:-4] for item in data_list if 'Area_' in item]if split == 'train':self.data_list = [item for item in data_list if not 'Area_{}'.format(test_area) in item]else:self.data_list = [item for item in data_list if 'Area_{}'.format(test_area) in item]for item in self.data_list:if not os.path.exists("/dev/shm/{}".format(item)):data_path = os.path.join(data_root, item + '.npy')data = np.load(data_path)  # xyzrgbl, N*7sa_create("shm://{}".format(item), data)self.data_idx = np.arange(len(self.data_list))print("Totally {} samples in {} set.".format(len(self.data_idx), split))def __getitem__(self, idx):data_idx = self.data_idx[idx % len(self.data_idx)]data = SA.attach("shm://{}".format(self.data_list[data_idx])).copy()coord, feat, label = data[:, 0:3], data[:, 3:6], data[:, 6]coord, feat, label = data_prepare(coord, feat, label, self.split, self.voxel_size, self.voxel_max, self.transform, self.shuffle_index)return coord, feat, labeldef __len__(self):return len(self.data_idx) * self.loop

1.1 在init中把所有的data存储到共享内存中

for item in self.data_list:if not os.path.exists("/dev/shm/{}".format(item)):data_path = os.path.join(data_root, item + '.npy')data = np.load(data_path)  # xyzrgbl, N*7sa_create("shm://{}".format(item), data)

key就是文件名,存储在self.data_list中

1.2 在getitem从共享内存中读出data

data = SA.attach("shm://{}".format(self.data_list[data_idx])).copy()

2. 怎么查询key在不在共享内存中

os.path.exists(“/dev/shm/{}”.format(item))能够查询该key在不在共享内存中。

3. 共享内存的地址是什么,怎么查看

$ ls /dev/shm  
Area_5_hallway

通过/dev/shm地址访问,但是这部分数据存储在内存中。

4. 共享内存有多大

$ df -h   
Filesystem      Size  Used Avail Use% Mounted on
tmpfs           7.8G   44M  7.8G   1% /dev/shm

大小是物理内存的一半

5. 共享怎么删除

SA.delete("shm://{}".format('Area_5_hallway'))

SA.delete删除key

http://www.lryc.cn/news/338335.html

相关文章:

  • 分享 WebStorm 2024 激活的方案,支持JetBrains全家桶
  • Android OOM问题定位、内存优化
  • 棋盘(c++题解)
  • 滑动窗口例题
  • 智过网:注册安全工程师注册有效期与周期解析
  • 腐蚀Rust 服务端搭建架设个人社区服务器Windows教程
  • 蓝桥杯备赛:考前注意事项
  • 111111111111
  • uniapp 卡片勾选
  • 乐趣Python——文件与数据:挥别乱糟糟的桌面
  • docker nginx-lua发送post json 请求
  • 阿里面试总结 一
  • 多线程(49)定义无锁、阻塞、非阻塞和无等待算法
  • (一)ffmpeg 入门基础知识
  • 【软件测试】个人博客系统测试
  • 20240410解决OK3588-C的核心板刷机之后无法启动的问题
  • 仅需三步就能成为大语言模型Prompt Engineer提示词工程大神
  • RuleEngine规则引擎底层改造AviatorScript 之公式规则
  • Vue项目(H5)与微信小程序来回跳转
  • 设计模式-单一职责原则
  • vue和nunjucks的变量插值的形式{{}}冲突
  • 多语言婚恋交友APP开发流程一览
  • RUM 最佳实践-交互延迟的探索与发现
  • spring boot 集成 flyway依赖 做数据库迁移,让部署没烦恼
  • TCP协议--传输机制
  • 句柄ros::NodeHandle nh(“~“)与nh对launch文件参数配置(param)的影响
  • C++_List的学习
  • centos 7.9 nginx本地化安装,把镜像改成阿里云
  • JVM规范中的运行时数据区
  • Stable Diffusion文生图技术详解:从零基础到掌握CLIP模型、Unet训练和采样器迭代