当前位置：首页 > news >正文

关于Pytorch转换为MindSpore的一点建议

news 2025/7/2 13:48:23

一、事先准备

必须要对Mindspore有一些了解，因为这个框架确实有些和其它流程不一样的地方，比如算子计算、训练过程中的自动微分，所以这两个课程要好好过一遍，官网介绍文档最好也要过一遍
1、零基础Mindspore：https://www.bilibili.com/video/BV1CS4y1z72r/?spm_id_from=333.337.search-card.all.click 在这里插入图片描述 2、MindSpore进阶课程：https://www.bilibili.com/video/BV12W4y1t7yn/?spm_id_from=333.337.search-card.all.click

3、Mindspore教程：MindSpore教程 — MindSpore master documentation
在这里插入图片描述

对这些课程和文档过一遍后，可以去看几个数据加载和模型训练的案例
最好是自定义数据集加载，因为大多数据集都是表格或者其它，图像分类案例较少
跑一下几个案例，理解他们的这个过程

二、框架转换过程注意事项

框架转换主要有以下基本，拿转换医学影像分割的来讲述（pytorch-》Mindspore）
官网也是有给网络迁移部分的要点说明的，也可以好好看看
在这里插入图片描述

转换之前一定要理解自己原有网络当中的每一部分的处理、每一部分的数据形态和类型，这样转换起来比较容易

1、数据集导入

判断好数据集是什么类型，能否用快捷方式加载，如果不能就自定义数据集，然后用GeneratorDataset进行加载
数据加载类，注意最后返回的要是两部分值，前者为数据，后者为标签
在这里插入图片描述

一定要这样，因为GeneratorDataset需要这种形式，期间的计算，每一步可以看看有无问题，形态和原有网络保持一致

2、网络结构搭建

2.1 如果已经有算法，也有网络，那就一层的对比着看，保证每层输入输出一样

在这里插入图片描述

2.2 对应的网络中的API计算，大多都能对应上，主要有部分会有细节差异，需要去官网查询对应API，填写适应参数

如这里和pytorch的就不一样，mindspore中的scale_factor不能和bilinear一起，所有要替换为其它插值方式，另外插值法方式也会影响padding的值
在这里插入图片描述

就是要保证每层的输入输出都一致，计算要正常，如这里mindspore不写stride=2就会导致后面的计算出问题
在这里插入图片描述

2.3 一点一点的对比和尝试，必须要保证网络重每一步的计算前和计算后的数据形态一样

最终的输出也是要保持一致，数据经过网络得到预测值，预测值的shape注意保持一致

3、模型训练

一定要保证数据的准确，在pytorch内是什么形式在mindspore内也要是
对于梯度和loos的计算，多打印出来看一看，虽然pytorch和mindspore训练过程有所不同，但整体还是相似的
在这里插入图片描述

注意label的shape要和模型输出的logit一样，这样才能计算loss，这里可能会有维度不相同，那就去掉无关维度即可，mindspore里也有squeeze，多看看文档
流程就是，训练step内使用gard_fn，进行自动微分计算（这里mindspore用了这就不用梯度清零了），自动微分计算value_and_grad中又会调用前向传播函数，前向传播中涉及到loos的计算，一般只要loss输出没有问题，那么其它都是小事情
注意各项的形式，很容易理解的还是

4、训练和评估

这个过程就很简单了，只要前面定义好训练step和其他的什么优化器、损失函数还有前向传播网络什么的，那么这就很简单了，获取可迭代数据进行一个batch一个batch的训练就行了，loss可以计算可以输出，模型的评估上mindspore里面也有提供一些自定义的评估，看需要用到什么，先去搜搜看，看看如何使用的，直接套用即可
在这里插入图片描述