在FP32输入上计算前向传播需要多长时间?FP16模型的实例与之前的模型相比,它快了多少?
下面的 MixedModel 类使用作为参数提供的数据类型创建了一个非常简单的两层模型:
class MixedModel(nn.Module):
def init (self, dtype):
super(). init
下面的 MixedModel 类使用作为参数提供的数据类型创建了一个非常简单的两层模型:
class MixedModel(nn.Module):
def init (self, dtype):
super(). init