当前位置: 首页 > news >正文

《昇思25天学习打卡营第4天 | mindspore Transforms 数据变换常见用法》

1. 背景:

使用 mindspore 学习神经网络,打卡第四天;

2. 训练的内容:

使用 mindspore 的常见的数据变换 Transforms 的使用方法;

3. 常见的用法小节:

支持一系列常用的 Transforms 的操作

3.1 Vision Transforms 操作:

Rescale: 缩放,平移因子
Normalize: 图像归一化
HWC2CHW: 转换图像格式

# 接收一个数据增强操作序列,然后将其组合成单个数据增强操作
composed = transforms.Compose([vision.Rescale(1.0 / 255.0, 0),vision.Normalize(mean=(0.1307,), std=(0.3081,)),vision.HWC2CHW()]
)train_dataset = train_dataset.map(composed, 'image')
image, label = next(train_dataset.create_tuple_iterator())
print(image.shape)

3.2 Text Transforms

文本数据需要有分词(Tokenize)、构建词表、Token转Index等操作。这里简单介绍其使用方法

Tokenizer

# Tokenizer允许用户自由实现分词策略。随后我们利用map操作将此分词器应用到输入的文本中,对其进行分词
texts = ['Welcome to Beijing']
test_dataset = GeneratorDataset(texts, 'text')def my_tokenizer(content):return content.split()test_dataset = test_dataset.map(text.PythonTokenizer(my_tokenizer))
print(next(test_dataset.create_tuple_iterator()))

生成词表

# 使用Vocab生成词表。这里我们选择使用Vocab.from_dataset方法从数据集中生成词表
vocab = text.Vocab.from_dataset(test_dataset)
print(vocab.vocab())# 转成 Index
test_dataset = test_dataset.map(text.Lookup(vocab))
print(next(test_dataset.create_tuple_iterator()))

3.3 Lambda Transforms

通过 lambda 函数进行 transforms 变化

# Lambda函数是一种不需要名字的函数
test_dataset = GeneratorDataset([1, 2, 3], 'data', shuffle=False)
test_dataset = test_dataset.map(lambda x: x * 2)
print(list(test_dataset.create_tuple_iterator()))def func(x):return x * x + 2test_dataset = test_dataset.map(lambda x: func(x))print(list(test_dataset.create_tuple_iterator()))

活动参与链接:

https://xihe.mindspore.cn/events/mindspore-training-camp

http://www.lryc.cn/news/388065.html

相关文章:

  • 【Python时序预测系列】基于LSTM实现多输入多输出单步预测(案例+源码)
  • git客户端工具之Github,适用于windows和mac
  • ai除安卓手机版APP软件一键操作自动渲染去擦消稀缺资源下载
  • Unity获取剪切板内容粘贴板图片文件文字
  • 利用谷歌云serverless代码托管服务Cloud Functions构建Gemini Pro API
  • 极狐GitLab 17.0 重磅发布,100+ DevSecOps功能更新来啦~【一】
  • python实现符文加、解密
  • 【解释】i.MX6ULL_IO_电气属性说明
  • 02-《石莲》
  • MySQL之聚簇索引和非聚簇索引
  • Web后端开发之前后端交互
  • 520. 检测大写字母 Easy
  • vue的跳转传参
  • docker配置镜像源
  • MySQL高级-SQL优化-insert优化-批量插入-手动提交事务-主键顺序插入
  • 认识100种电路之振荡电路
  • SSH 无密登录配置流程
  • Python自动化运维 系统基础信息模块
  • 如何安装和配置Monit
  • 【redis】redis分片集群基础知识
  • Python 面试【★★★★】
  • Knife4j 2.2.X 版本 swagger彻底禁用
  • linux下mysql的定时备份
  • 【13】地址-比特币区块链的地址
  • 【数据结构】数据结构前置知识
  • 企业数据挖掘平台产品特色及合作案例介绍
  • C++初学者指南-3.自定义类型(第一部分)-基本自定义类型/类
  • iOS之如何创建.framework静态库
  • C程序设计谭浩强第五版
  • 石油化工厂为什么要用专业防爆手机?