当前位置: 首页 > news >正文

【正点原子i.MX93开发板试用连载体验】中文提示词的训练

本文首发于电子发烧友论坛:【正点原子i.MX93开发板试用连载体验】基于深度学习的语音本地控制 - 正点原子学习小组 - 电子技术论坛 - 广受欢迎的专业电子论坛!

好久没有更新了,今天再来更新一下。

我们用前面提到的录音工具录制了自己的中文语音,包括“打开”和“关闭”各100条,同时我们从谷歌的mini_speech_commands样本集里面随机挑选了100条作为"unknown”的样本,三个类别的数据个数要尽量相同,否则训练出来的结果会有倾向性。然后,开始自己的训练过程。

我所使用的是阿里云的PAI-DSW进行在线训练,平台的使用非常方便,避免了在本机上进行繁琐的设置工作。我采用的训练笔记本是TensorFlow的Simple audio recognition: Recognizing keywordssimple_audio_pi/simple_audio_train_numpy.ipynb

 

a68f53c44ea45bef54846ab9e163975b.png

将脚本上传后,直接打开,就可以看到笔记本了。

笔记本的操作和其他平台差不多,就不详细介绍了。

我把准备的语音数据上传到data/speech目录下,共有3个子目录,分别是open、close和unknown。然后修改脚本中关于data_dir的设置。

`data_dir = pathlib.Path('data/speech')` 

然后修改了训练集、验证集和测试集的数量设置。

train_files = filenames[:350] 
val_files = filenames[250: 250 + 100] 
test_files = filenames[-100:] 

然后就按照笔记本里面的步骤执行就可以了。

数据量不大,训练只用了数秒就完成了。

使用一个样本进行测试,可以正确得到打开的结果。

 

1017d4e03815acf74d62057b0fb81498.png

最后可以得到tflite格式的文件,用于在开发板上的测试。

将tflite格式的文件拷贝到开发板上,并修改前面的测试程序中的模型文件路径和commands设置就可以使用中文的“打开”、“关闭”进行控制了。视频稍后将上传到B站,欢迎大家观看。

 

http://www.lryc.cn/news/415074.html

相关文章:

  • WordPress资源下载类主题 CeoMax-Pro_v7.6绕授权开心版
  • 使用GCC编译Notepad++的插件
  • 技术周总结 2024.07.29 ~ 08.04周日(MyBatis, 极限编程)
  • C语言调试宏全面总结(六大板块)
  • unity万向锁代数法解释
  • stm32入门学习10-I2C和陀螺仪模块
  • GDB常用指令
  • Nginx 高级 扩容与高效
  • pythonflaskMYSQL自驾游搜索系统32127-计算机毕业设计项目选题推荐(附源码)
  • C++ vector的基本使用(待补全)
  • Java 属性拷贝 三种实现方式
  • Java-变量,运算符,输入与输出
  • 五、一个quad同时支持pcie和sfp两种高速接口的ref时钟配置
  • AI辅助教育:九章大模型的数学辅导功能解析
  • 力扣刷题之3128.直角三角形
  • OD C卷 - 机场航班调度
  • uni-app中使用支付宝扫码插件并且在真机调试时使用(详细教程)
  • 每日学术速递8.5—1
  • 1、操作系统相关概念
  • 【ModelSim】仿真问题记录
  • 如何提高深度学习中数据运行的稳定性
  • 【连续数组】python刷题记录
  • JavaScript青少年简明教程:DOM和CSS简介
  • 架构师知识梳理(一):计算机硬件
  • 从根儿上学习spring 四 之run方法启动第一段
  • 智能闹钟如何判断用户已经醒了?
  • 【算法】动态规划解决背包问题
  • day09 工作日报表
  • C++学习之路(1)— 第一个HelloWorld程序
  • python3 pyside6图形库学习笔记及实践(三)