当前位置: 首页 > news >正文

聆思CSK6大模型开发板英语评测类开源SDK详解

离线英文评测算法SDK

能力简介

CSK6 大模型开发套件可以对用户通过语音输入的英文单词进行精准识别,并对单词的发音、错读、漏读、多读等方面进行评估,进行音素级的识别,根据用户的发音给出相应的建议和纠正,帮助用户更好地掌握单词的发音。

离线单词评测 算法具备以下特性:

  • 支持单词评测,评测准确率98%以上
  • 支持音素级识别
  • 支持单词发音评分
  • 支持识别无效评测音频

功能交互展示

视觉语音大模型AI开发套件SDK 配套了离线英文评测这一示例工程,文本将对本示例工程进行说明。

1.固件运行后,可以在显示屏上看到 单词评测 的图标,点击图标即可进入单词评测应用:

2.目前固件提供了三种单词短语句子评测模式,点击对应选项课进入对应的模式:

3.以单词评测为例,进入该模式后,固件将给出若干个英文单词,可点击右下角评测按钮进行评测:

4.对着开发套件读出单词后,点击右下角图标结束评测,固件将给出此次评测的结果:

离线英译中SDK

能力简介

基于transformer模型,使用聆思科技开源的AI生态工具链LNN(ListenAI Neural Network),完成中英翻译任务的训练、量化、模型转换、仿真调试等一系列步骤,并实现在聆思CSK6芯片上进行推理。

SDK提供的示例集成了这个模型,可以让聆思CSK6开发板实现英译中功能,可用于体验离线翻译功能。

触摸屏UI交互翻译

固件烧录完毕后,程序将自动运行,您也可以通过复位按键(RST)对程序进行复位,复位后的UI界面如下:

  • 点击画面中心的输入框,可通过屏幕上显示的键盘输入句子
  • 点击输入框左侧的按钮,可随机填入一句演示的句子
  • 点击下方翻译按钮,即可输出改句子的中文翻译

UART串口交互翻译

本示例也支持通过串口 UART 进行离线翻译,操作如下:

  • 打开 聆思在线串口终端,选择开发板对应的串口,点击连接

在下方输入框输入待翻译的英文内容,点击发送按钮,即可在接收区查看到翻译后的中文结果。

离线字母拼读算法SDK

能力简介

CSK6 大模型开发套件可以对用户的语音输入进行字母(a~z)的识别,通过语音拼读单词字母,快速准确地查询单词的发音和含义,可应用于扫描词典笔、单词卡、学习机等产品。

可以对用户的语音输入进行字母(a~z)的识别,通过语音拼读单词字母,快速准确地查询单词的发音和含义。

功能交互展示

聆思 CSK6 大模型开发套件出厂集成提供了字母拼读算法的示例,长按即可加载示例进行使用,无需联网。

1.固件运行后,可以在显示屏上看到操作提示词:

2.按住按键进行单词拼读:

3.拼读完成后,固件将会给出单词的发音和含义:

 SDK资源下载

以上3个离线英语评测SDK可以在以下地址下载:

1、 语音视觉大模型开发板 SDK:https://cloud.listenai.com/CSKG962172/duomotai_ap/-/tree/master/

  • 字母拼读:apps目录下,工程目录名称为 lcd_wsp

  • 英文评测: apps目录下,工程目录名称为 lcd_csps

  • 英译中: apps/thinker_service目录下,工程目录名称为 translation

2、离线英译中transformer模型项目地址:GitHub - dwzhang00/Offline-translation: An offline translation model based on transformer

补充开发板信息

开发板具备丰富语音图像功能与硬件外设的开发板,采用有着丰富组件生态的 Zephyr RTOS 作为操作系统,默认配套开箱即玩的 AI 应用,也可以配合聆思的模型训练推理工具 LNN 将自己的算法模型部署至芯片上,构建自己的 AI 应用,开发板详情参考:https://docs2.listenai.com/x/nTn9kMMCU

http://www.lryc.cn/news/372279.html

相关文章:

  • 通用大模型VS垂直大模型,你更青睐哪一方?
  • Python第二语言(十四、高阶基础)
  • python脚本之调用其他目录脚本
  • C# 事件(Event)定义及其使用
  • 2.负载压力测试
  • 【AI工具】jupyter notebook和jupyterlab对比和安装
  • Linux 基本指令3
  • 在Linux系统中,可以使用OpenSSL来生成CSR(Certificate Signing Request)、PEM格式的公钥和PEM格式的私钥。
  • 【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 团队派遣(100分) - 三语言AC题解(Python/Java/Cpp)
  • Python数据分析与机器学习在医疗诊断中的应用
  • vite.config.js如何使用env的环境变量
  • MySql几十万条数据,同时新增或者修改
  • 如何提高MySQL DELETE 速度
  • 本地Zabbix开源监控系统安装内网穿透实现远程访问详细教程
  • 从Android刷机包提取System和Framework
  • 分布式光纤测温DTS与红外热成像系统的主要区别是什么?
  • python数据分析-问卷数据分析(地理课)
  • 【ARM64 常见汇编指令学习 19.3 -- ARMv8 三目运算指令 csel 详细介绍】
  • Docker 安装部署(CentOS 8)
  • Python自动化
  • 自然语言处理领域的重大挑战:解码器 Transformer 的局限性
  • 【机器学习】机器学习赋能医疗健康:从诊断到治疗的智能化革命
  • Elasticsearch6.7版本,内网中其他电脑无法连接
  • 交友系统定制版源码 相亲交友小程序源码全开源可二开 打造独特的社交交友系统
  • 数据结构笔记39-48
  • 2-3 基于matlab的NSCT-PCNN融合和创新算法(NSCT-ML-PCNN )图像融合
  • 机器学习笔记 - LoRA:大型语言模型的低秩适应
  • 基于python实现视频和音频长度对齐合成并添加字幕
  • 爬虫-模拟登陆博客
  • 【深度学习】【NLP】Bert理论,代码