当前位置: 首页 > news >正文

基于ESP32S3的链接大语言模型对话模块

本实物模块从实物外观、模块组成、API申请及功能说明四部分来介绍这款基于ESP32S3的大语言模型对话模块。

1、实物外观

13b24c44c92dd4f3d827dddcbb619a3d.jpeg

2、模块介绍

本硬件平台主要由三个模块组成,包括MAX9814录音模块、MAX98357音频功放模块和ESP32S3模块。如下图所示。

MAX9814录音模块:

1d7ba1396d1fa2894c20fd0f1750227d.jpeg

MAX98357音频功放模块:

e298eec511c8afabe5f384b6dd1775dc.jpeg

ESP32S3模块:

bd4c187fc237e4bff851009e09735e74.jpeg

3、API申请

本硬件平台需要用户自己申请3个API,分别是语音识别API、大语言模型API和语音合成API,本硬件平台用的语音识别API是百度智能云,大语言模型API是阿里通义千问,语音合成API是讯飞平台。因此,这里介绍上述三种API的申请方式,用户仅需在代码中更改API基础信息即可完成配置。

首先是百度语音识别API的申请:

搜索百度智能云并进入官网:

38794ad6f556a995783cfece9a5c2b1a.jpeg在官网中选择产品--语音技术--短语音识别标准版:

db4f5f769e780abc1b2bf7a865d63364.jpeg点立即使用,并登录百度账号:

cf8a95f01b924ee9b583f817589de0fa.jpeg

  1. 第一次用可以使用免费尝鲜获取一部分体验额度:

cb039bac7b4bcb4658aa83887cebdb0d.jpeg创建短语音识别应用,并获取API Key、Secret Key,以及通过调试获取token:

3168e0d581433f66edabd8366bbeca8c.jpeg

67adb63d143d03c8829f23a956a74ff4.jpeg

然后是阿里通义千问API的申请:

搜索阿里云并进入官网,扫码登录:

a3353b0b2cc0e4f8ed2ad7d5b0380b33.jpeg搜索Dashscope进入灵积服务模型:

b754294af102cbb2412d6016d6a2451d.jpeg

14a30dc31c62aca49f3860c759d77bde.jpeg进入API-KEY管理,创建新的API-Key:

1c1704f6aacfa008162d04f5a07632a0.jpeg

最后是讯飞语音合成API的申请:

首先搜索讯飞语音合成APi,并进入官网:

3471ea4d851e0d0b87613f8303095ae5.jpeg第一次使用有免费额度,直接领取个人免费套餐,进入登录界面:

f3040d8298d7ee4f3a5908b8d1649450.jpeg进入官网后领取完在线语音合成额度:

6156437397ad9a44224b49bef866076b.jpeg8724000ceec33536f45a8507f6121e1c.jpeg领取完额度后进入控制台创建新应用:

8bb84402c1413289913b1b77181e80ff.jpeg创建完之后就能获取APPID、APISecret、APIKey:

3cbb2d17dc85d84aa83c834b89255331.jpeg

以上就是所有API的申请教程。

4、功能介绍

本硬件平台可以实现链接开源大语言对话模型,并与其实时对话的功能。具体操作步骤如下:

第一步是上电,此时系统会介绍一下自己,上下两个LED都不亮;

f368c6b7430e9d0e0cdcfcb8296c49ff.jpeg

第二步是按下录音按钮,上面的LED开始常亮。此时可以与系统对话,录音时间为5s,上面LED灭后,表示录音结束。

fb916c4a4db66eb82631ee3dbd9bd530.jpeg

等待2-3s之后,系统输出大语言模型反馈结果,并通过喇叭发声的方式输出,此时下面的LED会亮,输出结束之后下面的LED会灭。

60fef658dbcc0b414f4b86e3512ca585.jpeg

本文大部分内容都属于原创,如需转载,请附上本文网站,
如果需要相关的仿真图、程序代码等资料可以直接私信我,我会及时回复。
 

http://www.lryc.cn/news/440737.html

相关文章:

  • Cpp输出多字符常量警告
  • Maven从入门到精通(二)
  • 【Kubernetes】常见面试题汇总(二十四)
  • 最低成本的游戏串流方案分享 如何自己打造云电脑?
  • python运行时错误:找不到fbgemm.dll
  • 给虚拟机linux系统安装交叉编译工具链
  • Redhat 7,8系(复刻系列) 一键部署Oracle21c-xe rpm
  • Web植物管理系统-下位机部分
  • leetcode169. 多数元素
  • 从大脑图谱/ROI中提取BOLD信号
  • Java-数据结构-优先级队列(堆)-(一) (;´д`)ゞ
  • 工厂模式(二):工厂方法模式
  • 【洛谷】P11036 【MX-X3-T3】「RiOI-4」GCD 与 LCM 问题 的题解
  • MyBatis系统学习(三)——动态SQL
  • get_property --Cmakelist之中
  • 【Redis】Redis 典型应用 - 分布式锁原理与实现
  • Pybind11的使用
  • 鸿蒙-沉浸式pc端失效
  • 【资料分析】刷题日记1
  • nodejs+express+vue教辅课程辅助教学系统 43x2u前后端分离项目
  • 96-javahashmap底层原理
  • AI逻辑推理入门
  • 力扣3014.输入单词需要的最少按键次数I
  • 【Git】远程仓库
  • 苹果手机铃声怎么设置自己的歌?3个方法自定义手机铃声
  • 828华为云征文|华为Flexus云服务器搭建Cloudreve私人网盘
  • 【AI学习】AI绘画发展简史
  • 使用LangChain创建简单的语言模型应用程序【快速入门指南】
  • 嵌入式人工智能项目及人工智能应用项目——大合集列表查阅
  • 心觉:成功学就像一把刀,有什么作用关键在于使用者(一)