当前位置: 首页 > news >正文

ASR-LLM-TTS 大模型对话实现案例;语音识别、大模型对话、声音生成

参考:https://blog.csdn.net/weixin_42357472/article/details/136305123(llm+tts)
https://blog.csdn.net/weixin_42357472/article/details/136411769 (asr+vad)

这里LLM用的是chatglm;电脑声音播报用的playsound

1、实时语音识别版本

注意:暂时这项目有个缺陷就是tts的喇叭声音严重影响到asr麦克风的识别,需要一些回声消除技术才行;参考:https://m.baike.com/wikiid/5493873983385561108

代码:

##运行
python main.py

在这里插入图片描述

main.py

from multiprocessing import Process, Pipe
import requests
import json
from playsound import playsoundfrom asr_vad import main##llm
def ge
http://www.lryc.cn/news/328088.html

相关文章:

  • 主干网络篇 | YOLOv8更换主干网络之EfficientNet
  • Web开发-Django学习笔记
  • 关于深度学习的 PyTorch 项目如何上手分析?从什么地方切入?
  • JavaEE企业开发新技术4
  • CSS使用JS变量
  • 拆分巨石:将MVPS和MVAS应用于遗留应用程序——可持续架构(六)
  • Linux renice命令教程:如何优雅地调整进程优先级(附案例详解和注意事项)
  • Gitea 的详细介绍
  • Kotlin object
  • 【Redis】数据类型、事务执行、内存淘汰策略
  • Python Flask Web框架初步入门
  • 【设计模式】工厂方法模式详解
  • 独立游戏《星尘异变》UE5 C++程序开发日志3——UEC++特供的数据类型
  • 递归方法的理解
  • css之flex布局文本不换行不显示省略号的解决方法
  • 华清远见STM32U5开发板助力2024嵌入式大赛ST赛道智能可穿戴设备及IOT选题项目开发
  • 若依框架实现不同端用户登录(后台管理用户和前台会员登录——sping security多用户)
  • 【解決|三方工具】Obi Rope 编辑器运行即崩溃问题
  • 岭师大数据技术原理与应用-序章-软工版
  • Leetcode 680. 验证回文串 II
  • 网络安全接入认证-802.1X接入说明
  • iPhone的iOS系统:定义移动智能体验,引领科技潮流之巅
  • 计算机网络:传输控制协议(Transmission Control Protocol-TCP协议
  • GEE实践应用|热岛效应(一)地表温度计算
  • Java查找算法知识点(含面试大厂题和源码)
  • 67、yolov8目标检测和旋转目标检测算法部署Atlas 200I DK A2开发板上
  • A Little Is Enough: Circumventing Defenses For Distributed Learning
  • 文心一言 VS 讯飞星火 VS chatgpt (225)-- 算法导论16.3 7题
  • 【计算机】——51单片机——持续更新
  • QT资源添加调用