当前位置：首页 > news >正文

ASR-LLM-TTS 大模型对话实现案例；语音识别、大模型对话、声音生成

news 2025/8/18 4:39:54

参考：https://blog.csdn.net/weixin_42357472/article/details/136305123（llm+tts）
https://blog.csdn.net/weixin_42357472/article/details/136411769 （asr+vad）

这里LLM用的是chatglm；电脑声音播报用的playsound

1、实时语音识别版本

注意：暂时这项目有个缺陷就是tts的喇叭声音严重影响到asr麦克风的识别，需要一些回声消除技术才行；参考：https://m.baike.com/wikiid/5493873983385561108

代码：

##运行
python main.py

在这里插入图片描述

main.py

from multiprocessing import Process, Pipe
import requests
import json
from playsound import playsoundfrom asr_vad import main##llm
def ge

http://www.lryc.cn/news/328088.html

相关文章：

主干网络篇 | YOLOv8更换主干网络之EfficientNet

Web开发-Django学习笔记

关于深度学习的 PyTorch 项目如何上手分析？从什么地方切入？

JavaEE企业开发新技术4

CSS使用JS变量

拆分巨石：将MVPS和MVAS应用于遗留应用程序——可持续架构（六）

Linux renice命令教程：如何优雅地调整进程优先级(附案例详解和注意事项)

Gitea 的详细介绍

【Redis】数据类型、事务执行、内存淘汰策略

Python Flask Web框架初步入门

【设计模式】工厂方法模式详解

独立游戏《星尘异变》UE5 C++程序开发日志3——UEC++特供的数据类型

递归方法的理解

css之flex布局文本不换行不显示省略号的解决方法

华清远见STM32U5开发板助力2024嵌入式大赛ST赛道智能可穿戴设备及IOT选题项目开发

若依框架实现不同端用户登录（后台管理用户和前台会员登录——sping security多用户）

【解決|三方工具】Obi Rope 编辑器运行即崩溃问题

岭师大数据技术原理与应用-序章-软工版

Leetcode 680. 验证回文串 II

网络安全接入认证-802.1X接入说明

iPhone的iOS系统：定义移动智能体验，引领科技潮流之巅

计算机网络：传输控制协议（Transmission Control Protocol-TCP协议

GEE实践应用|热岛效应（一）地表温度计算

Java查找算法知识点（含面试大厂题和源码）

67、yolov8目标检测和旋转目标检测算法部署Atlas 200I DK A2开发板上

A Little Is Enough: Circumventing Defenses For Distributed Learning

文心一言 VS 讯飞星火 VS chatgpt （225）-- 算法导论16.3 7题

【计算机】——51单片机——持续更新

QT资源添加调用