当前位置: 首页 > news >正文

实时语音识别(Python+HTML实战)

项目下载地址:FunASR

1 安装库文件

项目提示所需要下载的库文件:pip install -U funasr 和 pip install modelscope

运行过程中,我发现还需要下载以下库文件才能正常运行:

下载:pip install websockets,pip install ffmpeg

2 运行 .py 文件

运行 FunASR-main/runtime/python/websocket/funasr_wss_server.py 文件,加载模型

注:如果提示缺少什么模型,就 pip 下载什么模型

部署本地的情况下需要修改默认 host 值 "0.0.0.0" 为 "127.0.0.1":

  • --host:是 FunASR runtime-SDK 服务部署机器的 ip,默认为本机 ip(127.0.0.1),如果 client 与服务不在同一台服务器,需要改为部署机器 ip
  • --port:10095 是部署的端口号

成功运行结果如下: 

.cache\modelscope\hub\iic\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch\model.pt

.cache\modelscope\hub\iic\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online\model.pt

.cache\modelscope\hub\iic\speech_fsmn_vad_zh-cn-16k-common-pytorch\model.pt

.cache\modelscope\hub\iic\punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727\model.pt

 提示如下内容,说明模型已经加载完毕:

3 运行 .html 文件 

运行 FunASR-main/runtime/html5/static/index.html 文件,加载项目主页面

第一个 asr 服务器的地址填入:

wss://127.0.0.1:10095

点击左下角的连接按钮,回到 Pycharm 运行界面提示连接成功!

4 结果展示

该项目支持麦克风实时录音功能,同时可以传入多种音频格式的文件(如 .wav, .pcm, .mp3 等),也支持视频输入(如 .mp4 等),以及多文件列表 wav.scp 输入。

http://www.lryc.cn/news/328185.html

相关文章:

  • x86_64 ubuntu22.04编译MetaRTC
  • FreeRTOS day1
  • SqlSugar快速入门
  • 基于el-table实现行内增删改
  • 《霍格沃茨之遗》推荐购买吗 《霍格沃茨之遗》不支持Mac电脑怎么办 crossover24软件值得买吗 crossover中文官网
  • 神经网络代码实现(用手写数字识别数据集实验)
  • 菜鸟笔记-Python函数-linspace
  • 为什么我们应该使用QGIS
  • 用Python实现办公自动化(自动化处理Excel工作簿)
  • BaseDao入门使用
  • 计算机毕业设计Python+Spark知识图谱高考志愿推荐系统 高考数据分析 高考可视化 高考大数据 大数据毕业设计 机器学习 深度学习 人工智能
  • 基于java+springboot+vue实现的电商个性化推荐系统(文末源码+Lw+ppt)23-389
  • 论文阅读,The Lattice Boltzmann Method: Principles and Practice(六)(1)
  • 新能源充电桩站场视频汇聚系统建设方案及技术特点分析
  • 三、音频隐写[Audacity、deepsound、dtmf2num、MMSSTV、虚拟声卡、MP3Stego]
  • 二、Web3 学习(区块链)
  • Linux内网提权
  • 聚观早报 | 抖音独立商城App上线;阿里云联发科合作
  • 第十四届蓝桥杯省赛C++ B组所有题目以及题解(C++)【编程题均通过100%测试数据】
  • 【御控物联】 IOT异构数据JSON转化(场景案例一)
  • Kubernetes-running app on kube
  • 简述如何系统地学习Python
  • bsd猜想 Murmuration of Eliptic Curves(笔记)
  • 小米汽车正式发布:开启智能电动新篇章
  • 线性代数笔记25--复数矩阵、快速傅里叶变换
  • 洛谷 P8783 [蓝桥杯 2022 省 B] 统计子矩阵
  • Rust 实战练习 - 8. 内存,ASM,外挂 【重磅】
  • XUbuntu22.04之Typora快捷键Ctrl+5不生效问题(二百二十六)
  • GRE_MGRE综合实验
  • 把组合损失中的权重设置为可学习参数