当前位置: 首页 > news >正文

本地部署_语音识别工具_Whisper

1 简介

Whisper 是 OpenAI 的语音识别系统(几乎是最先进),它是免费的开源模型,可供本地部署。

2 docker

https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice

3 github

https://github.com/ahmetoner/whisper-asr-webservice

4 运行

nvidia-docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu

image 大小:11.5G
运行后,即可在9000端口通过swagger调用,我先用手机录了一些简单的中文,识别效果还不错,除了第一次调用时可能是下载和加载模型时间比较长,后面再调用速度就很快。
又用它识别了一个25分钟的mp3(约27M),是一位小哥哥B站视频对应的音频文件,识别时间约为不到1分钟,使用GPU内存占用在1G之内,尽管有一小部分乱码和一些重复,但整体效果不错。
我觉得速度和效果都相当美丽,绝对可以作为一些收费产品的平替了~~

5 注意事项

  • 上传的音频文件使用时尽量不要用中文文件名
http://www.lryc.cn/news/229003.html

相关文章:

  • 秋招求职经验分享
  • DNS域名解析
  • Flink SQL --命令行的使用(02)
  • 【nlp】1.3 文本数据分析(标签数量分布、句子长度分布、词频统计与关键词词云)
  • 路由器的结构以及工作原理
  • DefaultListableBeanFactory
  • NSF服务器
  • 10 Go的映射
  • 瑞萨e2studio(29)----SPI速率解析
  • mysql的主从复制,读写分离
  • 小米路由器4A千兆版刷入OpenWRT并远程访问
  • 【golang】探索for-range遍历实现原理(slice、map、channel)
  • 依赖倒转原则接口隔离原则迪米特法则合成复用原则
  • MATLAB | 官方举办的动图绘制大赛 | 第一周赛情回顾
  • 适配器模式 rust和java的实现
  • 竞赛 题目:垃圾邮件(短信)分类 算法实现 机器学习 深度学习 开题
  • wpf devexpress项目中添加GridControl绑定数据
  • 2023亚太杯数学建模A题思路解析
  • Spark3.0中的AOE、DPP和Hint增强
  • 算法笔记-第五章-质因子分解
  • 适用于WPF的设计模式
  • C++与多态
  • ios 对话框UIAlertController放 tableview
  • 警告:新版Outlook会向微软发送密码、邮件和其他数据
  • 数据结构C语言--基础实验
  • wireshark抓包并进行Eigrp网络协议分析
  • 力扣刷题-二叉树-二叉树的层序遍历(相关题目总结)
  • fundamental notes in 3D math
  • 【Java 进阶篇】JQuery DOM操作:舞动网页的属性魔法
  • 腾讯云5年云服务器还有吗?腾讯云5年时长服务器入口在哪?