当前位置: 首页 > news >正文

运行Whisper笔记(1)

最近chatGPT很火,就去逛了一下openai的github项目。发现了这个项目。
这个项目可以识别视频中的音频,转换出字幕。
带着一颗好奇的心就尝试自己去部署玩一玩
跟着这篇文章一步步来进行安装,并且跟着这篇文章解决途中遇到的问题。

途中还会遇到几个问题:总结一下:
1、下载cuDNN时会提示叫你登录Navia的账号,我登录的时候发现内地、香港、新加坡的IP登录不了nvdia-develop的官网,换成美国IP则很顺利。这。。。。
2、Ptyhton版本别使用太高的,防止后续pip找不到相关的版本。我原本使用的3.11,后面因为提示找不到相应的版本,换成3.10解决
3、pip运行whisper还会提示缺少一些依赖,直接pip install相关依赖来解决问题

使用效果:
自己的电脑不知道为啥运算很慢,只有百来K每秒,尝试使用CPU或者GPU的参数,速度始终提不上去。CPU以及GPU的利用率也很低很低。我使用的cuda版本为11.8.
识别效果,简单的用了下tiny模式,发现虽然识别有错误,但是的确识别出来了。静等openai更新后续版本再试试效果
![在这里插入图片描述](https://img-blog.csdnimg.cn/0438698ab3c942189a5dad7bf9860f89.png#pic_center
在这里插入图片描述

http://www.lryc.cn/news/177.html

相关文章:

  • 2023年最强大的12款数据可视化工具,值得收藏
  • LeetCode刷题系列 -- 523. 连续的子数组和
  • LeetCode刷题系列 -- 525. 连续数组
  • JavaEE15-Spring Boot统一功能处理
  • centos7.6 设置防火墙
  • 在线支付系列【22】微信支付实战篇之集成服务商API
  • 3.2 埃尔米特转置
  • Python爬虫之Scrapy框架系列(13)——实战ZH小说爬取数据入MySql数据库
  • MySQL篇02-三大范式,多表查询
  • vue-cli3创建Vue项目
  • Linux perf probe 的使用(三)
  • python GUI编程 多窗口跳转
  • nuxt 学习笔记
  • Python编程自动化办公案例(1)
  • 一站式 Elasticsearch 集群指标监控与运维管控平台
  • C# 调用Python
  • 51单片机最强模块化封装(3)
  • 【CSS 布局】水平垂直居中
  • 【C++】类和对象--类的6个默认成员函数
  • 常见面试题---------如何处理MQ消息丢失的问题?
  • 十四、Linux网络:高级IO
  • 带你走进API安全的知识海洋
  • 【Java】TCP的三次握手和四次挥手
  • JUC并发编程
  • 概率统计·假设检验【正态总体均值的假设检验、正态总体方差的假设检验】
  • 如何预测机组设备健康状态?你可能需要这套解决方案
  • C++类和对象:面向对象编程的核心。| 面向对象还编什么程啊,活该你是单身狗。
  • CUDA虚拟内存管理
  • 线程池小结
  • vue3状态管理模式 Pinia