当前位置: 首页 > news >正文

音频文件分析-- whisper(python 文档解析提取)

使用whisper转文本,这里使用的是large-v3版本

pip install git+https://github.com/openai/whisper.git 
import whisper
import os
from tqdm import tqdmmodel = whisper.load_model("large-v3")path = "rag_data"
for fi in tqdm(os.listdir(path)):file = os.path.join(path, fi)result = model.transcribe(file)text = result["text"]with open(os.path.join("rad_all_texts", file.split('.')[0] + ".txt"), 'a') as f:f.write(text + '\n')

参考

Introducing Whisper
OpenAI Whisper 新一代语音技术(更新至v3)
fine-tune-whisper
Whisper-Finetune

http://www.lryc.cn/news/347880.html

相关文章:

  • Python深度学习基于Tensorflow(3)Tensorflow 构建模型
  • 火爆多年的抖音小店,2024年想要入驻需要什么条件呢?
  • STM32G030C8T6:EEPROM读写实验(I2C通信)
  • 使用Git管理github的代码库-上
  • 经典文献阅读之--D-Map(无需射线投射的高分辨率激光雷达传感器的占据栅格地图)
  • 开源免费的定时任务管理系统:Gocron
  • 从零开始详解OpenCV车道线检测
  • 【Java代码审计】逻辑漏洞篇
  • SSH简介
  • Oracle的高级分组函数grouping和grouping_id
  • SqlServer 查询数据库 和 数据表 大小的语句
  • 特殊类的设计与单例模式
  • MySQL从入门到高级 --- 6.函数
  • Qt---信号和槽
  • POCEXP编写—文件上传案例
  • C#知识|上位机UI设计-详情窗体设计思路及流程(实例)
  • 目标检测——印度车辆数据集
  • Zotero Word中插入带超链接的参考文献
  • 如何在服务器上下载,解压github上的代码
  • BGP学习二:BGP通告原则,BGP反射器,BGP路径属性细致讲解,新手小白无负担
  • Docker学习(带图详细)
  • RabbitMQ 如何使用延迟队列
  • 【C++】栈和队列
  • 常用的预编码算法学习
  • 人才培养计划大纲
  • 多语言环境下的正则表达式实战:校验整数、小数
  • 过拟合和欠拟合的学习
  • 中间件的使用
  • 阿里云OSS权限开通步骤及最佳实践
  • 【Python贪吃蛇】:编码技巧与游戏设计的完美结合