当前位置：首页 > news >正文

音转文工具，9.8k star! 【送源码】

news 2025/8/2 20:28:01

我们经常会遇到将音频转为文字的情况，比如在开会时录音的会议纪要、上课时录下的老师讲课内容。虽然网上也有一些在线的工具可以将音频转为文字，但是考虑到数据安全和费用问题，使用起来也不是很方便。

今天了不起给大家介绍一款开源工具——Buzz，他可以让你在本地离线的识别音频并转换成文字。

项目介绍

Buzz 是一款开源的语音转文字工具，它能够实时将语音转换为文字，支持多种操作系统，包括 Windows、macOS 和 Linux。它不仅支持实时语音识别，还能将视频和音频文件转换成文字或字幕，极大地方便了内容创作者、翻译工作者和广大用户。

项目使用

因为是跨平台的工具，Windows 用户可以在 release 页面下载安装包，Mac 用户可以使用 brew install --cask buzz 命令安装应用。

打开应用，可以看到界面非常简洁：

点击上方菜单栏的“➕”，可以选择音频文件。之后在弹出的对话框中选择要使用的模型、任务以及语言。这里我们就使用默认的 Whisper 的 base 模型，任务选择“Transcribe”即可将语音转换为文字。

点击“Run”按钮后，软件会自动下载模型文件，并进行转换。转换完毕的任务会在首页列表显示，如图：

双击任务，即可查看转换成功的文字，如图：

你可以在这个页面查看每句话的所在的音频时间，并且播放音频。还可以点击右下角的下载按钮，将文件导出为 txt 格式或者 srt 的字幕格式。

当然，Buzz 还支持实时的语音转文字和翻译功能。首页点击左上角的小麦克风按钮，即可进入实时录音的界面。依旧是配置好使用的模型和任务类型，点击“Record”按钮，即可实时的转换文字了。

总结

随着开源的大型模型日益增多，以及 GitHub 上涌现的众多整合了这些大型模型的工具，我们得以以更低的门槛在个人电脑上运行这些模型，从而帮助我们完成更多的工作。Buzz 就是这么一款使用方便的语音转文字工具，如果你有类似的需求，就赶快去试试吧。

项目地址：https://github.com/chidiwilliams/buzz

—— EOF ——

给大家分享一套基于Springboot+Vue的图书管理系统源码，在实际项目中可以直接复用。(免费提供，文末自取)

一、系统运行图（设计报告和接口文档）

1、登陆页面

2、后台页面

3、设计报告包含接口文档

二、系统搭建视频教程

源码免费领取方式

扫码后台回复 图书

查看全文

http://www.lryc.cn/news/344395.html

【首次发布】华为 OD 机试 C卷抽中题库清单（真题库），目前华为OD机考以C卷为主，特殊情况会发送D卷

【进程等待】waitpid的参数pid | status的位图位操作WIFEXITEDWEXITSTATUS宏

unity---常用API

设计模式: 模板模式

[虚拟机+单机]梦幻契约H5修复版_附GM工具

头文件相互包含前向声明

七款好用的上网行为管理软件推荐 |有没有好用的上网行为管理系统

centos7-bcc 安装

5.06号模拟前端面试8问

解读Inscode AI：开启代码智能化的新时代

快速了解Vuex

vue管理系统导航中添加新的iconfont的图标

Docker的介绍及与传统虚拟化技术的区别

06.Git远程仓库

Anaconda安装和深度学习环境的安装(TensorFlow、Pytorch)

元素设置 flex：1，但是会被内部长单词宽度超出拉伸

win11 安装oracle11g详细流程及问题总结

自我模拟面试

头歌java面向对象基础

PMP课程知识点很多，无法入手，该如何学习？

隔离流量优化网络传输

芒果YOLOv8改进164:检测头篇:ImplicitHead 隐性知识检测头| 即插即用，独家新颖更新，精度高效涨点

学习周报：文献阅读+Fluent案例+有限体积法理论学习

用户中心（下）

商务分析方法与工具（六）：Python的趣味快捷-字符串巧妙破解密码本、身份证号码、词云图问题

ftp方式和http方式搭建云仓库

vue2 + antvx6 实现流程图功能

IDEA 中的奇技淫巧

LSTM-KDE的长短期记忆神经网络结合核密度估计多变量回归区间预测（Matlab）

项目介绍

项目使用

总结

​一、系统运行图（设计报告和接口文档）

二、系统搭建视频教程

源码免费领取方式

相关文章：

一、系统运行图（设计报告和接口文档）