当前位置: 首页 > news >正文

OpenAI-Edge-TTS:本地化 OpenAI 兼容的文本转语音 API,免费高效!

文本转语音(TTS)技术已经成为人工智能领域的重要一环,无论是语音助手、教育内容生成,还是音频文章创作,TTS 工具都能显著提高效率。今天要为大家介绍的是 OpenAI-Edge-TTS,一款基于 Microsoft Edge 在线文本转语音服务的开源项目,它提供了一个与 OpenAI API 兼容的本地 TTS 端点,让你能够通过简单的配置轻松实现文本到语音的转换,而且完全免费!


一、什么是 OpenAI-Edge-TTS?

OpenAI-Edge-TTS 是一个模拟 OpenAI TTS 端点(/v1/audio/speech)的本地服务,使用 Microsoft Edge 在线 TTS 服务来生成语音。通过这款工具,用户无需访问 OpenAI 的官方 API,只需通过本地服务器即可实现文本转语音的功能,同时还支持多种语音和音频格式选项。

项目地址:https://github.com/travisvn/openai-edge-tts

核心特点
  1. OpenAI 兼容 API
    提供 /v1/audio/speech 端点,与 OpenAI API 端点结构一致,方便用户无缝切换到本地化服务。
  2. 支持丰富的语音类型
    将 OpenAI 的语音选项(如 alloy、echo、fable 等)映射到 Edge-TTS 的等效语音,同时支持直接指定任何 Microsoft Edge-TTS 语音。
  3. 多种音频格式支持
    支持输出多种音频格式,包括 mp3、opus、aac、flac、wav 和 pcm,适配不同使用场景。
  4. 灵活调整播放速度
    支持 0.25 倍到 4.0 倍的播放速度调整,满足特殊场景需求。
  5. 免费使用
    依赖 Microsoft Edge 的在线 TTS 服务,完全免费,降低使用门槛。
  6. 多语言支持
    除英语外,还支持其他语言和地区的语音生成,如日语、中文等。

在这里插入图片描述


二、OpenAI-Edge-TTS 的主要应用场景

1. 音频内容创作

快速将文本内容转换为自然流畅的语音,适用于音频文章、播客脚本或教育视频的音频配音。

2. 开发与测试环境

为需要 OpenAI TTS 的开发者提供本地替代方案,便于开发和测试,节省调用官方 API 的成本。

3. 多语言语音输出

支持多语言生成,无论是创建本地化内容,还是测试跨语言功能,OpenAI-Edge-TTS 都能满足需求。

4. 定制化服务

通过可调的播放速度和语音类型,提供更加灵活的语音定制能力,适配特定的项目需求。


三、快速上手 OpenAI-Edge-TTS

1. 环境准备

推荐使用 Docker 部署

  • 安装 Docker 和 Docker Compose,确保运行环境就绪。

可选使用 Python 本地运行

  • 需要 Python 3.8+ 和 FFMPEG(如果需要进行音频格式转换)。

2. 部署服务

(1)使用 Docker 一键部署

  1. 克隆项目:

    git clone https://github.com/travisvn/openai-edge-tts.git
    cd openai-edge-tts
    
  2. 配置环境变量:
    在根目录创建 .env 文件,填写以下内容:

    API_KEY=your_api_key_here
    PORT=5050
    DEFAULT_VOICE=en-US-AvaNeural
    DEFAULT_RESPONSE_FORMAT=mp3
    DEFAULT_SPEED=1.0
    DEFAULT_LANGUAGE=en-US
    REQUIRE_API_KEY=True
    REMOVE_FILTER=False
    EXPAND_API=True
    

    或者直接复制默认配置:

    cp .env.example .env
    
  3. 启动服务:
    使用 Docker Compose 启动服务:

    docker compose up --build
    

    在后台运行服务:

    docker compose up -d
    

(2)使用 Python 本地运行

  1. 克隆项目并进入目录:

    git clone https://github.com/travisvn/openai-edge-tts.git
    cd openai-edge-tts
    
  2. 创建虚拟环境并安装依赖:

    python3 -m venv venv
    source venv/bin/activate  # macOS/Linux
    # 或者
    venv\Scripts\activate  # Windowspip install -r requirements.txt
    
  3. 配置环境变量(参考 .env 文件)。

  4. 启动服务:

    python app/server.py
    

3. 测试 API

服务启动后,访问 API 端点:

http://localhost:5050/v1/audio/speech
示例请求

使用 curl 将文本转化为语音并保存为 MP3 文件:

curl -X POST http://localhost:5050/v1/audio/speech \-H "Content-Type: application/json" \-H "Authorization: Bearer your_api_key_here" \-d '{"input": "Hello, I am your AI assistant!","voice": "alloy","response_format": "mp3","speed": 1.1}' \--output speech.mp3

支持其他语言:

curl -X POST http://localhost:5050/v1/audio/speech \-H "Content-Type: application/json" \-H "Authorization: Bearer your_api_key_here" \-d '{"input": "こんにちは、私はAIアシスタントです。","voice": "ja-JP-KeitaNeural"}' \--output speech.mp3

四、与官方 OpenAI TTS 的对比

功能维度OpenAI-Edge-TTSOpenAI TTS API
成本完全免费需按调用量付费
多语音支持支持 Edge-TTS 全部语音支持官方指定语音
兼容性模拟 OpenAI API 端点官方支持
扩展能力可自行扩展语音类型与功能功能固定
部署方式本地化运行,支持 Docker 部署依赖云端

五、总结:文本转语音的本地化高效方案

OpenAI-Edge-TTS 通过模拟 OpenAI TTS API,结合 Microsoft Edge 在线 TTS 服务,为开发者提供了一款免费、高效且功能丰富的文本转语音解决方案。无论是用于本地开发、测试,还是构建音频内容创作平台,这款工具都能极大降低使用成本,同时提供出色的扩展能力。

http://www.lryc.cn/news/528773.html

相关文章:

  • P4681 [THUSC 2015] 平方运算 Solution
  • 【apt源】RK3588 平台ubuntu20.04更换apt源
  • Angular 2 表单深度解析
  • PHP 7 新特性
  • vim如何解决‘’文件非法关闭后,遗留交换文件‘’的问题
  • 【练习】树形dp
  • Mybatis是如何进行分页的?
  • 【新春特辑】2025年春节技术展望:蛇年里的科技创新与趋势预测
  • 论文笔记(六十三)Understanding Diffusion Models: A Unified Perspective(五)
  • C++并发:C++内存模型和原子操作
  • JavaScript函数中this的指向
  • 【java学习笔记】@Autowired注解 使用方法和作用 | 配合@Component注解使用 | IOC控制反转
  • 数论问题76一一容斥原理
  • python-leetcode-从中序与后序遍历序列构造二叉树
  • 【Oracle篇】使用Hint对优化器的执行计划进行干预(含单表、多表、查询块、声明四大类Hint干预)
  • 设置jmeter外观颜色
  • 计算机网络 IP 网络层 2 (重置版)
  • 神经网络和深度学习
  • MySQL 基础学习(3):排序查询和条件查询
  • webAPI -DOM 相关知识点总结(非常细)
  • web集群
  • Elasticsearch——Elasticsearch性能优化实战
  • 不背单词快捷键(不背单词键盘快捷键)
  • kafka-保姆级配置说明(consumer)
  • 1.五子棋对弈python解法——2024年省赛蓝桥杯真题
  • python3+TensorFlow 2.x(三)手写数字识别
  • 杨辉三角(蓝桥杯2021年H)
  • 【蓝桥杯嵌入式入门与进阶】2.与开发板之间破冰:初始开发板和原理图2
  • C++ queue
  • 【MySQL-7】事务