当前位置: 首页 > news >正文

热门开源项目ChatTTS: 国内语音技术突破,实现弯道超车


✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭
~✨✨

🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。

我是Srlua小谢,在这里我会分享我的知识和经验。🎥

希望在这里,我们能一起探索IT世界的奥妙,提升我们的技能。🔮

记得先点赞👍后阅读哦~ 👏👏

📘📚 所属专栏:人工智能、话题分享

欢迎访问我的主页:Srlua小谢 获取更多信息和资源。✨✨🌙🌙

​​

目录

热门开源项目ChatTTS推荐

如何部署使用ChatTTS?

1.从GitHub下载

2.安装依赖项

3.导入所需库

4.初始化ChatTTS

5.准备文本

6.生成语音

7.播放音频

8.完成脚本

在线网站使用

体验地址:

效果反馈:

常见问题​


热门开源项目ChatTTS推荐

随着开源程序的发展,越来越多的程序员开始关注并加入开源大模型的行列。每个人对开源行业和项目的关注点各不相同,现在快来加入我们的开源热门项目推荐活动,分享你感兴趣的热门项目吧!

chattts作者本人也在 x 上表示,ChatTTS 突破了开源天花板。不过,目前开源的只是底模,没有经过 SFT 监督微调。 

​​最像人声的AI来了!语音开源天花板ChatTTS火速出圈,3天就斩获9k个star。

项目地址:https://github.com/2noise/ChatTTS/tree/main

ChatTTs是一种语音合成技术,它使用先进的人工智能算法和模型来生成自然流畅的语音输出。通过ChatTTs,计算机可以将文本转化为逼真的人声,并以多种语音风格和语调进行表达。这项技术在语音助手、虚拟主播、有声读物等领域具有广泛的应用潜力。

开源项目“ChatTTS”是一个文本转语音的工具,它具有以下特点:

1. 多语言支持:ChatTTS不仅可以说中文,还可以说英文,对于多种语言的转换都能应对自如。

2. 细粒度控制:该工具支持一些细节的控制,例如加入笑声、停顿和语气词,使得生成的语音更加生动有趣。

3. 逝去声音的复刻:ChatTTS能够复刻已经逝去的人的声音,例如乔布斯的发布会,让你随时可以重新聆听。

4. 高度逼真的模仿:无论是语调还是语气的变化,ChatTTS都能准确地模仿,并且几乎听不出来是由AI生成的。

5. 中英文混合:ChatTTS能够灵活处理中英文混合的情况,表现出半中半英的流利口音,展现出高水平的语言能力。

通过这些功能,ChatTTS在文本转语音的领域已经达到了一个新的水平。希望这个项目能够为用户带来更好的体验和更多的可能性。

如何部署使用ChatTTS?

1.从GitHub下载

从GitHub下载代码。

git clone https://github.com/2noise/ChatTTS

2.安装依赖项

在开始之前,请确保已安装所需的软件包。您将需要torch和ChatTTS。如果尚未安装,可以使用pip安装:

pip install torch ChatTTS

3.导入所需库

为您的脚本导入必要的库。您将需要torch、ChatTTS和IPython.display中的Audio。

import torch
import ChatTTS
from IPython.display import Audio

4.初始化ChatTTS

创建ChatTTS类的实例并加载预训练模型。

chat = ChatTTS.Chat()
chat.load_models()

5.准备文本

定义要转换为语音的文本。将<YOUR TEXT HERE>替换为您想要的文本。

texts = ["你好,欢迎使用ChatTTS!"]

6.生成语音

使用infer方法从文本生成语音。设置use_decoder=True以启用解码器。

wavs = chat.infer(texts, use_decoder=True)

7.播放音频

使用IPython.display中的Audio类播放生成的音频。将采样率设置为24,000 Hz并启用自动播放。

Audio(wavs[0], rate=24_000, autoplay=True)

8.完成脚本

这是供参考的完整脚本:

import torch
import ChatTTS
from IPython.display import Audio# 初始化ChatTTS
chat = ChatTTS.Chat()
chat.load_models()# 定义要转换为语音的文本
texts = ["你好,欢迎使用ChatTTS!"]# 生成语音
wavs = chat.infer(texts, use_decoder=True)# 播放生成的音频
Audio(wavs[0], rate=24_000, autoplay=True)

在线网站使用

如何觉得部署较为麻烦的,可以选择在线网站进行免费使用~

体验地址:

ChatTTS: Text-to-Speech For Chat

效果反馈:

项目一经发布,各路网友纷纷试用起来,给出了声音确实真假难辨。 

还有人拿 GPT 生成文本,让 ChatTTS「读」出来,语气语调和真人的差距非常小:

常见问题

​​

希望对你有帮助!加油!

若您认为本文内容有益,请不吝赐予赞同并订阅,以便持续接收有价值的信息。衷心感谢您的关注和支持!

http://www.lryc.cn/news/374127.html

相关文章:

  • 环形链表2证明
  • fetch_lfw_people()报错urllib.error.HTTPError: HTTP Error 403: Forbidden的解决方案
  • Verilog-Behavior Level 和 RTL Level 和 GATE Level的区别
  • 华为OD机考题HJ1 字符串最后一个单词的长度
  • C语言---------深入理解指针
  • C++ 算法教程
  • 【支持向量机】问题梳理
  • 车载网络安全指南 网络安全框架(二)
  • 元数据、数据元、数据字典、数据模型及元模型的区别详解
  • 【百度智能体】零代码创建职场高情商话术助手智能体
  • 实战项目: 负载均衡
  • 运维监控系统
  • 第3章 Unity 3D着色器系统
  • Qt项目天气预报(1) - ui界面搭建
  • 一、从C语言到C++(一)
  • MySQL(5)
  • 区块链之快照
  • 自学前端第一天
  • SQL Server几种琐
  • redis 一些笔记1
  • 【计网复习】应用层总结(不含HTTP和错题重点解析)
  • carbondata连接数优化
  • 云和运维(SRE)的半生缘-深读实证02
  • java基础操作5——java自定义获取任意年、月、日的起始和结束时间
  • 【Java04】引用变量数组初始化的内存机制
  • 基于JSP的足球赛会管理系统
  • 博客摘录「 AXI三种接口及DMA DDR XDMA介绍(应用于vivado中的ip调用)」2024年6月10日
  • Bigtable: A Distributed Storage System for Structured Data
  • RAG下的prompt编写探索
  • 【计算机组成原理】指令系统考研真题详解之拓展操作码!