当前位置: 首页 > news >正文

炸裂的开源AI语音生成模型ChatTTS

今天看到GitHub上开源了一个非常厉害的AI语音生成模型ChatTTS,可以生成和人类声音非常接近的语音,而且有语气、语调、可以停顿和发出笑声,再也没有了以前的AI味道

体验地址:https://colab.research.google.com/drive/1MYep5f0-BJevVdUZoBuMbjafTy1sfiCr?usp=sharing

ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本。

大鹏自己运行了下,发现效果很不错,可以看下面的示例效果

抖音演示地址

体验方法

感兴趣的朋友可以自己去尝试,HuggingFace地址是:https://huggingface.co/2Noise/ChatTTS

HuggingFace上面可能资源不足无法运行,可以使用谷歌的colab来运行

体验地址:https://colab.research.google.com/drive/1MYep5f0-BJevVdUZoBuMbjafTy1sfiCr?usp=sharing

将下面的代码放入其中执行即可,其中第一次运行估计要10分钟左右

先clone代码和安装包

!git clone https://github.com/2noise/ChatTTS
!mv ChatTTS test
!mv test/* .!cat ChatTTS/__init__.py
!pip install omegaconf
!pip install vocos
!pip install vector_quantize_pytorch
!pip install nemo_text_processing

再运行chatTTS

import torch
import ChatTTS
from IPython.display import Audiochat = ChatTTS.Chat()
chat.load_models()texts = [
'''我觉得mdnice是非常优秀的markdown编辑器[laugh],
可以用来作微信排版还有写作[uv_break],
欢迎大家多多使用,使用了之后我请您吃葡萄,
吃葡萄不吐葡萄皮[laugh],不吃葡萄倒吐葡萄皮
''']params_refine_text = {'prompt': '[oral_2][laugh_0][break_6]'
}wavs = chat.infer(texts, params_refine_text=params_refine_text, use_decoder=True)Audio(wavs[0], rate=24_000, autoplay=True)

本文由mdnice多平台发布

http://www.lryc.cn/news/358595.html

相关文章:

  • Mac逆向Electron应用
  • (三)MobaXterm、VSCode、Pycharm ssh连接服务器并使用
  • 【Linux】初识信号及信号的产生
  • 故障诊断 | 基于 KAN、KAN卷积的轴承故障诊断模型
  • 【设计模式】JAVA Design Patterns——Factory Method(虚拟构造器模式)
  • Spring——依赖项
  • C语言 | Leetcode C语言题解之第119题杨辉三角II
  • 深入分析 Android Service (一)
  • 英飞凌24GHz毫米波雷达-BGT24LTR11N16家用机器人应用
  • 17.js字符串
  • JS-51-Node.js10-yarn
  • idea项目一直在build
  • SpringBoot六种API请求参数读取方式
  • WSDM2024推荐系统和LLM相关论文整理(二)
  • Mybatis 查询TypeHandler使用,转译查询数据(逗号分隔转List)
  • 易查分小程序|如何开启个人密钥功能?
  • NoSQL是什么?NoSQL数据库存在SQL注入攻击?
  • 成功解决“ImportError: cannot import name ‘mapping‘ from ‘collections‘”错误的全面指南
  • apexcharts数据可视化之圆环柱状图
  • 2024ciscn初赛——easycms
  • 融合神话传说:构建公共开放平台的技术探索
  • 鸿蒙应用Stage模型【应用/组件级配置】
  • Python魔法之旅-魔法方法(05)
  • 机器学习笔记(1):sklearn是个啥?
  • C++与C语言 通过指针改变const变量的值
  • OpenJDK优化技术之标量替换(Scalar Replacement)
  • 优思学院|研发工程师获取六西格玛证书有用吗?
  • C++第二十二弹---vector深度剖析及模拟实现(下)
  • GD32F470+lwip 丢包问题分析及解决
  • 好用的电子杂志制作平台分享