当前位置: 首页 > news >正文

这款新的 AI 语音助手击败了 OpenAI,成为 ChatGPT 最受期待的功能之一

OpenAI 推迟了 ChatGPT 令人印象深刻的语音模式,这让许多 AI 聊天机器人的粉丝感到不安,但他们现在可能已经被挖走了。法国人工智能开发商 Kyutai 推出了一款名为 Moshi 的实时语音 AI 助手。

在这里插入图片描述

Moshi 旨在通过语音(如 Alexa 或 Google Assistant)与用户提供逼真的对话,但由 ChatGPT 及其竞争对手(在本例中为 Helium 7B 模型)背后的大型语言模型提供支持。根据 Kyutai 的说法,Moshi 可以用各种口音说话,并且有 70 种不同的情感和说话风格。AI 甚至可以同时处理两个音频流,让 Moshi 可以同时听和说话。

Kyutai 对 Moshi 的开发涉及对使用 Text-to-Speech (TTS) 技术制作的 100,000 多个合成对话进行微调。目的是帮助 Moshi 了解人类交流的细微差别和语气。该品牌甚至与专业配音师合作,以提高 Moshi 的语音质量。

这款 AI 助手集成了文本和音频训练,针对多个后端进行了优化,这意味着它可以在笔记本电脑等设备上运行,而无需与云交互。该公司将其作为通过防止敏感数据在互联网上传输来维护隐私和安全的一种方式。您可以在此处查看 Moshi 的演示。

公开对话

Kyutai 宣称 Moshi 将是一个开源项目,包括模型的代码和框架,为进一步创新奠定基础。开源方法还可能有助于减轻大型人工智能公司正在处理的有关其封闭模型的安全和道德的投诉。Kyutai 的支持者,包括法国亿万富翁 Xavier Niel,正在推动开源方法。

Kyutai 还在开发 AI 音频识别、水印和签名跟踪系统,这些系统将被整合到 Moshi 中。这些功能将有助于识别 AI 生成的音频,促进问责制和可追溯性,同时确保 AI 生成的内容可以被监控和验证。

Moshi 仍在开发中,但演示文稿中的语音模式令人印象深刻。如果 Moshi 流行起来并流行起来,这种语音方法可能会成为 ChatGPT 竞争对手其他支持语音版本的催化剂,或者加速向 Alexa 和其他语音助手添加 LLM。

https://kyutai.org/

http://www.lryc.cn/news/393436.html

相关文章:

  • CTS单测某个模块和测试项
  • pytorch、pytorch_lightning、torchmetrics版本对应
  • 麒麟系统部署JeecgBoot
  • 要想贵人相助,首先自己得先成为贵人!
  • 使用块的网络 VGG
  • 微信小程序性能与体验优化
  • Android14之获取包名/类名/服务名(二百二十三)
  • FreeU: Free Lunch in Diffusion U-Net——【代码复现】
  • 第三方商城对接重构(HF202407)
  • 如何在Windows 11上复制文件和文件夹路径?这里提供几种方法
  • 大数据Spark 面经
  • 绝区叁--如何在移动设备上本地运行LLM
  • Interview preparation--Https 工作流程
  • 集成学习(三)GBDT 梯度提升树
  • 后端工作之一:CrapApi —— API接口管理系统部署
  • 20240706 xenomai系统中网口(m2/minipcie I210网卡)的实时驱动更换
  • 模型训练之数据集
  • 【TB作品】数码管独立按键密码锁,ATMEGA16单片机,Proteus仿真 atmega16数码管独立按键密码锁
  • 数据库主从复制
  • 昇思25天学习打卡营第13天|BERT
  • 跨平台书签管理器 - Raindrop
  • 均匀采样信号的鲁棒Savistky-Golay滤波(MATLAB)
  • c++ 可以再头文件种直接给成员变量赋值吗
  • 47.HOOK引擎优化支持CALL与JMP位置做HOOK
  • liunx上修改Firefox版本号
  • bug——多重定义
  • 将堆内存的最小值(Xms)与最大值(Xmx)设置为相同的配置,可以防止JVM在运行过程中根据需要动态调整堆内存大小
  • 安装 tesseract
  • 为适配kubelet:v0.4 安装指定版本的docker
  • vivado CLOCK_REGION、CLOCK_ROOT