当前位置: 首页 > news >正文

OpenAI重大更新!为ChatGPT推出语音和图像交互功能

原创 | 文 BFT机器人 

图片

OpenAI旗下的ChatGPT正在迎来一次重大更新,这个聊天机器人现在能够与用户进行语音对话,并且可以通过图像进行交互,将其功能推向与苹果的Siri等受欢迎的人工智能助手更接近的水平。这标志着生成式人工智能运动的一个显著演进,OpenAI将基于语音助手与其强大的大型语言模型(LLMs)融为一体。

自从大约九个月前首次推出以来,这款广受欢迎的生成式人工智能助手一直是近年来最成功的技术之一,任何人都能通过简单的文本提示生成文章、诗歌和摘要。但现在,ChatGPT即将变得更加具有互动性,用户还可以与AI进行语音对话。

图片

这一新闻与亚马逊承诺向OpenAI竞争对手Anthropic投资多达40亿美元的消息同时传出,这是全球科技巨头之间更大规模的生成式人工智能竞争的一部分,其中包括谷歌试图通过其Bard聊天机器人迎头赶上、Meta采取坚定的开源理念来帮助其占据优势地位、以及微软与OpenAI自身紧密合作。

ChatGPT的新语音功能不仅可以朗读文本输入,还可以讲述睡前故事,解决晚餐桌上的争论等等。这项语音功能由一款新的文本转语音模型提供支持,该模型可以从文本和少量采样的语音中生成类似人类的声音。OpenAI表示,他们与知名的配音演员合作,创建了五种不同的声音,使用他们的开源Whisper语音识别系统将口头表达转录成文本。

此外,Spotify也被宣布为OpenAI的合作伙伴之一,这家音乐流媒体巨头为播客制作者引入了一个非常有趣的新功能,允许他们采样自己的声音并将他们的节目从英语翻译成西班牙语、法语或德语,同时保留他们自己的原声。然而,OpenAI似乎很谨慎,不希望招致批评,因此他们并没有将这项技术提供给所有人——而仅仅跟播客制作者合作,其中包括Dax Shepard、Monica Padman、Lex Fridman、Bill Simmons和Steven Bartlett。

图片

这些新功能将在未来两周内逐步推出,供付费的Plus和企业订阅用户使用。要启用语音功能,用户需要前往应用程序中的“设置”菜单,然后进入“新功能”并选择加入语音对话。然后,他们需要点击右上角的耳机按钮,然后选择他们想要的声音。

最初,语音将仅限于ChatGPT Android和iOS应用程序的选择性测试版,而图像搜索将默认在所有平台上提供。这一系列更新使ChatGPT更具互动性和创造力,为用户提供了更多有趣和实用的功能。

作者 | Azukii

排版 | 小河

审核 | 猫

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。如果想要了解更多的前沿资讯,记得点赞关注哦~

http://www.lryc.cn/news/184098.html

相关文章:

  • 【开发篇】十六、SpringBoot整合JavaMail实现发邮件
  • 如何在Ubuntu系统部署RabbitMQ服务器并公网访问【内网穿透】
  • Flutter笔记:用于ORM的Floor框架简记
  • Zabbix自定义脚本监控MySQL数据库
  • 【Spatial-Temporal Action Localization(五)】论文阅读2020年
  • Linux基本指令(中)——“Linux”
  • OWASP Top 10漏洞解析(3)- A3:Injection 注入攻击
  • Java自定义类加载器的详解与步骤
  • 完美清晰,炫酷畅享——Perfectly Clear Video为你带来卓越的AI视频增强体验
  • 如何让FileBeat支持http的output插件
  • 解密人工智能:决策树 | 随机森林 | 朴素贝叶斯
  • web:[极客大挑战 2019]BabySQL
  • DRM全解析 —— plane详解(1)
  • 数据结构总结
  • 在SOLIDWORKS搭建一个简易的履带式机器人
  • C# 为什么要限制静态方法的使用
  • 【已解决】Pyecharts折线图,只有坐标轴没有折线数据
  • win10搭建Selenium环境+java+IDEA(3)
  • String 、Stringbuffer、StringBuilder区别
  • 如何提升爬虫IP使用效率?精打细算的方法分享
  • (高阶) Redis 7 第19讲 缓存过期淘汰策略 大厂篇
  • 【四旋翼飞行器】模拟四旋翼飞行器的平移和旋转动力学(Simulink仿真实现)
  • Kaggle - LLM Science Exam(一):赛事概述、数据收集、BERT Baseline
  • mmap底层驱动实现(remap_pfn_range函数)
  • 品牌如何查窜货
  • Java基于SpringBoot的车辆充电桩
  • 【ARM】(1)架构简介
  • 企业完善质量、环境、健康安全三体系认证的作用及其意义!
  • <HarmonyOS第一课>运行Hello World——闯关习题及答案
  • NLP 02 RNN