当前位置: 首页 > news >正文

OpenAI 更新 ChatGPT:支持图片和语音输入【附点评】

一、消息正文

        9月25日消息,近日OpenAI宣布其对话AI系统ChatGPT进行升级,添加了语音输入图像处理两个新功能。据OpenAI透露,这些新功能将在未来两周内面向ChatGPT Plus付费用户推出,免费用户也将很快可以使用这些新功能。这标志着ChatGPT继续朝着多模态交互的方向发展,为用户提供更加智能和人性化的交互体验。如下图所示:

语音输入功能将允许用户通过语音提出问题,无需键盘输入。

图像处理功能则可以让用户上传图片,ChatGPT会尝试理解图片内容并给出回答。

这两项新功能预计在未来两周面向付费用户先行推出,免费用户也将很快获得使用权限。

新功能的推出标志着ChatGPT继续朝着多模态交互发展,以提供更人性化的用户体验。但我们也需要注意,任何新技术都有被滥用的风险,需要建立管理机制以确保其合理应用。尤其是语音输入功能可能存在被恶意利用的隐患,需要谨慎对待。在推广新功能的同时,OpenAI有必要制定措施防止误用和恶意利用,以保障广大用户的利益。

二、点评

从目前的来看,大模型细分已经成为一种趋势,包括代码设计、图像生成、文本补全等细分领域模型大量涌现,金融、电信、通讯等行业垂类模型大量出现,细分和垂类才是大语言模型的发展未来。多模态是否值得,继续值得继续大规模投入,可以先画一个问号。

http://www.lryc.cn/news/178547.html

相关文章:

  • 数据结构:堆的简单介绍
  • 【LeetCode-中等题】654.最大二叉树
  • 基于微信小程序的刷题考试系统设计与实现(适用于各类考试类、答题类程序)
  • 用Java打印长方形、平行四边形 、三角形、菱形、空心菱形
  • es6模块化,怎么判断当前文件使用的是es6的模块化还是commenjs的模块化
  • Ubuntu 基础配置
  • CISSP学习笔记:人员安全和风险管理概念
  • ubuntu18.04 OpenGL开发(显示YUV)
  • React(react18)中组件通信06——redux-toolkit + react-redux
  • 第七章 查找 九、B+树
  • XPD911协议系列-集成同步降压多口互联控制器
  • 数字反转(蓝桥杯)
  • 十一.EtherCAT开发之microchip MCU D51+ LAN9253 的开发FOE应用(SPI directly 模式)
  • 【分布式计算】二、架构(Architectures)
  • Springboot对MVC、tomcat扩展配置
  • 网络子网划分练习
  • Leetcode刷题笔记--Hot51-60
  • 广告牌安全监测系统,用科技护航大型广告牌安全
  • volatile
  • JAVA:实现Excel和PDF上下标
  • AI写稿软件,最新的AI写稿软件有哪些
  • 干货:数据仓库基础知识(全)
  • 二分搜索简介
  • 虚拟车衣VR云展厅平台扩大了展览的触达范围
  • 云部署家里的服务器
  • 【利用冒泡排序的思想模拟实现qsort函数】
  • [plugin:vite:css] [sass] Undefined mixin.
  • 【论文阅读】大语言模型中的文化道德规范知识
  • 51单片机实训项目之产品数量计数器
  • Scala第七章节