当前位置：首页 > news >正文

OpenAI 更新 ChatGPT：支持图片和语音输入【附点评】

news 2025/8/18 12:06:04

一、消息正文

9月25日消息,近日OpenAI宣布其对话AI系统ChatGPT进行升级,添加了语音输入和图像处理两个新功能。据OpenAI透露,这些新功能将在未来两周内面向ChatGPT Plus付费用户推出,免费用户也将很快可以使用这些新功能。这标志着ChatGPT继续朝着多模态交互的方向发展,为用户提供更加智能和人性化的交互体验。如下图所示：

语音输入功能将允许用户通过语音提出问题,无需键盘输入。

图像处理功能则可以让用户上传图片,ChatGPT会尝试理解图片内容并给出回答。

这两项新功能预计在未来两周面向付费用户先行推出,免费用户也将很快获得使用权限。

新功能的推出标志着ChatGPT继续朝着多模态交互发展,以提供更人性化的用户体验。但我们也需要注意,任何新技术都有被滥用的风险,需要建立管理机制以确保其合理应用。尤其是语音输入功能可能存在被恶意利用的隐患,需要谨慎对待。在推广新功能的同时,OpenAI有必要制定措施防止误用和恶意利用,以保障广大用户的利益。

二、点评

从目前的来看，大模型细分已经成为一种趋势，包括代码设计、图像生成、文本补全等细分领域模型大量涌现，金融、电信、通讯等行业垂类模型大量出现，细分和垂类才是大语言模型的发展未来。多模态是否值得，继续值得继续大规模投入，可以先画一个问号。

http://www.lryc.cn/news/178547.html

相关文章：

数据结构:堆的简单介绍

【LeetCode-中等题】654.最大二叉树

基于微信小程序的刷题考试系统设计与实现(适用于各类考试类、答题类程序)

用Java打印长方形、平行四边形、三角形、菱形、空心菱形

es6模块化，怎么判断当前文件使用的是es6的模块化还是commenjs的模块化

Ubuntu 基础配置

CISSP学习笔记：人员安全和风险管理概念

ubuntu18.04 OpenGL开发（显示YUV）

React（react18）中组件通信06——redux-toolkit + react-redux

第七章查找九、B+树

XPD911协议系列-集成同步降压多口互联控制器

数字反转（蓝桥杯）

十一.EtherCAT开发之microchip MCU D51+ LAN9253 的开发FOE应用(SPI directly 模式)

【分布式计算】二、架构(Architectures)

Springboot对MVC、tomcat扩展配置

网络子网划分练习

Leetcode刷题笔记--Hot51-60

广告牌安全监测系统，用科技护航大型广告牌安全

JAVA：实现Excel和PDF上下标

AI写稿软件，最新的AI写稿软件有哪些

干货：数据仓库基础知识（全）

二分搜索简介

虚拟车衣VR云展厅平台扩大了展览的触达范围

云部署家里的服务器

【利用冒泡排序的思想模拟实现qsort函数】

[plugin:vite:css] [sass] Undefined mixin.

【论文阅读】大语言模型中的文化道德规范知识

51单片机实训项目之产品数量计数器

Scala第七章节