当前位置: 首页 > news >正文

百度侯震宇详解:大模型将如何重构云计算?

12月20日,在2023百度云智大会·智算大会上,百度集团副总裁侯震宇以“大模型重构云计算”为主题发表演讲。他强调,AI原生时代,面向大模型的基础设施体系需要全面重构,为构建繁荣的AI原生生态筑牢底座。
 

侯震宇表示:“大模型重构云计算主要体现在三个层面:AI原生云将改变云计算的格局,MaaS ( Model as a Service ,模型即服务)会成为新的基础服务,AI原生应用催生新的研发范式。”

百度集团副总裁 侯震宇
 

1、在算力层,计算更智能
 

在底层的云基础设施层,以往从互联网应用到移动互联网应用,底层都基于CPU计算芯片,而AI应用对GPU或异构计算的需求大幅增加,云市场的底层算力开始迁移到以GPU为主。
 

2023年第三季度,英伟达的营收已经超过英特尔,英伟达最新市值也超过英特尔1万亿美元,未来GPU的增长将远大于CPU。在这一趋势下,我们需要对面向大模型的云计算基础设施体系进行全面重构,以支撑AI原生应用系统落地。
 

具体来说,云计算的全面重构会表现在三大领域,即:面向模型的智算基础设施、面向数据的数据基础设施、面向应用的云基础设施全面升级,让计算更智能。
 

2、在模型层,大模型正在成为通用的服务能力,即MaaS
 

MaaS将大幅降低Al落地的门槛、实现真正的Al普惠,其依赖的新型IT基础设施也将进一步在底层颠覆现有的云计算市场格局。
 

从百度智能云的实践来看,自8月31日文心一言全面开放后至今的4个月,百度智能云千帆大模型平台(百度智能云推出的MaaS平台)上,API日调用量增长10倍,客户主要来自互联网、教育、电商、营销、手机、汽车等各行业。可以明显看到,最近半年,已经有很多企业真正把大模型用起来了。
 

3、在应用层,应用开发的范式已经被彻底颠覆
 

大模型理解、生成、逻辑、记忆的独特能力会催生A原生应用研发新范式,整个应用技术栈、数据流和业务流都将被改变。
 

原先基于CPU的应用开发主要是业务逻辑驱动,传统的AI研发需要针对每一个独立场景获取数据,再分别从头训练模型。而现在AI原生应用主要基于大模型能力,以数据驱动开发。企业可直接在基础大模型之上,利用场景数据微调出专属大模型,再用模型能力设计AI原生应用,无需从头训练大模型。随着企业业务扩大,逐渐积累出更多有竞争力的场景数据,进而反哺模型和应用效果提升,从而形成数据飞轮。
 

具体来说,大模型驱动的AI原生应用研发新范式展现出几个新变化:
 

首先是“新场景”。生成式大语言模型,在理解、生成、推理、记忆等多维度展现出超预期的能力,带来了智能涌现,由此催生了很多新的可落地的业务场景应用,如个人助理、智能文案创作、GBI(智能商业分析)、编码助手等。
 

第二是“新架构”。大模型具体在这些新场景落地的过程中,也产生了很多新的系统架构,如检索增强生成RAG,智能体Agent 等。
 

第三是“新开发生态”。以大模型为核心,开发者工具层也出现了一些新工具,包括编排工具LangChain、AI应用开发工具PromptFlow、数据框架Llamalndex等。


侯震宇表示,总体来说,构建繁荣的A原生应用生态,需要大模型、智能算力、
AI原生应用研发新范式三要素相辅相成。大模型是AI原生应用的“大脑”,智能计算则为AI原生应用运行提供坚实支撑,新研发范式助力开发者高效基于大模型能力开发应用。数据飞轮是成功的AI原生应用的充分必要条件,让大模型能力高速迭代,产品体验持续进步。

“我相信,真正非常闪耀的AI原生应用会在2024年诞生。”侯震宇说。

http://www.lryc.cn/news/264849.html

相关文章:

  • [Java]FileOutputStream的换行/续写/一次性写出一个字符串的方法
  • VM进行TCP/IP通信
  • 剑指Offer 队列栈题目集合
  • grafana基本使用
  • 备份至关重要!如何解决iCloud的上次备份无法完成的问题
  • 【项目问题解决】% sql注入问题
  • B/S医院手术麻醉临床管理系统源码 手术申请、手术安排
  • 解锁高效工作!5款优秀工时管理软件推荐
  • ICLR 2024 高分论文 | Step-Back Prompting 使大语言模型通过抽象进行推理
  • 边缘计算有哪些常用场景?TSINGSEE边缘AI视频分析技术行业解决方案
  • 配置BGP的基本示例
  • Flask解决接口跨域问题
  • 数据恢复工具推荐!这3款堪称删除文件恢复大师!
  • 论文笔记 | ICLR 2023 ReAct:通过整合推理和行动来增强语言模型
  • CSS:元素显示模式与背景
  • K8S 为什么关闭 SELinux 和交换内存
  • 7. ASP.NET Core Blazor 官网文档
  • xrandr
  • 【高效开发工具系列】eclipse部署web项目
  • 实在智能成功完成近2亿元C轮融资,全面迎接2024年Agent智能体应用元年
  • vue创建项目
  • 智能变电站集中监控辅助决策系统解决方案
  • PyQt5基础知识第三天
  • docker安装ES:7.8和Kibana:7.8
  • React 状态管理 - 优化你的应用程序
  • Python异常捕获和处理方式
  • PDF文件如何设置限制打印?
  • 互操作性(Interoperability)如何影响着机器学习的发展?
  • 从零实现一套低代码(保姆级教程) --- 【3】实现Button组件和画布区的拖拽
  • 仓储1、10、11代电子标签接口文档