当前位置: 首页 > news >正文

LaaS LLM as a service

  • LaaS LLM as a service
    • 核心构成
    • GPT 产业链如何进行商业化
    • LLM(Large Language Model) 发展和趋势
    • LLM(Large Language Model) 对于行业公司的分层
    • LLM(Large Language Model) 的机遇和挑战

LaaS LLM as a service

核心构成

  1. 计算:算力
  2. 模型:算法
  3. 输入:数据
  4. 输出:应用

GPT 产业链如何进行商业化

  1. 面向 C 端的订阅制会员模式
  2. 面向 B 端的 API 接口模式

C 端其它增收的方式

  1. Midjourney 作品分成(输出内容的增值税):作品允许商业化,但是超过某个利润阈值时,需要分 X% 的利润给 AI 平台
  2. 特定场景的按次付费:SEO 优化每千次多少钱
  3. 广告模式:在回答中嵌入与之相关的广告
  4. SaaS:植入在办公软件如 Office 中

B 端其它增收的方式
细分行业定制 LLM

LLM(Large Language Model) 发展和趋势

LLM(Large Language Model) 基于海量数据训练得到,他获得了海量知识

演化的过程

  1. GPT3 (175B)
  2. LaMDA (137B)
  3. Gopher (280B)
  4. FLAN-T5(540B)

业界通过对 LLM(Large Language Model) 的探索和应用,引导 LLM(Large Language Model) 挖掘里面的海量知识,得到最优秀的结果 (
state-of-the-art result,sota 过程),

演化的过程

  1. LLM(Large Language Model) 最开始通过预训练方式构建下游任务,来减少微调所需要的数据量
  2. LLM(Large Language Model) 通过各类 Prompt Engineering 方式,来减少微调所需要的数据量
  3. LLM(Large Language Model) 通过用非梯度更新的方式,使大模型无需微调情况下,拥有小样本、零样本解决问题的能力
  4. LLM(Large Language Model) 具备上下文学习(In-context learning)、上下文学习的矫正(Calibration) 能力
  5. LLM(Large Language Model) 通过一系列逻辑链(CoT, chain of thought) 解决数据推理问题
  6. LLM(Large Language Model) 通过结合行动驱动(Action-driven)、意图驱动来理解人类需求

LLM(Large Language Model) 对于行业公司的分层

  1. 基础设施公司
  2. 基于场景定制的 LLM 和升级服务
  3. 基于场景 LLM 产品进行的业务产品

到最终,基础设施公司只会有 1-2 家,形成行业垄断。基于场景定制的 LLM 和升级服务厂商会有一些头部厂商,以及海量的
基于场景 LLM 产品进行的业务产品的中小微企业

LLM(Large Language Model) 的机遇和挑战

LLM(Large Language Model) 必会带来新赛道的机遇,也必会越来越多的老方式被淘汰,跟不上节奏落伍的风险将会加大

LLM(Large Language Model) 可能导致的一些现象

  1. 大一统 NLP 领域,LLM(Large Language Model) 会让某些 NLP 的研究方向不再具备研究价值
  2. 从 LLM 应用角度来说,LLM-as-a-Service会越来越普遍 (OpenAI LLMaaS 的成本已经在开始指数级降低)
  3. LLM(Large Language Model) 在应用侧的盈利仍然是一个巨大的挑战,真正投入生产的挑战仍然巨大,即使在降本增效的大环境下
  4. LLM(Large Language Model) 真正投入生产的挑战仍然巨大
  5. LLM(Large Language Model) 在国内的产研环境下,高昂的使用成本和比较苛刻的使用条件(需要精细且明确的指令)仍然限制了它的赋能
  6. 当基础设施公司完成了 LLM(Large Language Model) 的基本商业化,OpenAl、Google、DeepMind 开始闭源,基础设施就形成了垄断能力
http://www.lryc.cn/news/164918.html

相关文章:

  • 数据结构与算法(一)数组的相关概念和底层java实现
  • 歌曲推荐《最佳损友》
  • 多元共进|科技促进艺术发展,助力文化传承
  • Java集合(Collection、Iterator、Map、Collections)概述——Java第十三讲
  • topscoding主题库模板题
  • Linux--进程间通讯--FIFO(open打开)
  • 哪里可以了解轻量的工作流引擎?
  • lvs负载均衡、LVS集群部署
  • 如何应对核心员工提离职?
  • 建站系列(八)--- 本地开发环境搭建(WNMP)
  • 21天学会C++:Day8----范围for与nullptr
  • Linux——环境变量
  • Screen的详细全面安装教程及Screen的用法
  • 生成树、Prufer序列的计数问题:0912T1
  • SQL_牛客网_SQL264_求每个登陆日期的次日留存率
  • Hive 基础知识
  • 【数据结构】树的基础知识及三种存储结构
  • ABB 3BHB003688R0101接口模块
  • 精简 jre 涉坑记录
  • Java程序员学习算法路线规划总结
  • 火山引擎 ByteHouse:两个关键技术,揭秘 OLAP 引擎中的数据导入技术
  • 深挖“范围经济”穿越产业周期:TCL电子持续繁荣的密码
  • Elasticsearch:使用 ESRE 和生成式 AI 了解 TLS 日志错误
  • Swing程序设计(3)JDialog窗体
  • 类和对象(1)
  • 学会用命令行创建uni-app项目并用vscode开放项目
  • java.lang.ClassCastException: android.os.BinderProxy cannot be cast to ...
  • AIGC(生成式AI)试用 3 -- 专业主题
  • rsyslog-日志管理 logrotate-日志轮转
  • 类和对象续