当前位置: 首页 > news >正文

ChatGLM vs ChatGPT

所有的NLP大模型 都是transformer结构

1.Mask attention 的策略不同
2.训练任务目标不同

国内大模型nb公司:百度、清华智谱

一、主流大模型

粉色:Encoder-only。

绿色:Encoder-Decoder,尽头智谱ChatGLM。

蓝色:Decoder-only,尽头OpenAI GPT4。

二、OpenAI与智谱发展时间线

三、ChatGLM 

GLM支持国产GPU

轻量化部署

优势

四、搜索增强WebGPT vs WebGLM

WebGLM,整体思路:

1.网上搜索答案,并且进行过滤(提高相关性)。

2.使用大模型,将搜索的结果,reference进行汇总,输出答案(可以有多个)。

3.使用打分模型,计算各个答案的得分,返回最高得分。训练样本:人的点赞数。

五、图文理解 GPT-4V vs. CogVLM

六、文生图 DALL·E vs. CogView

DALL·E

CogView

用Beit编码图片

http://www.lryc.cn/news/285010.html

相关文章:

  • leetcode热题100.三数之和
  • GitLab服务器忘记root密码处理方式
  • js-cookie的使用--token的数据实现持久化
  • 【实战】SpringBoot自定义 starter及使用
  • 网络爬虫采集工具
  • 【协议】XMLHttpRequest的梳理和总结
  • AI教我学编程之C#类的基本概念(1)
  • 前端js 数据结构:对象 object、数组Array 、Map 的创建、增删改 / 遍历数据
  • ARM_Linux的NFS网络文件系统的搭建
  • vscode配置web开发环境(WampServer)
  • 00-Rust前言
  • 3.conda的使用
  • IPv6自动隧道---6to4中继
  • 低代码开发:解锁数字化转型新维度
  • 写一个定时备份数据库的脚本,且只保留最近3天
  • java常见面试题:请详细解释如何在Java EE应用中添加EJB
  • 视频监控需求记录
  • Self-RAG:通过自我反思学习检索、生成和批判
  • C++基于多态的职工管理系统(附代码下载)
  • Java安全 CC链1分析
  • Miracast手机高清投屏到电视(免费)
  • 【elementUI】el-select相关问题
  • 【蓝桥杯日记】复盘第一篇——顺序结构
  • 使用 MinIO 和 PostgreSQL 简化数据事件
  • 苹果电脑(Mac)的node版本安装以及升降级
  • WCP知识分享平台的容器化部署
  • 乐意购项目前端开发 #4
  • 最安全的飞行器——飞行汽车
  • java验证ftp地址是否可用
  • 多线程(看这一篇就够了,超详细,满满的干货)