当前位置: 首页 > news >正文

大语言模型(LLM)有哪些?

国际大语言模型

        目前国际上有以下几个知名的大语言模型:

  • GPT-4

        GPT-4由OpenAI团队开发,是闭源的。GPT(Generative Pre-trained Transformer)系列是目前最著名的大语言模型之一。最早的版本是GPT-1,之后发展到了GPT-2和GPT-3,目前最新版本是GPT-4,2023年3月14日发布。GPT系列模型通过预训练和微调的方式,可以生成高质量的文本。

  • BERT

        BERT(Bidirectional Encoder Representations from Transformers)是Google开发的另一个重要的大语言模型。BERT在自然语言处理任务中取得了很大的成功,可以理解上下文,并且可以进行下游任务的微调。

  • RoBERTa

        RoBERTa是Facebook开发的一个改进版本的BERT模型。RoBERTa在BERT的基础上进行了一系列的优化,包括更长的预训练时间、更大的训练数据集等,取得了更好的效果。

  • Turing NLG

        Turing NLG是微软开发的一个大语言模型,它通过预训练和微调的方式,可以生成自然语言文本。Turing NLG在多个自然语言处理任务中表现出色。

国内大语言模型

  • 文心一言

        文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势,闭源。

  • 云雀

        云雀是一款由字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效的完成互动对话、信息获取、协助创作等任务,闭源。

http://www.lryc.cn/news/286051.html

相关文章:

  • 2 - 部署Redis集群架构
  • NOIP2003提高组T1:神经网络
  • Doris数据库误删除恢复
  • C# byte转int:大小端读取
  • 安全通信网络
  • 深度学习笔记(九)——tf模型导出保存、模型加载、常用模型导出tflite、权重量化、模型部署
  • 七Docker可视化管理工具
  • vue和react的差异梳理
  • (笔记总结)C/C++语言的常用库函数(持续记录,积累量变)
  • OceanBase集群扩缩容
  • html 3D 倒计时爆炸特效
  • 记一次垃圾笔记应用VNote安装失败过程
  • 记一次 stackoverflowerror 线上排查过程
  • 论文写作之十个问题
  • leetcode2171 拿出最少数目的魔法豆
  • 测试C#调用OpenCvSharp和ViewFaceCore从摄像头中识别人脸
  • 测试经理面试初体验
  • 使用ffmpeg调整视频中音频采样率及声道
  • 详细分析Java中的Date类以及格式转换
  • 【计算机网络】应用层——HTTP 协议(一)
  • 线程和进程的区别
  • proxy 代理的接口报错301问题
  • mysql进阶-执行计划
  • 【UE5】第一次尝试项目转插件(Plugin)的时候,无法编译
  • MeterSphere本地化部署实践
  • 巨变!如何理解中国发起的“数据要素X”计划?
  • CS8370错误,这是由于使用了C# 7.3中不支持的功能
  • Raspbian安装云台
  • 蓝桥杯理历年真题 —— 数学
  • 自然语言处理--双向匹配算法