当前位置: 首页 > news >正文

书生浦语第一次课

模型的发展

从专业模型到通用模型
在这里插入图片描述

书生·浦语大模型全链路开源体系

2023.06.07 -> InternLM千亿参数语言大模型发布

2023.07.06 -> InternLM千亿参数语言大模型全面升级,支持8K语境、26种语言。全面开源、免费商用:InternLM-7B、全链条开源工具体系

2023.08.14 -> 书生·万卷1.0多模态预训练语料库开源发布

2023.08.21 -> 升级版对话模型InternLM-Chat-7B v1.1发布,开源智能体框架Lagent,支持从语言模型到智能体升级转换

2023.08.28 -> InternLM 千亿参数模型的参数两升级到123B

2023.09.20 -> 增强版InternLM-20B开源,开源工具链全线升级

回归语言模型本质

1、多维数据价值评价
基于文本质量、信息质量、信息密度等维度对数据简直进行综合评估和提升
2、高质量预料驱动的数据富集
利用高质量语料的特征从物理世界、互联网以及语料进一步富集耕读类似语料
针对性数据补齐
3、针对性补充语料
重点加强世界知识、数理、代码等核心能力
在这里插入图片描述

书生浦语特点

  • 超长上下文
  • 综合性能全面提升
  • 优秀对话和创作体验
  • 工具调用能力整体提升
  • 突出的数理能力和使用的数据分析能力

在这里插入图片描述

模型到应用流程

在这里插入图片描述

书生浦语体系

  • 数据
  • 预训练
  • 微调
  • 全参微调和LORA微调
  • 部署
  • 评测
  • 应用

在这里插入图片描述

微调

增量续训
使 用 场 景 : 让 基 座 模 型 学 习 到 一 些 新 知 识 , 如 某 个 垂 类 领 域 知 识 训 练 数 据 : 文 章 、 书 籍 、 代 码 等
有监督微调
使 用 场 景 : 让 模 型 学 会 理 解 各 种 指 令 进 行 对 话 , 或 者 注 入 少 量 领 域 知 识 训 练 数 据 : 高 质 量 的 对 话 、 问 答 数 据
在这里插入图片描述

微调框架

在这里插入图片描述

http://www.lryc.cn/news/331342.html

相关文章:

  • UE小:UE5.3无法创建C++工程
  • FFmpeg获取视频详情
  • find: paths must precede expression
  • RabbitMQ3.x之九_Docker中安装RabbitMQ
  • vue快速入门(四)v-html
  • 第19次修改了可删除可持久保存的前端html备忘录:换了一个特别的倒计时时钟
  • C++ 2024-4-1 作业
  • 【滑动窗口】Leetcode 串联所有单词的子串
  • golang channel实践代码及注意事项
  • 面试题:RabbitMQ 消息队列中间件
  • wpf中引用自定义字体
  • 高效准确!指甲剪盖片视觉检测技术解密
  • 分布式IO模块PLC扩展模拟量模块
  • Qt事件系统
  • C++STL--排序算法
  • CEF的了解
  • 基于OrangePi Zero2的智能家居项目(开发阶段)
  • 数据结构记录
  • 从零到一:基于 K3s 快速搭建本地化 kubeflow AI 机器学习平台
  • kettle使用MD5加密增量获取接口数据
  • PS入门|黑白色的图标怎么抠成透明背景
  • android 14 apexd分析(2)apexd 启动
  • 微信小程序怎么制作?制作一个微信小程序需要多少钱?
  • WPS二次开发专题:如何获取应用签名SHA256值
  • Flink SQL系列之:基于Flink SQL查询Topic中序列化的Debezium数据格式字段
  • 【WPF应用30】WPF中的ListBox控件详解
  • Chatgpt掘金之旅—有爱AI商业实战篇(二)
  • AGI时代,LLM可以在AutoML哪些环节进行增强?
  • 算法练习—day1
  • 关于ansible的模块 ③