当前位置: 首页 > news >正文

【书生大模型00--开源体系介绍】

书生大模型开源体系介绍

  • 0 通用人工智能
  • 1 InternLM性能及模型
  • 2 从模型到应用

大模型成为目前很热的关键词,最热门的研究方向,热门的应用;ChatGPT的横空出世所引爆,快速被人们上手应用到各领域;

0 通用人工智能

相信使用过大模型实际应用的人都会相信大模型是最终发展成为通用人工智能,更类人脑的重要途径;
AI的研究方向也从专用模型逐步拓展研究到通过模型;倾向于使用一个模型应对多种任务模型和模态;

1 InternLM性能及模型

上海人工智能实验室投入研究开发,进行大语言大模型的研究工作;

  • InternLM–在2023年6月7号正式发布。
  • InternLM-7B开源免费商用的单元模型,并开源全链条的工具体系;
  • 书生大模型系列:InternLM-7B—>InternLM-20B—>InternLM-123B;从轻量级–中量级—重量级;主要使用InternLM-20B大模型;

2 从模型到应用

从大模型到具体的应用,需要借助工具和框架来协助完成模型到应用的转换;
1.通用模型到应用的步骤图;
步骤图
2.以书生大模型为例
具体介绍其书生大模型开源开放体系的上述步骤中的部署使用
在这里插入图片描述
解释:

  • 数据方面,开源了多模态语料库书生万卷,包括2TB的数据和多种模态和任务。
  • 预训练方面,开源了InternLM-Train预训练框架,通过并行优化提高训练效率。
  • 微调方面,开源了XTuner框架,支持全参数微调和低成本微调。
    部署方面,开源了LMDeploy 框架,支持全链路部署流程。
  • 评测方面,开源了OpenCompass 评测工具,提供全方位评测能力,并提供公开的Leaderboard。
  • 应用方面,开源了Lagent和AgentLego项目,提供轻量级智能体搭建框架和丰富的工具箱。
http://www.lryc.cn/news/275690.html

相关文章:

  • 基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理
  • 一款开源的MES系统
  • https配置证书
  • 图神经网络|10.4 GCN 变换原理的解读
  • 计算机组成原理 I/O方式
  • VMWare网络配置
  • opencv期末练习题(3)附带解析
  • 51单片机之LED灯
  • 操作系统内存碎片
  • 三菱plc学习入门(二,三菱plc指令,触点比较,计数器,交替,四则运算,转换数据类型)
  • Spring学习之——代理模式
  • 【Linux】之搭建 PostgreSQL 环境
  • docker 安装elasticsearch、kibana、cerebro、logstash
  • C/C++ 联合体
  • 基于SSM的基金投资交易管理网站的设计与实现
  • JS数据类型转换成Boolean型
  • uni-app页面数据传参方式
  • 计算机网络实验(二):Wireshark网络协议分析
  • Spark内核解析-数据存储5(六)
  • ASP.NET Core高级之认证与授权(一)--JWT入门-颁发、验证令牌
  • 实例:NodeJS 操作 Kafka
  • AI实景无人直播创业项目:开启自动直播新时代,一部手机即可实现增长
  • YOLOv5改进 | 损失函数篇 | InnerIoU、InnerSIoU、InnerWIoU、FocusIoU等损失函数
  • 构建高效PythonWeb:GraphQL+Sanic
  • 【通义千问】大模型Qwen GitHub开源工程学习笔记(5)-- 模型的微调【全参数微调】【LoRA方法】【Q-LoRA方法】
  • PCL 大地坐标转空间直角坐标(C++详细过程版)
  • Linux之Shell编程
  • Unity组件开发--传送点
  • vue结合Cesium加载gltf模型
  • 逆置算法和数组循环移动算法