当前位置: 首页 > news >正文

大模型实战营Day1 书生·浦语大模型全链路开源体系

 1.大模型为发展通用人工智能的重要途经

专用模型:针对特定任务解决特定问题
通用大模型:一个模型对应多模态多任务
 2.InternLM大模型开源历程


3.InternLM-20B大模型性能


4.从模型到应用:智能客服、个人助手、行业应用


5.书生浦语全链条开源开放体系


6.数据

书生万卷(文本、图像文本、视频)

 OpenDataLab(提供智能标注工具)

7.预训练:InterLM-Train(全面)


8.微调:XTuner(高兼容)


部分参数微调LoRA:固定已有参数,加入新参数进行微调。

显存优化:最低支持8GB显卡(2080、4060)-7B模型微调

自动优化加速

适配多种开源生态

多种微调算法
9.测评:OpenCompass


全球领先的大模型开源评测体系

平台架构

特点:丰富模型支持、丰富的API、分布式评测能力、便捷的数据集接口构建自己的数据集、快速迭代、用户遍布。

10.部署

大语言模型特点 技术挑战 部署方案

LMDeploy全流程解决方案:模型轻量化 推理和服务

推理性能遥遥领先

11.智能体应用

大模型驱动智能体
智能体以大模型为核心,进行调用、规划、推理和执行。

轻量级智能体框架Lagent


多模态智能体工具箱AgentLego

http://www.lryc.cn/news/275092.html

相关文章:

  • Java 集合面试题真实场景还原
  • AutoSAR(基础入门篇)4.9-Autoar_BSW小结
  • Winform中使用Websocket4Net实现Websocket客户端并定时存储接收数据到SQLite中
  • Jenkins修改全局maven配置后不生效解决办法、以及任务读取不同的settings.xml文件配置
  • 【elfboard linux开发板】7.i2C工具应用与aht20温湿度寄存器读取
  • LeetCode-有效的字母异位词(242)
  • 【AIGC-图片生成视频系列-6】SSR-Encoder:用于主题驱动生成的通用编码器
  • [C]jupyter中使用C
  • 探讨一下WebINFO 下的一些思考
  • MySQL中的开发基于Python的SQL工具类操作数据库简单示例
  • 安卓Android Studio读写FM1208CPU卡源码
  • 二、Redis的特性与应用场景
  • 编程笔记 html5cssjs 019 HTML实体
  • 数据结构:树详解
  • list1.Sort((m, n) => m.Id - n.Id); id是double类型的为什么回报错
  • GoLang vs Python
  • Hello 2024(A~D,F1)
  • Python+Torch+FasterCNN网络目标检测识别
  • v8 pwn利用合集
  • JVM:字节码
  • 常见网络设备及功能详解
  • Python教程(20)——python面向对象编程基本概念
  • C# Winform教程(一):MD5加密
  • Mongodb使用指定索引删除数据
  • 虾皮怎么选品:虾皮(Shopee)跨境电商业务成功的关键步骤
  • QML —— 使用Qt虚拟键盘示例(附完整源码)
  • Nacos 持久化及集群的搭建【微服务】
  • win10下vscode+cmake编译C代码操作详解
  • 网络安全红队常用的攻击方法及路径
  • 【基于openGauss2.1.0企业版安装X-Tuner参数调优工具】