当前位置: 首页 > news >正文

【InternLM实战营第二期笔记】02:大模型全链路开源体系与趣味demo

文章目录

  • 00 环境设置
  • 01 部署一个 chat 小模型
    • 作业一
  • 02 Lagent 运行 InternLM2-chat-7B
      • 运行一个工具调用解方程
  • 03 浦语·灵笔2
    • 进阶作业

第二节课程视频与文档:
https://www.bilibili.com/video/BV1AH4y1H78d/
https://github.com/InternLM/Tutorial/blob/camp2/helloworld/hello_world.md

视频和文档内容基本重合,因此这次笔记也同时记录和推进
在这里插入图片描述

课程分成这四个部分;社区也随训练营产生了多个兴趣小组:
在这里插入图片描述
估计是完成训练营后可以加入其中继续学习和研究。

00 环境设置

在这里插入图片描述
完成作业一官方会发放算力点,兑换成开发机的使用配置*时间。
第一次配置开发机需要十分钟左右,后续再开会快很多。
第一个项目需要的算力比较少,因此选择了资源最小的配置+4小时时长,但真正跑起来发现可能时间非常紧张,仅安装环境差不多需要一个小时时间,IO 效率太离谱了……但免费的教学资源也不好多说啥。
忍忍吧。

PS. 教程中的等效配置理论上会快一些,注意要把-c pytorch -c nvidia去掉。开发机的网络环境访问不了这些源。
我低估了“配置环境较长,需耐心等待”的离谱程度

01 部署一个 chat 小模型

安装完环境,剩下的流程就非常简单了。跑过本地模型的人都比较熟悉,教程提供了相应脚本,下载权重,运行脚本加载、推理即可。

作业一

在这里插入图片描述
下载八戒微调版本:
在这里插入图片描述
可见网速是非常快的,但推理速度比较慢。
运行体验:

python /root/Tutorial/helloworld/bajie_download.py
streamlit run /root/Tutorial/helloworld/bajie_chat.py --server.address 127.0.0.1 --server.port 6006

我也是 windows 用户,不过由于上方命令是直接在 IDE 的 terminal 中运行的,VS Code 自动提供了端口转发。

streamlit 提供了在线对话 UI,趁后台在慢悠悠加载模型,去瞅一眼 bajie_chat.py 的代码:
在这里插入图片描述

  • 生成设置
  • 交互处理
  • 加载模型
  • ……

模型加载好了:
在这里插入图片描述

换了几条 Query 都能接上,自我认知倒是入心入脑了。

02 Lagent 运行 InternLM2-chat-7B

按照教程下载项目文件并安装,五分钟左右安装完 Lagent 的教学版本并加载模型。
同样,WebIDE 是你的好帮手,直接运行点击弹出的提示跳转到页面即可:
在这里插入图片描述

运行一个工具调用解方程

在这里插入图片描述

03 浦语·灵笔2

进阶作业

在这里插入图片描述
网页怎么没有正常渲染出来呢……

换到 VQA 模型,好像有同样的问题:
在这里插入图片描述
不知道问题出在哪……这个作业的花费时间有点超出我预计,第二节容我先这样吧.

http://www.lryc.cn/news/356691.html

相关文章:

  • Postgresql源码(134)优化器针对volatile函数的排序优化分析
  • DES加密算法笔记
  • C语⾔:内存函数
  • SqliSniper:针对HTTP Header的基于时间SQL盲注模糊测试工具
  • 3W 1.5KVDC 隔离 宽范围输入,双隔离双输出 DC/DC 电源模块——TPD-3W系列
  • [java基础揉碎]文件IO流
  • [面经] 西山居非正式面试(C++)
  • SOLIDWORKS教育版代理商应该如何选择?
  • 翻译《Use FILE_SHARE_DELETE in your shell extension》
  • 使用Python发送电子邮件
  • Linux-CentOS7-解决vim修改不了主机名称(无法打开并写入文件)
  • 【RuoYi】使用代码生成器完成CRUD操作
  • 七个很酷的GenAI LLM技术性面试问题
  • SARscape雷达图像处理软件简介
  • 开源博客项目Blog .NET Core源码学习(23:App.Hosting项目结构分析-11)
  • 一.ffmpeg 将内存中的H264跟PCM 数据流合成多媒体文件
  • C++ (week5):Linux系统编程3:线程
  • 二叉树习题精讲-相同的树
  • 「架构」模型驱动架构设计方法及其运用
  • 基于 React + Nest 全栈开发的后台系统
  • jQuery值操作例子 (代码)
  • Next-Admin,一款基于Nextjs开发的开箱即用的中后台管理系统(全剧终)
  • HTML5 文件处理及应用
  • 逻辑分析仪的调试使用
  • AI学习指南数学工具篇-Python中的凸优化库
  • 数据库mysql
  • AWS联网和内容分发之Transit Gateway
  • 牛客NC236 最大差值【simple 动态规划 Java/Go/PHP】
  • ORACLE 6节点组成的ACFS文件系统异常的分析思路
  • vscode当前分支有未提交的修改,但是暂时不想提交,想要切换到另一个分支该怎么办