当前位置: 首页 > news >正文

finetuning大模型准备(基于Mac环境)

为finetuning进行的热身准备,涉及周边的软件工具,方法。

问题1:finetuning过程较长,采用系统自带命令行没有后台,前台被杀后,容易造成训练失败。

解决方法: tmux可以开启后台训练

问题2:大模型训练过程会有几个G 的bin等文件,不宜下载频繁

解决方法:Git LFS可以进行git屏蔽和指定文件下载

1. tmux

1.1 安装:

brew install tmux

1.2 启动

启动:tmux

1.3 查看已创建的会话

1.4 分屏

①ctrl + B 松开

②shift + %

1.5 分屏后的窗口中的光标互相切换

快捷键:先按ctrl+b, 放开后再按下o

1.6 新建session

tmux new -s Session-name

1.7 进入一个已知会话

tmux a -t Session-name

1.8 关闭会话

tmux kill-session -t Session-name

2.Git LFS

Git LFS(Large File Storage)是一个用于版本控制系统中管理大文件(如视频、图形或大型数据文件)的扩展

以chatglm3-6b模型为例,如下:

很多1个多G的文件着实很大。每次下载都需要把不同分支的内容下载下来,内容会非常大,浪费时间。lfs是个不错的选择。

2.1 lfs安装

git lfs install

2.2 配置lfs 克隆

GIT_LFS_SKIP_SMUDGE=1 git clone <repository-addr>

即时git pull 也不会把大文件拉下来。

2.3 指定匹配对象

git lfs fetch --include 命令允许你指定要下载的LFS对象的路径模式。这意味着你可以选择只下载与给定模式匹配的LFS对象,而不是下载整个仓库的所有LFS对象。

这个命令会下载与指定模式匹配的所有LFS对象,并将其存储在本地LFS缓存中。

2.4 下载

git lfs checkout用于将 LFS 追踪的大文件从远程存储库下载到本地工作副本

工欲善其事,必先利其器

开始训练:

http://www.lryc.cn/news/360350.html

相关文章:

  • js检验一个字符串是否是正确时间格式的工具方法
  • 大型制造业集团IT信息化总体规划方案(65页PPT)
  • 【LIN】STM32新能源汽车LIN通信实现过程
  • 【LeetCode:575. 分糖果+ 哈希表】
  • 全文检索-ElasticSearch
  • C编程惯用法:深入剖析与实战指南
  • MySQL数据表的设计
  • Flutter开发效率提升1000%,Flutter Quick教程之对写好的Widget进行嵌套
  • 2020编程语言排序:探索编程界的热门与趋势
  • 提高工作效率的招数
  • css特殊效果和页面布局
  • JavaScript中对象的增删改查
  • 技术周总结 2024.05.27~06.02(java bean冲突 软件工程)
  • 「前端+鸿蒙」核心技术HTML5+CSS3(八)
  • 15届蓝桥杯决赛,java b组,蒟蒻赛时所写的题思路
  • 2024蓝桥杯国赛C++研究生组游记+个人题解
  • C#WPF数字大屏项目实战07--当日产量
  • MyBatis源码分析--02:SqlSession建立过程
  • SOUI Combobox 实现半透明弹出下拉框
  • Python 猜数系统 PyQt框架 有GUI界面 (源码在最后)【含Python源码 MX_002期】
  • npm install pubsub-js报错的解决汇总
  • nuxt2:自定义指令 / v-xxx / directives / 理解 / 使用方法 / DEMO
  • 基础—SQL—DCL(数据控制语言)小结
  • 一文彻底讲透 PyTorch
  • JVM常用概念之锁粗化和循环
  • HTML (总结黑马的)
  • YOLOv8 segment介绍
  • PMBOK® 第六版 项目整合管理概念
  • 【Qt】【模型视图架构】代理模型
  • Flutter 中的 IconTheme 小部件:全面指南