当前位置: 首页 > news >正文

swift使用代码结构解析

多模态模型的训练llamafactory也可以训练,但是总的来说,llamafactory对多模态模型的支持还是不太多,ms-swift支持的多模态模型更多,因此有时候去找框架是否够支持相应的模型时会有所困难,所以对这些框架的代码也要稍微熟悉一些。

1.model_type

模型支持在swift/llm/utils/model.py中,目前能够支持的多模态模型还是很多,这对我们做一些实验室相对方便的,直接我记得我sft qwenvl时还有bs不能大于1的bug,不知道目前解决了没有,目前我实验的llava和internvl2都没有bs=1的限制了。目前llama-vision只能在最新的swift的main分支中,还有合并进最新版本,不过问题也不大。

2.swift对数据的支持包括两种

一种是data.jsonl中添加,这和llamafactory一致的

另一种直接加载相应的转换格式的jsonl或者json文件。

3.template_type

swift中的参数基本都是一致的,没有太多需要调的空间,唯一需要调整的也就是model_type和template_type了,swift/llm/utils/template.py,其实这种框架本质上都是依赖hf的transformer和peft等库进行训练的,当然trainer基本都是自家封装的,但是训练这块基本都是相似的transformer的模式,因此其实更多的还是数据转换,一些预处理之类的东西有所区别。

4.参数

swift/llm/utils/argument.py中,主要关注的就是SftArguments了。

http://www.lryc.cn/news/456618.html

相关文章:

  • 五、Python基础语法(程序的输入和输出)
  • 【C语言】常见概念
  • Electron应用创建和打包
  • 代码随想录算法训练营第五六天| 99. 岛屿数量 100. 岛屿的最大面积
  • 图解 微信开发者工具 小程序源码 调试、断点标记方法 , 微信小程序调试器,真机调试断点调试方法,小程序网络API请求调试方法 总结
  • 注释,换行,控制台输入输出,命名空间,省略return语句
  • 宠物空气净化器该怎么选?希喂,小米、安德迈这三款好用吗?
  • 【Mybatis篇】Mybatis的注解开发
  • NEC协议
  • Meta 发布 Quest 3S 头显及 AR 眼镜原型:开启未来交互新视界
  • 【CSS】水平垂直居中
  • 欧盟零毁林法案 EUDR
  • 26.删除有序数组中的重复项
  • JAVA实现公众号扫码登录和关注功能实战
  • 初识Mysql/备份,基础指令
  • 没想到吧!线稿上色居然可以这么简单
  • 修改Docker的默认存储路径
  • 深入计算机语言之C++:C到C++的过度
  • HR面试篇
  • 深度探索Kali Linux的精髓与实践应用
  • 【在Linux世界中追寻伟大的One Piece】DNS与ICMP
  • 信息安全工程师(41)VPN概述
  • 算法:双指针系列(一)
  • 跟《经济学人》学英文:2024年09月28日这期 The curse of the Michelin star
  • Java Set 的介绍与实现原理
  • 我谈均值平滑模板——给均值平滑模板上升理论高度
  • WordPress添加https协议致使后台打不开解决方法
  • 如何使用pymysql和psycopg2执行SQL语句
  • linux无法使用ll命令
  • STM32输入捕获模式详解(上篇):原理、测频法与测周法