当前位置: 首页 > news >正文

InternVL 微调实践

任务

follow 教学文档和视频使用QLoRA进行微调模型,复现微调效果,并能成功讲出梗图.

复现过程

参考教程部署:https://github.com/InternLM/Tutorial/blob/camp3/docs/L2/InternVL/joke_readme.md
训练
在这里插入图片描述

合并权重&&模型转换

python3 xtuner/configs/internvl/v1_5/convert_to_official.py xtuner/configs/internvl/v2/internvl_v2_internlm2_2b_qlora_finetune.py /root/InternLM/work_dir/internvl_ft_run_8_filter/iter_1000.pth /root/InternLM/InternVL2-2B/

模型在这
在这里插入图片描述

最后效果

在这里插入图片描述

http://www.lryc.cn/news/449403.html

相关文章:

  • 自然语言处理在人工智能领域的发展历程,以及NLP重点模型介绍
  • Replit Agent:AI驱动的全自动化软件开发革命
  • SAP调用发起泛微OA流程
  • JAVA毕业设计184—基于Java+Springboot+vue3的企业信用信息管理系统(源代码+数据库)
  • webshell-HTTP常见特征
  • docker简单熟悉
  • 《深海迷航》风灵月影修改器进阶教程:揭秘海底无限奥秘
  • 为什么说函数传递参数最好小于四个
  • 三维立体自然资源“一张图”
  • 语言的重定向
  • Snap 发布新一代 AR 眼镜,有什么特别之处?
  • 从填空到生成:GLM的预训练新视界
  • 4. 将pycharm本地项目同步到(Linux)服务器上——深度学习·科研实践·从0到1
  • 「Python入门」vscode的安装和python插件下载
  • java-netty客户端断线重启
  • MySQL的基础用法一
  • Linux:进程地址空间
  • 数据结构:树、森林
  • AI Agent应用出路到底在哪?
  • 一文了解构建工具——Maven与Gradle的区别
  • electron介绍
  • Redis-持久化
  • 封装轮播图 (因为基于微博小程序,语法可能有些出入,如需使用需改标签)
  • 【Ubuntu】minicom安装、配置、使用以及退出
  • MYSQL的监控
  • CTF ciscn_2019_web_northern_china_day1_web2
  • linux中vim编辑器的应用实例
  • 智慧城市交通管理中的云端多车调度与控制
  • 分治(归并排序)
  • 小学生为什么要学英语