当前位置: 首页 > news >正文

Datawhale X 魔搭 AI夏令营(2024第四期)AIGC方向 学习笔记

粗谈

这一期是使用可图+lora微调进行文生图任务的比赛

文生图也算是跨模态了,输入Prompt文本,输出图片。Prompt很重要,分为prompts和negative prompts。可以指导结果图片的生成。

lora可以参考我上期夏令营的文章:Datawhale AI 夏令营(2024第三期)AI+逻辑推理方向 模型微调学习笔记。在文生图的这个使用场景下,使用LoRA调整模型参数以实现对特定主题、风格或任务的精细化控制。

Confy UI是一个可视化工具,允许模型训练者以一个流程图的形式,进行数据预处理、模型微调、图像生成。很方便,不过目前我还没有搭建起来。
在这里插入图片描述
参考图控制是一种根据某种参考图指导模型生成图片样式的方式。如下图。是基于扩散模型,对初始随机噪点扩散到完整图片的方式。
在这里插入图片描述

baseline

稍微看了下代码,流程还是下载模型和数据集、数据预处理、lora微调、图片生成。代码里通过torch.manual_seed(seed)方便我们复现此次图片生成。

下面是我调出来的图片。剧情是用moonshot生成的,大概就是一个邮递员的梦游历险记,意外获得地图->历尽艰辛->获得巫师认可,被赐予贵重的项链->原来只是个梦,但桌上确实有那个项链。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

TODO

  • 使用更适合自己想法的训练集,微调模型能力
  • 学习prompt是怎么指导模型生成的
  • 看能不能搭下Confy UI
http://www.lryc.cn/news/421203.html

相关文章:

  • VScode前端环境搭建
  • Python自动化测试之selenium - 元素定位
  • 深入探索 npm cache clean --force:清理 npm 缓存的艺术
  • 如何看待“低代码”开发平台的兴起?
  • 自动控制——过阻尼、欠阻尼、临界阻尼及无阻尼
  • 从AlphaGo到AlphaPong:AI乒乓球机器人将如何改变乒乓球竞技?
  • 荒原之梦:考研期间可以玩游戏吗?
  • Hive SQL ——窗口函数源码阅读
  • 用python的Manim 创建大括号
  • 白骑士的Matlab教学附加篇 5.2 代码规范与最佳实践
  • Javaweb--SpringBoot
  • 【数据结构】算法的时间复杂度与空间复杂度
  • PyCharm环境python开发上位机
  • ROS 2 参数使用
  • QT的Model-View实现大批量数据展示
  • 2024年8月7日(mysql主从 )
  • 接口/自动化测试 面试集合
  • 菜鸡勇闯第136场双周赛
  • 趋动科技陈飞:从小模型到大模型,AI时代下的数据中心建设
  • yolo v8 + flask部署到云服务器,以及问题记录
  • 【科研必备插件】easyscholar如何使文章显示期刊影响因子与分区等级
  • UE5 UrlEncode转换
  • 【QML】Qt.rgba()的正确使用方法
  • centos7.9 docker安装
  • spring操作数据库
  • Apache Flink中TaskManager,SubTask,TaskSlot,并行度之间的关系
  • 马斯克xAI新计划:人工智能模型Grok 2测试版即将发布
  • 【机器人学】6-4.六自由度机器人运动学参数辨识-机器人精度验证【附MATLAB代码】
  • 分销商城小程序系统渠道拓展
  • WPF篇(14)-ProgressBar进度条+Calendar日历控件+DatePicker日期控件