当前位置: 首页 > news >正文

Stable Diffusion绘画 | 来训练属于自己的模型:打标处理与优化

上一篇完成的打标工作,是为了获取提示词,让AI认识和学习图片的特征。

因此,合适、恰当、无误的提示词,对最终模型效果是相当重要的。

Tag 如何优化

通过软件自动生成的 Tag 只是起到快速建立大体架构的作用,里面会涉及到一些识别错误、重复的词,以及一部分没有识别出来的图片特征。

因此,我们需要在自动生成 Tag 的基础上,再来对应一个个图片进行手动调整,

从而达到减少过度拟合,提高泛用性的效果。

Tag 的保留与删除

我们可以按照 主题+静态特征+动态特征+视角+环境+其他 的公式来考虑补充提示词。

21

主体:1woman

静态特征:blonde hair, blue eyes, red lips

动态特征:looking at viewer, smile

视角:upper body

环境:night

其他:Blurred background

关于 Tag 的是否要保留的原则:

首先要确定哪些特征需要保留?

  • 要保留的特征,就不要记录特征 Tag;

  • 不需要保留,想自定义的特征,记录 Tag

如何批量修改 Tag

BooruDatasetTagManager:https://github.com/starik222/BooruDatasetTagManager/releases

image-20240907144127892

下载解压后,双击 BooruDatasetTagManager.exe 运行:

image-20240907144315872

首选设置,修改系统语言、翻译语言:

image-20240907144617498

image-20240907144712847

加载图片文件夹,读取上一篇在 cybertronfurnace 生成的打标文件夹:

image-20240907145325713

翻译所有标签:

image-20240907145531589

显示标签出现次数:

image-20240907201519581

接下来,就是通过这个软件, 认真细致地对各个图片的便签进行优化和调整。

是一件比较枯燥的事,需要有足够的耐心。

今天先分享到这里~


开启实践:SD绘画 | 为你所做的学习过滤

http://www.lryc.cn/news/451862.html

相关文章:

  • 【论文笔记】Visual Instruction Tuning
  • ubuntu 设置静态IP
  • Java 每日一刊(第19期):泛型
  • windows下安装rabbitMQ并开通管理界面和允许远程访问
  • 深度剖析音频剪辑免费工具的特色与优势
  • Oracle中TRUNC()函数详解
  • 【Spring Boot 入门一】构建你的第一个Spring Boot应用
  • PPT 快捷键使用、技巧
  • Web安全 - 文件上传漏洞(File Upload Vulnerability)
  • vue3中el-input在form表单按下回车刷新页面
  • SQL Server中关于个性化需求批量删除表的做法
  • 关于按键状态机解决Delay给程序带来的问题
  • 62.【C语言】浮点数的存储
  • GO网络编程(一):基础知识
  • 【Linux】用虚拟机配置Ubuntu环境
  • 酒店智能门锁SDK接口pro[V10] 门锁校验C#-SAAS本地化-未来之窗行业应用跨平台架构
  • Gitのrebase用法
  • 二分查找一>:在排序数组中查找元素的第一个和最后一个位置
  • undeclared identifier ‘UNITY_PREV_MATRIX_M‘ - Unity Shader自己写URP,引用内部 hlsl
  • 信息安全工程师(29)存储介质安全分析与防护
  • Html5知识点介绍
  • 探索机器学习中的特征选择技术
  • 数造科技入选中国信通院《高质量数字化转型产品及服务全景图》三大板块
  • 什么是分布式数据库
  • 从u盘直接删除的文件能找回吗 U盘文件误删除如何恢复
  • 如何使用ssm实现基于HTML的中国传统面食介绍网站的搭建+vue
  • 【生成模型】学习笔记
  • 大语言模型知识点分享
  • openpnp - 底部相机高级校正的参数设置
  • 劳动与科技、艺术结合更好提高劳动教育意义