当前位置: 首页 > news >正文

精准控图工具 Concept Sliders:超好用的 控制 Lora 适配器

screenshot-20240911-140517.png

Concept Sliders

你有没有遇到这样的情况?你花费大量时间制作提示和寻找种子,以使用文本到图像模型生成所需的图像。但是,你还需要对生成图像中的属性强度(如眼睛大小或照明)进行更细致、更精细的控制。修改提示会破坏整体结构。艺术家需要保持连贯性的表达控制。你该怎么办呢?

如果你也有这样的困扰,不妨来试试 Concept Sliders。它是应用于预训练模型之上的即插即用低秩适配器。通过使用简单的文本描述或一小组配对图像,然后训练概念滑块来表示所需属性的方向。在生成时,这些滑块可用于控制图像中概念的强度,从而实现细微的调整。

Concept Sliders

main.png

Concept Sliders 实用效果

Concept Sliders 的概念滑块可以在文本提示、图像对或 StyleGAN 样式空间神经元上进行训练,以识别扩散模型中的目标概念方向,以实现精确的属性控制。

创作团队提出了两种类型的训练:单独使用文本提示和使用图像训练。对于难以用文本描述的概念或模型无法理解的概念,他们更建议使用图像对训练。这里我们讨论一下文本概念滑块的训练。

文本训练原理

image.png

文本训练原理

这个想法很简单但很强大:预训练模型 Pθ*(x) 有一些预先存在的概率分布来生成概念 t,因此我们的目标是通过形成一个新的模型 Pθ(x) 来学习模型层的一些低秩更新,该模型通过降低属性 c- 的概率来重塑其分布并根据原始预训练模型,当以 T 为条件时,提高图像中属性 c+ 的概率。

image.png

文本训练原理

这与基于组合能量的模型背后的动机相似。在扩散中,它导致了一个简单的微调方案,该方案通过减去一个组件并添加一个以目标概念为条件的组件来修改噪声预测模型。

该团队查询冻结的预训练模型以预测给定目标提示的噪声,并控制属性提示,然后在训练时使用无分类器指导而不是推理的思想来训练编辑后的模型,将其引导到相反的方向。他们发现,使用此目标微调滑块权重非常有效,可以生成一个即插即用的适配器,直接控制目标概念的属性。

image.png

文本训练原理

在实践中,他们还注意到这些概念彼此纠缠在一起。例如,当他们尝试控制一个人的 age 属性时,这个种族在推理过程中会发生变化。为了避免这种不必要的干扰,建议使用一小组保留提示来找到方向。这不是单独使用一对单词来定义属性,而是通过使用多个文本组合来定义它,找到一个改变目标属性的方向,同时保持其他 attribute-to-preserve 不变。

实际应用效果

screenshot-20240911-140002.png

使用测试效果展示

Concept Sliders 的操作其实也十分简单,只需要输入提示词然后选择自己需要调整的风格,例如我这里选择的就是手部修复,点击生成之后就可以看见用原模型与使用了Concept Sliders 的效果对比了。可以看到手部的修复系统还是十分好用的,起到了很不错的效果。

repair_all.png

官方效果图例展示

Concept Sliders 的功能还有很多,例如细节优化、粘土风格、年龄调整、肌肉调整、身材调整等十余个风格或者部位的调整。以这个修复细节的滑块展示为例,修复滑块使模型能够生成更逼真且不失真的图像。此滑块控制下的参数可帮助模型纠正其生成输出中的一些缺陷,例如 (a, b) 中扭曲的人类和宠物、(b, c, d) 中的非自然对象以及 (b,c) 中模糊的自然图像。

 有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

http://www.lryc.cn/news/435261.html

相关文章:

  • 【EI会议征稿通知】第四届材料工程与应用力学国际学术会议(ICMEAAE 2025)
  • Hadoop安全之Knox
  • SprinBoot+Vue应急信息管理系统的设计与实现
  • 索尼研究的AI部门将与AI新加坡合作开发大型语言模型
  • 【OJ刷题】双指针问题
  • 基于SpringBoot+Vue+MySQL的校园食堂订餐
  • uniapp业务实现
  • Windows和Mac命令窗快速打开文件夹
  • 智能制造云平台---附源码79117
  • 降本、创新、合作,谁才是连接器行业破除内卷的关键词?
  • 可能一拆为二,英特尔为何走到今天这一步?
  • 了解Redis集群概念,集群如何选举主节点
  • Ozon跨境商家提升销量的关键:测评补单策略与必备条件
  • 缺乏大模型经验,还有机会吗?
  • 如何阅读李冬梅老师《数据结构》
  • Python————正则表达式
  • 将你的github仓库设置为web代理
  • CTFHub技能树-Git泄漏-Index
  • vb.net发送邮件:如何高效地实现邮件发送?
  • mycat双主高可用架构部署-水评分表-范围分片配置
  • 开发模型例题
  • 一文搞懂 TS中 函数、枚举、别名 | TypeScript 入门指南 06
  • 基于JAVA+SpringBoot+Vue的前后端分离的图书馆管理系统
  • 基于SpringBoot+Vue的鲜花销售/鲜花商城/花店管理系统
  • 信号发生器在扫描模式下输出正弦波信号,需要注意设置哪些参数
  • xss-labs-master通关教程
  • 断点回归模型
  • app广告推送常见业务术语
  • 2024/9/11 小型PLC典型应用2:伺服canlink配置、指令、应用
  • 在IDEA中如何创建web项目?——不使用Archetype