当前位置: 首页 > news >正文

AI相机“妙鸭相机”原理分析和手动实现方案

妙鸭相机

一个通过上传大约20张照片,生成专属自拍。在2023年7月末爆火,根据36Kr报道,妙鸭相机系阿里系产品,挂靠在阿里大文娱体系下,并非独立公司¹。

使用方法是上传20张自拍照片,之后可以选择模板生成自己的AI艺术照

妙鸭相机模板库
妙鸭相机模板库

 

原理分析

上传照片生成常见方案有两种,一种是垫图一次性生成,效果可控性差,但是比较简单,可以使用Midjourney等在线工具实现;另一种是跑模型,利用训练好的模型实现,可控性比较好,但是前期需要一定量的训练图片。

从要求 “上传20张照片” 行为来看,应该是采用的训练模型的办法,此方案无法一次性换多张人脸。

如果用户不愿意提供大量照片实际上还可以选择roop换脸插件的办法,效果比较差,但是这种方案支持多张人脸。

简单来说,作为开发者需要做的就是:

1. 用户上传照片处理(统一切分人脸区域,改大小等方便跑模型)

2. 利用stable diffusion跑模型,应该是Lora模型(根据时间推算)

3. 利用生成好的模板特定区域局部重绘

4. 抽卡,这一步可能存在人工干预,比如选择出比较好看的几个

手动实现

每一个步骤都有人写过了,直接整理下链接点着看吧~

炼丹步骤:Stable Diffusion Lora模型训练详细教程_AI算法-图哥的博客-CSDN博客

这里准备了一份可供训练的素材,禁止商用!

链接:https://pan.baidu.com/s/1PdF2ocgqOBtRmQqtmij6RA?pwd=bjf4 
提取码:bjf4 

生成模型之后局部重绘在图生图里面,参考:图生图—AI图片生成Stable Diffusion参数及使用方式详细介绍_Coding的叶子的博客-CSDN博客

信息溯源

[1] 花9.9买套AI写真,「妙鸭相机」正让海马体们失业 | 产品观察-36氪 (36kr.com)

http://www.lryc.cn/news/108363.html

相关文章:

  • 关于计算机大学生秋招面试的那点事?(Golang篇)
  • Windows网络自学的第一天:创建线程
  • 正确的 Java 异常处理
  • RTT(RT-Thread)时钟管理
  • 基础实验篇 | uORB消息读写与自定义实验(二)
  • k8s pod数据存储Volumes
  • ZYNQ在Petalinux系统下双网口同网段的实现
  • 突破传统监测模式:业务状态监控HM的新思路 | 京东云技术团队
  • 7-16 验证“哥德巴赫猜想” (20 分)
  • GEE学习02 --设置Jupyter Notebook的打开路径
  • stm32与上位机电脑间最快的通信方式是什么?
  • pytorch学习——卷积神经网络——以LeNet为例
  • stm32 mpu6050 cubemx DMP法读取角度
  • .Net6 Core Web API 配置 log4net + MySQL
  • 校园跑腿小程序运营攻略
  • InfluxDB2如何求增量数据
  • Flink作业调度的9种状态
  • 8、Kubernetes核心技术 - ConfigMap
  • 音视频--DTMF信号发送及检测
  • 阿里云容器服务助力极氪荣获 FinOps 先锋实践者
  • C++ 通过time.windows.com获取时间
  • MPLAB加载c文件为什么不能添加到工程中的source files中
  • Tcp的粘包和半包问题及解决方案
  • 路由的hash和history模式的区别
  • CS5366+VL171母座正反插HDMI(CS5466也可搭配)国产芯片TYPEC方案设计 ASL电路原理图 集睿致远+威锋设计
  • mxgraph的核心元素详谈
  • 再探C++——默认成员函数
  • 推荐两款github敏感信息搜集工具(gsil、gshark)
  • 如何不拷贝资源的使用fork
  • 使用事件侦听器和 MATLAB GUI 查看 Simulink 信号研究