当前位置：首页 > news >正文

AI相机“妙鸭相机”原理分析和手动实现方案

news 2025/8/8 18:27:43

妙鸭相机

一个通过上传大约20张照片，生成专属自拍。在2023年7月末爆火，根据36Kr报道，妙鸭相机系阿里系产品，挂靠在阿里大文娱体系下，并非独立公司¹。

使用方法是上传20张自拍照片，之后可以选择模板生成自己的AI艺术照

原理分析

上传照片生成常见方案有两种，一种是垫图一次性生成，效果可控性差，但是比较简单，可以使用Midjourney等在线工具实现；另一种是跑模型，利用训练好的模型实现，可控性比较好，但是前期需要一定量的训练图片。

从要求 “上传20张照片” 行为来看，应该是采用的训练模型的办法，此方案无法一次性换多张人脸。

如果用户不愿意提供大量照片实际上还可以选择roop换脸插件的办法，效果比较差，但是这种方案支持多张人脸。

简单来说，作为开发者需要做的就是：

1. 用户上传照片处理（统一切分人脸区域，改大小等方便跑模型）

2. 利用stable diffusion跑模型，应该是Lora模型（根据时间推算）

3. 利用生成好的模板特定区域局部重绘

4. 抽卡，这一步可能存在人工干预，比如选择出比较好看的几个

手动实现

每一个步骤都有人写过了，直接整理下链接点着看吧~

炼丹步骤：Stable Diffusion Lora模型训练详细教程_AI算法-图哥的博客-CSDN博客

这里准备了一份可供训练的素材，禁止商用！

链接：https://pan.baidu.com/s/1PdF2ocgqOBtRmQqtmij6RA?pwd=bjf4
提取码：bjf4

生成模型之后局部重绘在图生图里面，参考：图生图—AI图片生成Stable Diffusion参数及使用方式详细介绍_Coding的叶子的博客-CSDN博客

信息溯源

[1] 花9.9买套AI写真，「妙鸭相机」正让海马体们失业 | 产品观察-36氪 (36kr.com)

查看全文

http://www.lryc.cn/news/108363.html

关于计算机大学生秋招面试的那点事？（Golang篇）

Windows网络自学的第一天：创建线程

正确的 Java 异常处理

RTT（RT-Thread）时钟管理

基础实验篇 | uORB消息读写与自定义实验(二)

k8s pod数据存储Volumes

ZYNQ在Petalinux系统下双网口同网段的实现

突破传统监测模式：业务状态监控HM的新思路 | 京东云技术团队

7-16 验证“哥德巴赫猜想” （20 分)

GEE学习02 --设置Jupyter Notebook的打开路径

stm32与上位机电脑间最快的通信方式是什么？

pytorch学习——卷积神经网络——以LeNet为例

stm32 mpu6050 cubemx DMP法读取角度

.Net6 Core Web API 配置 log4net + MySQL

校园跑腿小程序运营攻略

InfluxDB2如何求增量数据

Flink作业调度的9种状态

8、Kubernetes核心技术 - ConfigMap

音视频--DTMF信号发送及检测

阿里云容器服务助力极氪荣获 FinOps 先锋实践者

C++ 通过time.windows.com获取时间

MPLAB加载c文件为什么不能添加到工程中的source files中

Tcp的粘包和半包问题及解决方案

路由的hash和history模式的区别

CS5366+VL171母座正反插HDMI（CS5466也可搭配）国产芯片TYPEC方案设计 ASL电路原理图集睿致远+威锋设计

mxgraph的核心元素详谈

再探C++——默认成员函数

推荐两款github敏感信息搜集工具（gsil、gshark）

如何不拷贝资源的使用fork

使用事件侦听器和 MATLAB GUI 查看 Simulink 信号研究

妙鸭相机

原理分析

手动实现

信息溯源

相关文章：