当前位置: 首页 > news >正文

AI绘图模型不会写字的难题解决了

介绍

大家好,最近有个开源项目比较有意思,解决了图像中不支持带有中文的问题。
https://github.com/tyxsspa/AnyText。

为什么不能带有中文?

数据集局限

Stable Diffusion的训练数据集以英文数据为主,没有大量包含其他语言文本的图像数据。这导致模型对非英文语言的理解和生成能力比较弱。

DALL·E 3 也是类似情况,带有英文情况可以,带有其它语言效果不理想。

多语言处理能力有限

Stable Diffusion的底层语言模型是英文预训练的,没有经过中文细化。它对中文词汇、语法、语义的理解和生成能力有限。

文本渲染能力有限

将文本渲染成逼真图像方面存在局限性,较难生成自然、连贯的中文文本。

DALL·E 3

AnyText的绘图工具

阿里巴巴推出开源项目,指定位置精准地向图中加入文字。

项目支持中英日韩四种语言,如图。

https://github.com/tyxsspa/AnyText/blob/main/docs/sample.jpg

快速使用

官网提供两个环境。
https://huggingface.co/spaces/modelscope/AnyText
https://modelscope.cn/studios/damo/studio_anytext/summary
https://modelscope.cn/studios/damo/studio_anytext/summary
https://modelscope.cn/studios/damo/studio_anytext/summary

在这里插入图片描述

架构

AnyText
AnyText的架构,一个基于扩散方法设计的文本生成和编辑系统。

  1. 辅助潜在模块:

    • 输入包括文本字形、位置和遮蔽图像。
    • 生成有助于在图像中创建或修改文本的潜在特征。
  2. 文本嵌入模块:

    • 利用光学字符识别(OCR)模型将笔画数据编码成嵌入。
    • 这些嵌入与由分词器产生的图像标题嵌入相结合。
    • 结果是与图像背景无缝融合的文本。

为了训练这个模型,使用了特定的损失函数:

  • 文本控制扩散损失: 旨在确保生成的文本准确地遵循控制条件(如位置、风格)。
  • 文本感知损失: 提高文本的感知精度,确保其与图像的视觉方面(如字体和比例)保持一致。

这个系统允许准确地生成文本,与图像内容的上下文和视觉效果协调一致。

总结

现在不支持stable diffusion webui 插件,使用只能在官方Demo或者写代码执行。

欢迎交流分享这方面问题,我也深入再尝试下。

朋友们帮忙点赞关注收藏!

http://www.lryc.cn/news/273997.html

相关文章:

  • vue-cli创建项目时由esLint校验导致报错或警告的问题及解决
  • uniapp:实现手机端APP登录强制更新,从本地服务器下载新的apk更新,并使用WebSocket,实时强制在线用户更新
  • 设计循环队列——oj题622
  • 阿里后端实习一面面经
  • element-ui组件DatePicker日期选择器移动端兼容
  • burpsuite 爆破
  • SparkSQL基础解析(三)
  • gz-hamonic 安装提示缺少许多依赖无法安装
  • 新版Edge卸载
  • Ansibe自动化基础
  • 2023 年中国高校大数据挑战赛赛题B DNA 存储中的序列聚类与比对-解析与参考代码
  • 决策树--分类决策树
  • 【2024/1/5】
  • CNN——VGG
  • 深入理解Java中的多线程编程与并发控制
  • 提供10个mysql的实例和思路
  • FPGA项目(14)——基于FPGA的数字秒表设计
  • 浅谈指数移动平均(ema)
  • 1-并发编程线程基础
  • vue中动态出来返回的时间秒数,在多少范围显示多少秒,多少范围显示分,小时等等
  • English: go through customs
  • Nginx 多端口部署多站点
  • 从零开始配置kali2023环境:配置jupyter的多内核环境
  • Dart调用JS对10000条定位数据滤波
  • 大模型应用实践:AIGC探索之旅
  • 【.NET Core】异步编程模式
  • macOS通过外置驱动器备份数据
  • rtsp解析视频流
  • 【物联网】手把手完整实现STM32+ESP8266+MQTT+阿里云+APP应用——第3节-云产品流转配置
  • Spring Cloud Config相关问题及答案(2024)