当前位置: 首页 > news >正文

清华系“仓颉”来袭:图形起源:用AI颠覆字体设计,推动大模型商业化落地

大模型如何落地?又该如何实现商业化?这一议题已成为今年科技领域的焦点话题。

在一个鲜为人知的字体设计赛道上,清华创业公司“图形起源”悄然实现了商业变现:他们帮助字体公司将成本降低了80%,生产速度提升了10倍以上。Canva可画平台上最受欢迎的前100套中文字体,大部分都是通过他们的算法生成的。

图片

图片

这个市场虽然规模较小,但需求却十分迫切。设计公司和字体公司长期以来深受版权费用的困扰。而图形起源凭借其在图形学和AI方面的技术优势,提供了人工无法匹敌的效率与精度。

接下来,让我们来看看他们是如何通过AI造字,发现并实现商业化的。

靠AI造字赚钱,提速10倍以上

首先,什么是字体生产?在传统的字体生产流程中,设计师通常需要手写完成整套字体的制作(最多近3万个字)。初稿完成后,还需逐字校对,这个过程往往需要数月,带来不小的成本开销。此外,由于依赖人工操作,字体的质量和风格一致性也难以保证。

正是在与客户交流时,图形起源团队发现了这一行业痛点,经过数月的研发,打造了一条全新的AI字体生产线。

但这不是简单套用大模型就能解决的。字体设计最大的挑战在于,它是一种矢量图形,能够在放大时保持清晰度。而现有的AI图像生成通常是位图,受像素限制。如何让AI生成矢量图,并理解字体的锚点和矢量曲线的含义,是其中的技术难点。

创始人史海天分享了他们的解决思路,整个流程分为四个阶段:

首先,使用传统的扩散模型生成位图;
接着,利用超分辨率模型将位图分辨率提升到最高;
然后,通过一种独特的算法,让AI理解“优质矢量设计”的标准,并基于这一标准优化模型,将位图转化为矢量图;
最后,训练一个专门用于检查错别字和字形结构的模型。

此外,他们还计划开发笔画拆分模型,进一步提升精度。

基于这些技术,他们实现了超越人类的效率和质量。例如,通过AI超分技术和AI矢量化处理,字体的细节在各种尺寸下都保持清晰,设计师可以在海报等大幅面场景中自如应用。

图片

客户只需制作前199个字,AI便能在两天内生成数万个字,并且不局限于简体,还包括繁体字、生僻字、以及日文、韩文、拉丁字母等多种语言文字。

在准确度方面,简单字形(笔画少于15)单次生成的错误率低于1%,复杂字形(笔画多于15)错误率也不到5%,远高于人工审校的水平。

目前,他们还打造了一个SaaS平台,整个交付过程可以在线完成,客户可以随时查看进度,甚至自己完成字体的生产过程,无需图形起源的人工干预。

据透露,目前他们已经生成了346套字体,累计4680244个字。

来自图形起源

图形起源成立于2020年底,由清华大学车辆学院毕业生史海天在硕士休学期间创办。在此之前,他们主要研发3D创作引擎,并完成了三轮融资,获得了五源资本和真格基金等机构的支持。彼时,他们的愿景是打造一个大众化的3D内容创作工具及社交平台。

如今,大模型技术的突破为他们带来了全新的机遇。通过大量资金和时间的投入,图形起源最终成功训练了两个大模型——一个用于识别,另一个用于生成,其目标是让AI生成的字体与人工设计难以区分。

字体行业的一个优势在于,数据相对齐全。例如,AI可以从一套字形中学习一半字,进而生成剩余的部分。如今,他们已经达到了商用交付的水平,每周可完成超过40套字体的交付,效率提升了数百倍。

当前的主营业务

图形起源的业务主要集中在两个方面:

图片

中文字库扩展:客户提供参考字体文件后,图形起源的AI会进行学习,生成风格统一的字形,整个过程在SaaS平台上进行。平台还支持人工校对、二次学习、批量生成等功能,以进一步降低错字率。

图片

跨语种风格迁移:他们的AI能够根据任意语种的字体生成其他语种的字形。目前支持中日韩、拉丁字母、希腊字母等,且已在小米应用商店销售。藏文、阿拉伯文等小语种也在测试中。

尽管大厂们在生产力领域激烈竞争,但在具体的细分场景下,创业公司往往可以找到更为灵活的切入点。图形起源在字体和排版等强需求领域的成功就是一个例子。

大模型应用的关键在于能否解决实际问题,而图形起源已经用他们的创新回答了这一命题。

http://www.lryc.cn/news/456453.html

相关文章:

  • 分布式一致性协议的深度解析:Paxos与Raft
  • ai写作,五款软件助你快速写作!
  • 解决JavaScript 数学运算精度丢失的问题
  • mysql学习教程,从入门到精通,SQL窗口函数(38)
  • gbase8s数据库实现黑白名单的几种方案
  • Qt-窗口布局按钮输入类
  • Apache DolphinScheduler社区9月进展记录
  • 在docker中安装并运行mysql8.0.31
  • C++ | Leetcode C++题解之第458题可怜的小猪
  • 【万字长文】Word2Vec计算详解(三)分层Softmax与负采样
  • 【分布式微服务云原生】探索Dubbo:接口定义语言的多样性与选择
  • SAP将假脱机(Spool requests)内容转换为PDF文档[RSTXPDFT4]
  • DNS能加速游戏吗?
  • Raspberry Pi3B+之C/C++开发环境搭建
  • [笔记] 仿射变换性质的代数证明
  • 遥感影像-语义分割数据集:sar水体数据集详细介绍及训练样本处理流程
  • 极狐GitLab 发布安全补丁版本 17.4.1、17.3.4、17.2.8
  • 汽车管理系统中使用函数
  • 大数据分析入门概述
  • 提示工程、微调和 RAG
  • 自动化测试中如何高效进行元素定位!
  • UE5数字人制作平台使用及3D模型生成
  • Linux进程被占用如何杀死进程
  • 详解Xilinx JESD204B PHY层端口信号含义及动态切换线速率(JESD204B五)
  • Java面试——场景题
  • xss-labs靶场第一关测试报告
  • 微软PowerBI认证!数据分析师入门级证书备考攻略来啦
  • 上海AI Lab视频生成大模型书生.筑梦环境搭建推理测试
  • 3D看车如何实现?有哪些功能特点和优势?
  • Pytorch中不会自动传播梯度的操作有哪些?