• 首页 > 云计算频道 > 大模型

    清华系“仓颉”来了!大模型造字7天交付超40套,客户成本大降80%

    2024年10月08日 10:13:26   来源:量子位公众号

      大模型如何落地?怎么落地?成为今年科技领域的头号主题。

      在一个不为大多数人所知道的造字赛道中,这家清华创业公司——「图形起源」悄然实现商业变现:

      帮助字体公司降低80%成本,提速10倍以上。Canva可画上最受欢迎的前100套中文字体,大部分都是用他们的算法生成的。

      这个赛道足够小也确实刚需,设计公司、字体公司苦版权费用久矣。

      而他们凭借原本积累的图形学与AI的技术优势,实现了人工所不能及的效率和精度。

      来看看他们是如何发现以及靠AI造字来赚钱的。

      靠AI造字赚钱,提速10倍以上

      首先来了解一下什么是字体生产?

      传统的字体生产流程,往往需要设计师用手写的方式来完成整套字体的制作,(一套字体最多近3万字)并且在初稿完成后,还需要人工团队进行逐字校对。

      因为纯人工操作,这样一套流程下来不仅周期长,往往需要一个季度。对于字体公司来说,这是一笔不小的成本支出。

      与此同时,也正因为人工,单个字体字形质量风格等细节上不好把控。

      对于设计公司来说,制作过程中的高成本,也导致了商用版权字体采买费用的高昂。

      正是在同客户交流时,图形起源团队发现了这一行业痛点,耗时数月打造了一套字体生产线。

      这不是简单应用一个大模型就能直接生成的。字体设计最大的区别在于它是矢量图,可以无限放大而不失真。而目前AI生成的图通常是位图,有像素限制。

      如何让AI生成矢量图,理解字体的锚点和矢量曲线的含义,成为核心的技术难点。

      创始人史海天分享了他们的解决思路,整个流程分为四个阶段:

      首先,用一个传统的Diffusion模型会生成位图;

      其次,用第二个超分辨率模型,把字体位图的分辨率提到最高;

      然后,用一种独特的算法,让AI能够理解什么是“好的矢量设计”,设计第三个模型,以这种“好“的审美作为优化目标,用训练后的模型把位图转化成矢量图;

      最后,训练一个专门检查错别字和字形结构的模型。

      除此之外,他们还计划开发笔画拆分模型。

      基于这样的模型,他们能实现人类所不能达到高效和高质量。

      比如基于AI超分技术和AI矢量化,像各种笔画、偏旁部首的边缘细节处理,能禁得起任意放大维度,设计师能在海报等场景中使用。

      客户只需要完成前199个字的操作,AI就能在两天内训练并生成数万字。并且也不限于简体,像繁体字、生僻字,日文韩文拉丁这样的多语种也OK。

      在准确率上,简单字形(笔画<15)单次生成的平均生成错字率小于1%,复杂字形(笔画≥15)单次生成的平均生成错字率小于5%,已经远高于人工审校的准确度。

      现在他们还打造了一个SaaS平台,整个交付过程都可以在线上进行。客户能随时查看进度,或自己完成全部生产过程,不用图形起源的人工干预。

      据透露,目前他们已经生成了346套字体累计4680244个字

      来自图形起源

      图形起源成立于2020年底,是由当时清华大学车辆学院毕业生史海天,读硕士休学时候创办。

      在此之前,他们主要做3D创作引擎,并完成了三轮融资,受到像五源资本、真格基金等机构的青睐。当时他们的愿景是,希望在未来建立一个大众化的3D内容创作工具,以及一个普通人愿意在其中生活的社交世界。

      不过现在史海天回忆当时没有找到很好的变现场景,如今大模型的到来,带给他们全新的机遇。

      当时他们花了很长时间和资金来验证这件事情。史海天透露,他们当时训了两个大模型,一个用来识别,一个用来生成,训练目标是AI生成的字体让AI分辨不出。

      不过这个行业的优点在于,字体数据是比较全的,比如一套字能喂给AI一半字,让AI可以生成剩下一半字。

      最后他们也实现了交付级别的生成效果,目前一周能完成超过40套字体的交付,相当于效率提升了几百倍。

      目前公司主要有两个主营业务。

      中文字库扩写,也就是客户给参考字体文件,图形起源AI先进行一波学习,然后生成风格统一的字形。

      整个流程都是在SaaS平台上进行,平台上支持人工校对、二次学习、批量生成、人工二次筛选等工作,以进一步降低生成字体的错字率。

      跨语种风格迁移。顾名思义,就是根据任意语种任意字体,来生成同种风格的任意语种任意字形。

      目前他们能够稳定生成中日韩拉丁字母、希腊字母、西里尔字母,常见符号数字等,并且已经在小米应用商店有售卖。

      而像藏文、阿拉伯文等小语种文字还在内测阶段。

      最后想说,虽然现在看各个大厂都在卷生产力场景,市场很卷。但是具体到各个细分场景下,大企业也许就没有那么多的资金精力去投入。

      那些场景看上去需求有限,但确实同样也是强刚需,也能实现商业变现。比如字体,比如排版。

      对于创业公司来说,就是个不错的切入点。图形起源就是一个。

      如今大模型应用如火如荼,到底还是看能不能解决实际问题。这条真理已经是再明确不过了。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    轻松筹:“让爱不罕见”——携手公益星能量,守护罕见旅程

    为了减轻这些家庭的负担,轻松筹联合多家社会组织、爱心企业和多位明星,共同发起了“让爱不罕见”公益项目,旨在建立长效救助机制,助力罕见病患者及其家庭重燃希望之光。

    新闻

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。