解读大模型价格战：着急的大厂

2024年05月27日 11:57:57 FP 研究中心 来源：极客公园

　　自 5 月 6 日 DeepSeek 提出降价、实现百万 Tokens 输入 1 元开始，字节、智谱、阿里、百度、讯飞、腾讯等也先后加入到降价浪潮中。到 5 月 22 日，ERNIE Speed、ERNIE Lite、讯飞星火 Lite、混元-lite 模型等均已实现限定条件下免费。

　　国内大模型厂商，尤其是以云厂商为代表的模型公司，掀起的降价潮，已经超越了在行业内产生影响，更引发了大众层面的关注。百度指数上「大模型」关键词在近两周也有大幅提升。

　　激进的云厂商的意图路人皆知：通过降低试用成本，吸引大量试用型开发者;通过模型成本降低，加强云及其他产品的售卖。这背后的一个重要原因则是：大模型层面的竞争激烈，但目前各家差距并不明显，没有谁能一骑绝尘、遥遥*，降低成本很可能是一个*的业务策略及竞争策略。

　　与市场主流预期不同，模型层创业公司现阶段还暂未恐慌：

　　大厂的「降价」当前还有很多的限定条件，真要用起来成本或许并没有宣传的那么低;在开发者依然会考虑性能的当下，给创业公司依然留下了生存空间;

　　大厂的「降价」宣传加强了市场教育，利好全行业，有厂商告诉 Founder Park 研究中心，近期常规的(非刻意因为降价预付)充值、续费率还略有增长);

　　有模型厂商的公司高管认为，大厂开源的都是小模型，当用户量增加时，可能要花费更多精力优化小模型，反而创业公司有可能能有机会优化大参数模型，同时大厂的降价或有可能吸引一部分灰产，很可能需要花精力应对灰产。

　　但不管对于大厂还是模型层创业公司而言，降低 Token 成本都是未来大势所趋。便宜的模型、繁荣的开发者生态、*方应用都是这场「百模大战」接下来竞争关键。

　　大厂没有讲明的点：

　　降价后成本可能依然很贵

　　Founder Park 研究中心与行业交流，获知的信息，得出的结论更偏向于：对开发者来说当前的降价更像是「试用装」，适合要试用大模型的客群，对行业的直接影响并不大。

　　这主要是因为：

　　*，当前部分厂商的「降价」中没有提 TPM(每分钟处理内容量)、RPM(每分钟请求数)两个限定条件。随着这两个重要数值的增加，其成本也会提升。

　　第二，部分模型「降价」重点降低了输入端的 Token 价格，输出端降价低于输入。

　　第三，此前很多国内大模型都会在注册时赠送部分 Token，或者在中小开发者的应用快速起量时给与 Token 支持，基本接近「免费」或者「低价」。

　　在「降价潮」的两周内，整个市场的舆论也经历了几个阶段：

　　Token 成本因为算法迭代大幅压低后的行业关注;

　　Token 成本因为商业策略大幅降低后的大众关注;

　　大规模降价引发了行业就大厂是否真降价的反思与讨论，如高 TPM、RPM 下的实际成本讨论;

　　大厂模型大规模降价后引发的投资圈反思，如独立模型层创业者是否还有机会，大厂逼迫模型层公司不得不做应用成为自己*的客户;

　　降价能不能解决大模型商业模式的反思。

　　整体来看，这次降价潮中，大众层面吃瓜降价热点，但很多开发者反应相对平淡。这主要是因为：

　　*，实际部分应用场景中，开发者调用的仍主要是 OpenAI 的接口。其他模型则根据场景不同各有优劣。

　　第二，在早期量不大的情况下，开发者更在意的是切换模型是否会影响产品效果，是否会存在业务风险。

　　第三，很多潜在开发者或者潜在客户还处于找 TPM、PMF 的阶段，面临「找不到使用场景」、「不知道怎么用」等现实难题。

　　大厂谈「免费」，

　　创业者怎么办？

　　从 Founder Park 近期与行业交流的信息来看，当前模型层创业公司暂未产生媒体宣传中的恐慌。

　　多家创业公司的从业者告诉 Founder Park，大厂的「降价」、「免费」宣传加强了市场教育，利好全行业。

　　更为重要的意义是，这也给了应用侧行业信心，未来的 Token 成本一定是「便宜到可以忽略不计」的，会变成行业的基础设施，可以在这样的前提背景下解决真实问题、关键问题。

　　但对于独立的模型厂商来说，市场竞争会牵引行业在这个点上饱和攻击，最终让 Token 成本趋近于免费。接下来的竞争策略都是不得不思考的问题。这其中既包括业务模式的思考，也包括通过技术手段降低成本。

　　首先，如果模型本身可能很难收到钱，独立的模型厂商就不得不自研应用，考虑靠应用收回部分成本。大厂的模型降价潮奠定了未来模型本身可能不一定能赚钱的基调，模型厂商就不得不思考这一转变。Founder Park 近期与一些关注 AGI 的投资人交流，对方也表达了类似的观点。

　　从资本的视角来看，模型层公司自己研发应用一直很重要。但以往，主要是因为要对外传达自己是自己模型的*客户，既可以平摊一部分成本，又可以不断优化模型，才能打造自身模型的重要特色，并对类似客户形成吸引力。这与云厂商的发展策略类似。

　　这样的思考主要来自上一阶段的产业实践。比如，在大模型公司内部，他们往往有一套更有针对性的评测基准。一位知名大模型公司的产品负责人表示，这套内部的评测基准，需要非常漫长的调试才能成型，它实际上是一家大模型公司最核心的资产，为自己模型的训练和迭代提供方向。而这样的「资产」建立，也往往需要自有应用的支持和配合。

　　但当下，考虑到未来的降价潮、免费可能性，自研应用的战略意义也会进一步加强。

　　当前，大模型还是技术驱动，比拼性能，还处于「智能能力决定下限，决定是否可以普及」的阶段。随着开发者发现免费的模型只能解决「试用」场景时，最终还是会回归到性能的比拼，选择更有利于业务的模型。只有不断提升模型智能能力，才有机会活在牌桌上。

　　对于创业公司来说，专注在用技术的方式，去不断优化成本，不断从 infra 到模型训练和调优，再到交互的每个环节里，优化效率，才有可能在竞争中取得优势。这一点，字节旗下的豆包、火山云也提到了，火山引擎总裁谭待认为，「豆包模型的超低定价，来源于我们有信心用技术手段优化成本，而不是补贴或是打价格战争夺市场份额。」

　　其次，宣传层面，Founder Park 了解到，一些创业公司也在思考「免费」以外的宣传亮点，以获得更多用户。

　　成本不是当前客户*关注的重点。比如，傅盛提出「降价对企业用户影响有限。企业用户需要 AI 应用，更关心数据安全。现在开源小参数大模型加应用套件，可以满足绝大多数的企业需求了」。

　　降价是大势所趋，

　　未来 token 会便宜到忽略不计

　　虽然此次对云厂商真实降价力度存在争议，但可以预见，模型降价是大势所趋。放到更长线的产业周期里，未来 Token 的价格可能便宜到忽略不计。

　　首先，现实主义的原因是模型厂商「竞争策略」的需要。

　　短期来看，大模型厂商之间的差距并不明显。在没有杀手锏、护城河的情况下，低价就有可能是吸引客户的重要策略。

　　此前我们在《》一文中已经提到，大模型今天可以在模型的「能力范围内」做很多业务，但是成本非常高。比如，当前大模型的智商其实可以达到高中生水平，就可以做很多服务于幼儿、儿童的场景;比如大模型的幻觉能力，可以在一定场景中演变为创意能力，可以在创意行业应用。但是这些场景还很难在用户端收到足够多的钱，因此，过去一年中，很多做出有一定影响力产品的开发者都表达了「烧不起 Token」。

　　其次，基于摩尔定律，大模型属于 IT 技术，理论上成本也会不断降低。今天，大厂则是通过商业行为，加速了降价。

　　投资机构拾象在 2024 年初曾做过一个总结，「模型训练的成本在过去 18 个月已经降了 4- 5 倍，模型推理的成本在过去 18 个月降了 10 倍左右」。基于此，他们提出了「新时代摩尔定律」：每 1-2 年模型水平就能提升一到两代，模型训练成本每 18 个月就会降低至原来的 1/4、推理成本每 18 个月降低至是原来的 1/10，未来模型推理成本做到今天 1% 这件事是非常可预期的。

　　事实上，自去年市场上出现开源模型以来，整个市场的模型训练及模型调用成本也在大幅下滑，私有部署从最早的几千万元降到了几十万元量级，同样性能的模型成本至少低了不止一个数量级。

　　再次，只有 Token 成本足够低，才有可能促进大模型生态的繁荣，进而使得产业链上的公司都是赚钱的。

　　虽然每一代技术出现时，大家都会研究「先有鸡还是先有蛋」的问题，但历史多次证明，「只有看见才能相信」。摩尔定律之下，每个人都会保有成本降低的预期，但实际上只有看到性能的上限和可以做的事情开发者才有可能入场。

　　在上篇文章《》的《要「便宜的可以忽略不计」》的章节里，我们也提到：在 AGI 领域，如果有一种「智能聚合网络效应」，那么这种加强版网络效应就意味着，用户数量的增长能够带来系统整体价值的提升。在这样的背景下，免费模式理论上有可能成为一种有效的市场策略。在 AGI 领域中，如果免费模式有助于企业快速做大规模，进而有可能做大营收和利润，那么这种模式的可行性在很大程度上依赖于大模型推理的成本降低。大模型推理所需的 Token 是 AI 系统运作的基础，其成本直接影响到企业的运营费用和盈利能力。

　　为了确保免费模式或者低价模式的可行性，我们需要一个前提条件：未来大模型推理时的 Token 要便宜到忽略不计。为了生态的繁荣，最终也会倒逼上游降低成本。

　　当下，开发者毫无疑问的会成为稀缺资源，成为模型厂商争相抢夺的对象。有网友调侃，可能很快模型厂商就要给开发者发补贴了。

　　Founder Park 近期的访谈中，也有创业者表达出了对于大厂的顾虑，集中体现在对于大厂盗用创意与数据的担忧。考虑到今天的应用普遍都还「太轻」，这一顾虑或并不成立。

　　但当 Token 有可能便宜到忽略不计，未来的商业模式的规划或许更值得思考。很可能依据公司自身实力，未来的商业策略演变为两种完全不同的路径：一是服务于客户，向用户免费，依然走「大事业」路线，靠免费做大规模并谋求大 GMV 或者大流量;一是服务于用户，直接面向用户收费，实现更高的利润率。

　　而对于行业来说，更重要的因素或许还是，大模型的商业模式该如何走通。

　　与其他软件行业相比，大模型的 ROI 在当下还很难算回来。一名有美国资本背景的投资人表示，在他看来，当前大模型公司的收入其实不能看做「ARR」，反而更应该看作实验性质的一次性收入，这笔收入很可能在 6 个月后因为新的模型出现而重新进行开发。

　　贾扬清在高山书院硅谷站「高山夜话」活动中也提到过类似的观点，「大模型对比传统软件，可以创造营收的时间太短」。开发完 Windows，可能在接下来的 5-10 年当中持续迭代、收回成本。但大模型每次训练过一个模型之后，下一次还是要从零开始重新训练，需要持续追加投入，但模型的迭代速度又很快，中间能够赚钱的时间窗口很可能是一年左右，甚至更短。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信