京东心动购物季即将开启 学而思xPad Pro PLUS会员到手不高于7899元520来京东搜“京东老友季” 听红衣教主聊AI的那些事520买礼物就选博朗亲肤6系剃须刀礼盒 京东比李佳琦便宜70元以旧换新至高减20% 京东家电家居618 “购新”更超值飞利浦蜂巢7系列京东家电家居采销直播间比李佳琦便宜155元飞利浦蜂巢7系列京东家电家居采销直播间比李佳琦便宜155元CHIMA现场|“智慧医院云文档中心”成功发布,上海CA医疗行业数字信任方案备受关注擎朗医疗携全新一代Gen 2物流机器人亮相CHCC2024,助力医院数智化建设OpenAI“宫斗”第二季?消息称“超级对齐”团队已解散,成立不到 1 年2023 年我国卫星导航与位置服务产值超 5300 亿元,同比增长 7.09%下单到收货不到一刻钟,河南开启首批低空无人机物流配送航线杭温高铁开启联调联试,建成后杭州到温州 1 小时到达上海临港发布首批数据跨境一般数据清单,涉及智能网联汽车、公募基金、生物医药 3 大领域上海:将加快开源人形机器人原型机研发,2025 年重点行业机器人密度达 500 台 / 万人618前夕淘宝升级多款商家AI工具,面向商家免费开放崛起!一文速看云计算“国家队”五大突破!消息称中国一汽将加入蔚来换电联盟IDC:今年Q1中国平板电脑出货 713 万台同比增 6.6%,华为259万台位居第一构建离产业最近的AI,腾讯云公布多项大模型产品进展谷歌Pixel 8 手机运行 ChromeOS 项目现阶段仅为概念验证
  • 月之暗面撞上算力墙?

    2024年05月07日 17:49:54   来源:字母榜公众号

      “不好意思,刚刚和Kimi聊的人太多了。Kimi有点累了,可以晚点再问我一遍。”近期正在赶毕业论文的娄晓彤,时不时仍会收到AI助手Kimi无法使用的提示。

      作为大模型初创公司月之暗面旗下的To C应用,自3月份更新成为国内首个支持200万字上下文的大模型产品后,Kimi爆火出圈,QuestMobile数据显示,Kimi 应用月活用户量在3月份飙升至589.7万,但算力焦虑也随之而来。即便距产品更新已经过去一个多月,娄晓彤的遭遇仍在部分用户身上逐一上演。

      月之暗面向字母榜解释称,“其实是因为每天都有相对的高峰期和低谷期,高峰期可能会遇到(类似娄晓彤的)情况。”

      每次产品更新,对大模型公司而言都是一次流量和算力的双重考验。在3月18日宣布支持200万字上下文后,彼时Kimi便遭遇一次大规模宕机:从3月21日开始,Kimi APP和小程序被爆均无法正常使用。月之暗面随后发布情况说明,“观测到Kimi的系统流量持续异常增高,流量增加的趋势远超对资源的预期规划。”

      理论上,Kimi等AI助手可以支持的用户量几乎没有上限,只要大模型公司能够提供源源不断的算力供给,但这背后涉及的却是一个现实的效率平衡问题,在商业化尚未走向闭环的当下,这也是一众大模型产品的共同难题:配置冗余算力,难免带来部分时间段内的资源浪费;配置紧张算力,则不可避免会在高峰期内影响用户体验。

      尚需投资储备算力资源的月之暗面,在近期被爆出创始人杨植麟通过售出个人持股已套现数千万美元消息后,更是一时间引发诸多猜测。

    图片

      同样困在商业变现中的OpenAI,为了尽可能追求效率平衡,在免费版ChatGPT之外,特意设计出了付费版ChatGPT Plus。高峰时段,ChatGPT Plus用户将享有优先使用权,可以获得更迅速的服务响应。

      但随着用户规模暴涨,自去年2月推出付费版以来,OpenAI曾几度暂停ChatGPT Plus新用户注册,给出的理由是“需求量过大”,导致算力资源出现缺口。

      大模型产品的规模效应和网络效应仍处在市场潜伏期。这也使得部分投资人开始对大模型产品去魅,典型代表如金沙江创投主管合伙人朱啸虎,其在接受腾讯科技采访中表示,从2023年下半年开始,自己便决定不再和美国同事开原定每周一次的远程例行会议,探讨两边大模型产业格局变化,“打了半年我不打了,没有意义。”相比期待大模型产品在未来某一时刻迎来“iPhone时刻”,朱啸虎更在意当下能马上变现的To B应用。

      资本市场对大模型商业化的担忧更是进一步体现在刚刚发布财报的Meta身上。“即使将我们的许多现有资源转移到人工智能上,在我们从这些新产品中获得大量收入之前,我们仍然需要扩大我们的投资范围……这将是一个持续多年的投资周期。”扎克伯格宣告扩大对AI投资话音落地,当地时间4月25日,Meta股价盘后应声下跌超10%。

      对于Kimi这类缺乏自身造血能力的大模型创业公司而言,相比Meta,其面临的挑战只多不少:在这场效率平衡游戏中,它们宛如行走在悬于空中的钢丝绳上的杂技演员,投资款便是平衡木,到达对岸的唯一路径,便是在投资款耗尽之前,找到能够自我造血的商业模式。

      A

      春节期间,娄晓彤被身边同学安利了Kimi,当时Kimi支持的上下文长度只有20万字。加上彼时还未出圈,在日常使用中,娄晓彤基本没遇过无法使用情况。

      随着Kimi将上下文长度扩展到200万字,并通过在资本市场上衍生出Kimi概念股火速出圈,从3月中旬开始,娄晓彤遭遇Kimi提示“有点累了”的情况,逐渐多了起来。

      娄晓彤正在遭遇的算力紧张,从Kimi诞生后便已是注定的局面。去年3月创立月之暗面后,杨植麟便定下了做产品的两大思路:只做To C,且坚持长文本路线。

      图源:月之暗面官网截图

      文本长度和算力成本之间不可调和的矛盾,以及To C和高额营销成本之间的取舍,成为摆在杨植麟面前的两重平衡难题。

      3月份Kimi借助支持200万字上下文出圈后,新浪科技曾报道称,Kimi用户获客成本达到12元-13元,其每天获客成本超过20万元。

      大模型耗钱也早在杨植麟预料之中。“它需要人才聚集、资本聚集。”杨植麟形容道。

      短短一年多时间内,月之暗面已经拿下近百亿人民币投资:2023年,月之暗面完成两轮总计近20亿人民币投资;今年2月份,月之暗面完成新一轮10亿美元融资,由阿里巴巴领投,红杉中国、小红书、美团等机构跟投,投后估值超过25亿美元。

      近百亿融资款,更多都被用以支付算力资源。据市界报道,新一轮10亿美元融资款中,领投方阿里出资的8亿美元并非全是现金,其中部分将以阿里云提供的算力结算。

      这方面行业早有惯例。更早之前微软百亿美元投资OpenAI,其中大部分投资款便是以微软云服务提供的算力资源结算。在微软参投之前,OpenAI其实是从谷歌云服务采购算力资源。如此一来,微软投出去的钱,大部分又以云服务的方式流了回来。

      更重要的是,微软还借此完成了股价飙升,总市值不仅突破3万亿美元,更是超越苹果,成为全球市值最高上市公司。

      亚马逊随后便来了个有样学样。今年3月底,亚马逊正式完成对OpenAI最强对手Anthropic40亿美元的投资。与OpenAI一样,Anthropic也需要选择亚马逊作为其主要云服务商。

      B

      因算力资源而导致服务中断的现象,不只发生在Kimi一家身上,包括文心一言、ChatGPT等,都曾出现过无法正常使用的情况。

      据字母榜不完全统计,每次产品更新升级的节点,便是大模型产品可能迎接“崩盘”命运的开始。

      去年4月份,ChatGPT付费版本推出2个月后,ChatGPT Plus被爆暂停新用户注册,OpenAI给出的理由是“需求量过大”,导致算力资源出现缺口。付费通道恢复正常后,OpenAI再次收紧GPT-4的互动次数,从每4小时100条消息降为每3小时25条消息。

      7个月后的2023年11月,OpenAI在首届开发者大会上带来一系列产品更新:全新GPT-4Turbo、自定义GPT以及上线GPT商店。在大会结束后的短短两天内,ChatGPT服务器再次崩溃:用户数量的激增又一次超过了OpenAI的算力容量。

      作为OpenAI CEO的山姆·奥特曼都不得不亲自下场致歉,称新功能的热度远远超出了公司预期。“由于负载的原因,短期内可能会出现服务不稳定的情况,对不起。”

      最近一次“崩盘”发生在4月份。为了再次降低使用门槛,扩大用户量,在全球185个国家/地区累积超1亿每周用户量后,OpenAI宣布用户无需注册账户就可以使用ChatGPT,“我们正在逐步推出这一功能,目的是让任何对其功能感兴趣的人都可以使用人工智能。”

      在OpenAI还没来得及将上述新功能扩散到全球所有地区时,社交媒体上已经陆续有用户反馈,自己在与ChatGPT互动时又被提示“系统错误”了。

      除了采购更多算力资源来提升用户体验之外,一众大模型公司也在想方设法通过降低算力成本来满足更多用户需求。

      截至4月份,国内文心大模型推理性能被爆提升了105倍,推理成本降到了原来的1%。这意味着,客户原来一天调用1万次,同样成本现在可以调用100万次。

      国外OpenAI的奥特曼,更是在近期接受采访时预言,“我们(OpenAI)可以将非常高质量的AI技术成本降至接近零……如果我们没有制造足够的计算资源、供应和需求失衡,或计算成本攀升,这将导致AI成本非常高。”在奥特曼看来,未来AI技术成本将会变得越来越便宜。

      C

      使用更高效的硬件,便是推动AI技术成本降低的直接手段。

      几乎在奥特曼预测AI技术成本将变得越来越便宜的同一时期,英伟达创始人黄仁勋又来给OpenAI送芯片,这次是量产最强一代的全球第一台Nvidia DGX H200超级计算机。OpenAI总裁格雷格·布罗克曼还特意晒出了自己、奥特曼与黄仁勋的三人大合照。

      但对于已经无法获得英伟达最强芯片的中国大模型公司而言,借助人才优化算法以减少算力需求,则是另一条降低AI技术成本的路径。

      4月23日,界面新闻爆出杨植麟通过售出个人持股已套现数千万美元消息后,月之暗面随即对外回应称“消息不实”,并向媒体发来了一则招聘文章说明,里面重点提到,为了吸引并留住最优秀的人才,月之暗面推出全新员工激励计划,为优秀人才提供匹配其贡献的丰厚回报。“从今年开始,我们将在公司取得重要进展时发起员工期权回购计划,确保团队成员能够分享公司发展的果实(2024年底启动首次期权回购计划)。每年定期根据工作表现进行调薪和期权增发,确保薪酬和期权充分反映出员工个人的成长和贡献。”

      由此,外界也猜测杨植麟团队此次套现,其中或许便包括对重要人才的贡献奖励。

      在公司创立伊始,杨植麟给出的早期招人画像便是专注找对口的genius(天才)。“公司上限是由人的上限决定的……之前有对模型动手术的能力,有训练超大规模模型直接的经验,就可以很快做出来。包括Kimi发布,资本效率和组织效率其实很高。”

      与国内相比,硅谷AI人才之争,更为疯狂。马斯克本人都不得不感慨:“这是我见过最疯狂的人才大战。”为了避免特斯拉人才外流,马斯克旗下的大模型公司xAI开出了不少offer。

      扎克伯格更是亲力亲为,通过个人电子邮件给谷歌DeepMind团队成员发去邀请,希望他们能加入Meta与他共事。谷歌创始人谢尔盖·布林,为了挽留即将离职转投OpenAI的员工,也同样选择亲自出马,给员工加薪加福利。

      人才大战之下,根据薪资数据网站 Levels.fyi数据,硅谷机器学习和AI工程师的薪酬中位数已经接近40万美元,OpenAI总薪资中位数甚至高达92.5万美元(包括期权)。

      尽管为争夺AI人才,科技巨头开支增加,但他们的一系列疯狂举动已经在股价上迎来正反馈:2024年刚过完4个月,Meta股价年内已经大涨22%,谷歌大涨19%,亚马逊大涨19%。

      参考资料:

      《ChatGPT 之父最新演讲:GPT-5聪明程度超乎想象,一大批 AI 初创公司的努力将变得毫无意义》APPSO

      《黄仁勋亲自给OpenAI送货,全球首台DGX H200开箱了》机器之心

      《如何评价月之暗面创始人杨植麟一年套现数千万美金事件?》钛媒体

      《月之暗面创始人杨植麟套现数千万美金》界面新闻

      《月之暗面杨植麟复盘大模型创业这一年:向延绵而未知的雪山前进》腾讯科技

      《Kimi创始人套现4000万美元疑云》市界

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    中兴二合一 5G 云电脑“逍遥”系列上架:一键切换双模式,

    5 月 10 日消息,据中兴通讯官微,中兴二合一 5G 云电脑“逍遥”系列已经在电商平台上架。其支持本地、云端双模式,可在电脑与平板模式之间一键切换。售价方面,型号为 W200DS 的产品首销价格为 1899 元。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。