突破叙事尺度 刻画极致人物 迷雾剧场《漂白》1月17日上线爱奇艺1月20日手机数码国补落地京东 超千万国补商品等你挑选超千万货品已备足 1月20日来京东购手机享国家补贴每件最高500元拥抱创新科技,探寻体育变革之路—— 第二届LALIGA EXTRATIME体育行业论坛在京成功举办斑马技术《2025全球消费者调查报告》:注重防损管理,增强顾客体验终端创企Nothing拟募资1亿美元 一加联合创始人创立恩智浦获欧洲投资银行 10 亿欧元贷款,用于在欧多国研发创新工作入手松下ZS99相机新品首选京东 售价2998元可先人一步入手1月20日打开京东搜索「1」 3C数码“疯狂星期一”爆款低至1元当代年轻人用上AI,从夸克开始消息称iPhone SE 4将有白色和黑色 预计3月份推出全球PC市场迎来温和复苏:2024年出货量增长1.3%,联想和苹果表现亮眼比亚迪已在韩国推出Atto 3 预计2月中旬开始交付发展新质生产力 赋能健康产品力 ——劲牌有限公司2024年度科技责任(成果)报告美光减产后 SK海力士也计划将上半年NAND闪存产量削减一成赵明离职信曝光:离开荣耀是人生中最艰难的决定消息称京东服饰换帅,阿里前高管担任负责人这年头,谁在互联网上学这么“硬核”的AI?开战2025,本地生活商家「另辟蹊径」年底Mini LED电视到底怎么选?认准这些新技术不踩雷!
  • 首页 > 云计算频道 > 大模型

    大模型创业公司成了「GPU贫民」

    2023年08月31日 15:07:46   来源:微信公众号:量子位

       一夜醒来,大模型圈都在热议一个词——“GPU贫民”(GPU-Poor)。

      来自行业分析机构SemiAnalysis的一篇报告,爆料谷歌拥有的算力资源比OpenAI、Meta、亚马逊、甲骨文和CoreWeave加起来还要多

      分析师Dylan Patel预测,谷歌DeepMind联手的下一代大模型Gemini,到年底训练量将碾压(Smash)GPT-4达到后者5倍

      报告提出在这种压倒性的优势面前,大部分创业公司和开源势力都成了“GPU贫民”,在用有限的资源苦苦挣扎。

      这个既扎眼又扎心的说法迅速成为新梗,在行业里流传开来。

      巧了,也是同一位作者搞出来的,另外GPT-4内部架构细节大曝光也是他干的。

      被点名的开源扛把子HuggingFace联合创始人Julien Chaumond表示:不要小看我们贫民啊。

      也有人代表学生在线吐槽:金钱上穷,算力上也穷,说的就是我们博士生了。

      正致力于让手机跑大模型的知名学者陈天奇表示,未来每个人都会拥有自己的AI助手,其中大多数人都会是“GPU贫民”,但不要低估合起来的总量。

      也有不少人认为,抛开争议性的内容和大部分内容收费不谈,这篇报告的免费前言部分就是对大模型行业现状的一个很好的批评和总结。

      01、“GPU贫民”在做无用功

      报告下笔很不留情,直言很多创业公司在GPU匮乏情况下花费大量时间精力做的事,都是无用功

      比如很多人热衷使用大模型的输出微调小模型,然后去刷排行榜,但是评估方法不完善,更注重风格而不是准确性或实用性

      报告还认为各种测量标准不完善的排行榜本身,也是对小公司的误导,由此产生一大批不实用的模型,对开源运动也是一种伤害

      另一方面,GPU贫民们反而对资源的利用效率不高,大多使用密集模型,主要基于开源的羊驼生态。

      但是OpenAI谷歌这些巨头已经在玩MoE架构这样的稀疏模型,以及利用小模型投机采样 (speculative decoding)提高推理效率了,完全是两个游戏

      作者希望GPU贫民们不应该过度限制模型规模以及过度量化,而忽视模型质量下降。应该专注于在共享的基础设施上高效地提供微调模型,减少延迟和内存带宽需求,满足边缘计算的需求

      看到这里,也有人提出不同意见,认为创造性的突破往往正是来自有限制的环境,这反而是某种优势。

      但Perplexity.AI联合创始人Aravind Srinivas认为,GPU丰富的组织实际也会投资于带限制条件的研究。

      并且要找到下一个像Transformer这样的突破,需要成千上万次的实验,要求的资源*不低。

      02、“GPU土豪”的游戏怎么玩

      那么GPU平民的另一面,谷歌这个“GPU土豪”在做什么呢?。

      严格来说,谷歌算力不是GPU而是自家TPU。报告认为虽然TPUv5单体性能不如英伟达H100,但是谷歌有最高效的基础设施架构。

      谷歌大脑与DeepMind合并后,联手训练对标GPT-4的Gemini大模型。

      由前DeepMind两位研究VPKoray KavukcuogluOriol Vinyals和前谷歌大脑掌门人Jeff Dean共同领导百人团队。

      根据多方爆料,Gemini预计年内就会发布,更准确的来说是美国的秋季范围之内(9月23日-12月21日)。

      Gemini将整合大模型与AI图像生成的能力,使用Youtube上93.6亿分钟的视频字幕训练,总数据集大小据估计是GPT-4的两倍。

      前DeepMind创始人Hassabis曾透露,Gemini将结合AlphaGo类型系统的一些能力和“其他非常有趣的创新”。

      另外谷歌创始人布林也一直在亲自参与Gemini研发,包括对模型做评估并协助训练。

      关于Gemini更具体的消息还不多,但是有人推测也将与GPT-4一样使用MoE架构和投机采样技术

      8月初Google DeepMind发表的新论文From Sparse to Soft Mixtures of Experts被认为可能与Gemini相关。

      投机采样能在不损失生成质量的前提下,让Transformer大模型获得2-3倍的推理加速。

      具体来说是让小模型生成提前生成一些token并让大模型做评判,如果接受就让大模型生成下一个token再重复*步,如果小模型生成的质量不高再换用大模型。

      谷歌一方的投机采样论文在2022年11月才发表,但之前的爆料认为GPT-4也用了类似的技术。

      实际上投机采样技术的前身Blockwise Parallel Decoding也来自谷歌,作者中包括Transformer作者中的Noam Shazeer

      Noam Shazeer这个人在谷歌时同时参与了Transformer、MoE和投机采样的研究,对今天的大模型来说都至关重要,另外他还参与了T5、LaMDA和PaLM等多个大模型研究。

      SemiAnalysis的报告中还讲了他的一个八卦。

      早在GPT-2时代Noam Shazeer就在谷歌写了一份内部备忘录,预测了未来大模型将以各种方式融入人们的生活,但当时这个观点并未被谷歌重视。

      现在看来,他预测的很多事都在ChatGPT发布后真实发生了。

      不过Noam Shazeer在2021年就离开谷歌创办了Character.ai,按照这篇报告的说法,他现在也是“GPU贫民”的一份子。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。