• 首页 > 云计算频道 > 大模型

    OpenAI认错!DeepSeek掀起新浪潮:四模型同日开源

    2025年02月19日 10:48:17   来源:雷科技

      不只是百度大模型在调整到“开源与免费”的姿态。

      2 月初,OpenAI CEO Sam Altman 罕见承认 OpenAI 的闭源策略站在了「错误的一边」,同时小心翼翼地放出了有限度「免费+开源」的消息。

      现在更进一步了,2 月 18 日,OpenAI CEO Sam Altman 在 X 平台(原 Twitter)上询问网友:

      「对于我们的下一个开源项目,是做一个相当小巧但仍然需要在 GPU 上运行的 o3-mini 级别模型更有用,还是做我们能做的最好的手机尺寸模型?」

    SCR-20250218-rbke.png

      也可能全都要,在手机上运行 o3 mini 水平模型,图/ X

      毫无疑问,结合之前 OpenAI 在 DeepSeek 冲击下放出的一系列消息,Sam Altman 不仅官宣了「开源项目」,也是在暗示 OpenAI 开源计划的两个方向。而在过去六年,OpenAI 一直坚守封闭策略(甚至因此被网友称为CloseAI),自 GPT-2 之后再未开源任何大模型。

      背后 DeepSeek 带来的压力显而易见。

      ChatGPT 问世后,OpenAI 在闭源模型的基础上通过「API+订阅制」构建起强大的商业护城河,但 DeepSeek V3 和 R1 证明了开源大模型同样可以媲美 GPT-4o 级别的能力,并且成本更低、可本地部署。

      面对这一挑战,OpenAI 再也无法对开源阵营置之不理。过去,企业几乎只能依赖 OpenAI 或 Google 等大模型厂商提供的封闭 API,而现在,越来越多公司开始直接从云计算平台或者部署 DeepSeek 等开源大模型,大幅降低 AI 计算成本。

      也不仅仅是 OpenAI,整个 AI 生态都在拥抱开源,甚至一向推崇闭源的百度也宣布下一代文心大模型 4.5 系列将在 6 月底开源。而仅在 2 月 18 日一天,就有多个模型宣告开源:

      - 昆仑万维宣布,开源中国首个面向 AI 短剧创作的视频生成模型 SkyReels-V1,以及基于视频基座模型的表情动作可控算法 SkyReels-A1。

      - 阶跃星辰和吉利汽车联合宣布,将开源双方合作的视频生成模型阶跃 Step-Video-T2V 和语音交互大模型阶跃 Step-Audio。

      - 逐际动力宣布,开源基于视频生成大模型的具身操作算法(VideoGenMotion,简称 LimX VGM)。

      - 在刚刚发布 Grok 3 系列模型,马斯克旗下 xAI 宣布,上一代大模型 Grok 2 将照例在几个月后开源。

      在DeepSeek这只“鲶鱼”的影响下,开源正在撬动整个 AI 生态,而一场 AI 产业的「开源革命」也已然开始。

      开源 AI ,星火燎原

      就在短短几个月前,关于 AI 的讨论还集中在 GPT(OpenAI)、Claude(Anthropic)和 Gemini(Google)这样的闭源模型上,而现在,DeepSeek 几乎以一举之力扭转了市场的注意力,将其迅速转向开源阵营。

      除了之前就采用不同开源策略的 Llama(Meta)、通义千问 Qwen(阿里巴巴)以及 Grok(xAI),开源阵营也迎来了不同方向的大模型,腾讯和字节就在早些时候开源了各自的视频生成模型,也包括昆仑万维刚刚开源的 SkyReels-V1 视频模型。

      不同于其他视频模型追求的通用性,SkyReels-V1 视频可能是首个面向 AI 短剧生成的开源模型,性能上号称是最强的图生视频开源模型。

    SkyReels-V1.png

      图/昆仑万维

      与此同时,阶跃星辰和吉利汽车开源了面向座舱场景的阶跃 Step-Video-T2V 视频生成模型,以及阶跃 Step-Audio 语音交互大模型。另一边是逐际动力在视频生成大模型打造了一套从文本到视频,再到机器人运动和操作的算法 LimX VGM,并将之开源给所有机器人开发者。

      这场 AI 竞赛,已经远远超出了最初的语言模型之争,开源正以燎原之势,席卷整个 AI 生态,也在一定程度上意味着大模型迭代的范式转变。

      最早,OpenAI 以「开源」起家,GPT-2 甚至还曾完全开放权重。但随后 OpenAI 就彻底转向闭源,并在基于 GPT- 3.5 打造 ChatGPT 后迅速以 API 和订阅制建立起商业模式。

      OpenAI 转变的核心逻辑在于,训练大模型需要极高的算力成本,闭源可以确保盈利,避免开源导致的「免费竞争」。而通过 API 形式提供 AI 服务,而不开放底层权重,防止竞品复制其技术。

    ChatGPT的2023:开创人工智能的新纪元

      图/ OpenAI

      更重要的是,通过掌控用户交互数据,持续迭代 GPT 模型和 ChatGPT,并维持市场领先地位。但 OpenAI,终究还是忽略了开源的魔力以及最核心的技术创新。

      如果回顾计算机技术史,实际上我们不难发现,开源未必会在早期占据最有利的位置,但往往就像滚雪球一般:越滚越大,最终势不可挡。

      2008 年,Google 决定对 Android 采取开源+商业化的策略,这一决定彻底改变了移动操作系统格局。当时的 iOS 是封闭的,而 Android 通过开源吸引了三星、华为以及小米等全球硬件厂商的支持,迅速超越 iOS,成为全球市场占有率最高的移动系统。

      Chromium 也是如此,尽管它最初只是一个开源浏览器引擎,但最终几乎吞噬了整个浏览器市场,就连微软的 Edge 都不得不基于 Chromium 内核重建。

      今天 AI 领域在经历同样的变革。闭源 AI 依然能赚到钱,但随着 DeepSeek 带来的冲击,市场已经开始倾向于开源大模型的路线。一个核心在于,开源不仅降低了 AI 技术门槛,也给所有开发者和企业带来了更多自由度——API 接入、云端调用、本地部署,甚至是基于不同需求和数据进行重新训练。

      而这种自由,正是 OpenAI 体系下难以提供的。

      DeepSeek R1,打出一个开源盛世

      还是 2 月 18 日,DeepSeek 在 X 平台上发布了一篇技术论文,主要内容是提出一种名为 NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力机制。核心是通过对硬件的友好与端到端训练,取得推理、训练速度和任务表现的综合平衡:

      让大模型在长上下文中兼具高效与高保真度。

    SCR-20250218-puez.png

      DeepSeek 团队新论文,图/ X

      这不是 DeepSeek 第一次发布技术论文,第一次为业界提供一种难题的解决思路。但更重要的其实是不同于 o1 模型,DeepSeek 此前用 R1 彻底揭开了 OpenAI 无论如何都想藏起来的——推理类模型「算法的秘密」,给更多人、更多厂商复制和超越 o1 的可能。

      过去,大模型行业默认接受了封闭模式——从 GPT-3 之后,AI 技术的进步被归结为「资源游戏」,更大的算力、更贵的数据、更封闭的 API,塑造了 AI 的商业逻辑。

      这种逻辑一度被认为是不可逆的,毕竟 AI 训练的成本极高,封闭系统能确保收益最大化,同时维持技术优势。但 DeepSeek R1 彻底改变了这种假设。

    image-51-1738593271617-compressed.png

      图/ DeepSeek

      相比更早之前发布的 OpenAI o1、Kimi k1,DeepSeek R1 不仅是作为开源模型,而是一种全新的思维方式——它让 AI 的「思考过程」成为透明的,让所有开发者都能看到推理是如何发生的。

      更重要的是,它证明了 AI 进步不必依赖「算力堆叠」,DeepSeek 另辟蹊径,通过推理优化,而不是纯粹地算力扩展,重新定义 AI 进步的路径。

      这种开源路径带来的变化,不只是技术上的,也是生态上的。在封闭体系下,企业只能被动接受 OpenAI、Anthropic 这样的巨头定价,而 DeepSeek R1 让企业有了更低的成本、更灵活的选择,所有过去被封闭 AI 掌控的能力,如今都可以在开源环境中自由演进。

      这不仅提高了 AI 的普及度,也让整个行业面临的壁垒大幅削减,这也是为什么我们会看到,所有厂商似乎都在接入 DeepSeek。当然,出于营销目的的接入以及简单粗暴的接入方式,也是这种变化中不可避免的一个过程。

      写在最后

      就在 Sam Altman 询问开源模型方向的推文下,有人依旧不满于 OpenAI 的「开源策略」,并提出至少应该开源 GPT-4——尽管由于成本和延迟早已不是主力,但依然是非推理类模型的一流性能水平。

      R1 已经证明,不同于闭源的 AI 研究,开源的方式可以通过全球协作、技术共享,让整个生态的进步速度加快。未来的 AI 可能也不会是少数巨头的垄断,而是由大量参与者共同推进的技术体系。

      而 DeepSeek R1,正是这场「开源盛世」的开端。

      从这个角度来看,DeepSeek 和 R1 之所以重要,并不仅仅是它的性能,而是它所开启的 AI 未来。开源不是封闭 AI 的备选方案,而是一条全新的康庄大道。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。