诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购京东“先人一步”预约OPPO Reno13系列 1元锁定腾讯视频VIP会员季卡万兆光网中国行:以应用为牵引,上海万兆加速启航消息称芯片制造商铠侠12月18日上市,将通过IPO筹资总计700亿日元谷歌安卓16打造端侧AI智能体:Gemini将成管家,代用户掌控应用交互
  • 首页 > 云计算频道 > 大模型

    再次炸天的OpenAI,大模型生态初现

    2023年11月08日 10:01:16   来源:光锥智能

      文|郝    鑫

      编|刘雨琦

      不出意外地,OpenAI的首届开发者大会,让人特别意外。

      一夜醒来,大模型圈一只脚踏入了Agent的世界,另一只脚则踏入GPT Store生态的河流中。

      美东时间11月6日,OpenAI开发者大会正式开启,创始人兼CEO山姆·奥特曼站在台上,45分钟的密集输出,再次展示了什么叫“遥遥领先”。

      我们先简单回顾一下这场发布会的所有重点,其实无非就是三件事:

      一是技术能力:GPT-4 Turbo升级了6大新能力,包括128K的上下文长度、更强的控制能力,模型的知识升级、多模态能力(语音和CV)、模型微调定制和更高速率的限制,性能升级的同时,还对API调用的价格进行了下调;

      二是可复制的能力:从原来的GPT到GPTs,用户可以打造专属于自己的GPT助手,企业可通过OpenAI提供的全套工具链“all tools”在企业内部建设有价值的工具,同时也可以深入让GPTs进化为一个个Agents,为智能体做准备;

      三则是生态能力:企业不仅可以打造GPTs,更能将其上架在市场内,即GPT Store,可分享给其他用户使用,以及获得分成,类App Store的商业生态由此为出发点。

      正如网易有道CEO周枫所言,“这次模型上主要是性能和成本的优化,而在应用和生态方面,做了很多LangChain(开发工具链),LlamaIndex(开发数据框架)这些项目类似的工作,最终就是要实现以智能体作为AI App的愿景。”

      总之,OpenAI提供的生态能力解决了当下大模型发展的几个重要难点,而在此之上,大模型的应用层将迎来进一步爆发。

      “很兴奋,还有很多信息在消化。”

      OpenAI发布之后,光锥智能在与多位国内知名大模型创业者交流中,也感受到了大家对行业前景的期待,“OpenAI的多模态能力开放,对开发者是很大的利好,可以做的事情的边界得到进一步拓展,我预计会有很多新的玩法出现。”月之暗面创始人杨植麟对光锥智能称。

      这45分钟,为大模型火箭的二级爆发,再次添加燃料。

      让大模型,飞入寻常百姓家

      “有需求,打造生态,找落地。”OpenAI首届开发者大会结束后,某家国内大模型明星公司 CEO 对光锥智能发表了极为简短,却信息量极大的点评。

      市场对ChatGPT的需求,无疑是巨大的。在发布会的开始,奥特曼报告了 OpenAI 平台和产品的一些数据,截至目前,已经有大约200万开发人员在其API上构建各种各样的应用,超过92%的全球500强企业正使用其产品,ChatGPT的周活跃用户达到大约一亿。

      自GPT3.5问世到现在,每一次的升级都引领着大模型的下一个技术方向,不过,这次OpenAI GPT-4升级后的Turbo版本更像是查漏补缺。

      首先是更长的上下文本长度,GPT-4Turbo上下文任务长度扩展至128K,相当于一本书的300多页,是 GPT-4支持的8K上下文的16倍。不仅如此,奥特曼还强调在扩展文本长度的同时,还应该保持模型的准确性。

      其次是弥补OpenAI一直以来的短板——安全可控和知识库更新速度。针对前者,推出了名为Json Mode的新功能,确保开发人员更容易调用API,提升对模型输入和输出的控制;即将推出“Copyright Shield”(版权保护)功能,若其企业和API用户面临版权侵权诉讼,OpenAI将为其承担相应费用。针对后者,OpenAI平台支持用户导入文档、数据库来更新大模型的认知,同时还将新升级后的GPT-4Turbo认知理解更新到了2023年4月。

      最后,此次更新中,OpenAI的多模态能力开放进入到了一个全新的阶段。上一个时期,OpenAI用了一年多的时间,实现了ChatGP能说、能看、能听,而现在才到了多模态能力释放的节点。DALL-E3、文生语音模型TTS(text-to-speech)、Whisper V3都将通过API的形式开放给开发者使用。

      能力升级之后,为了让更多的开发者用起来,还做了一个大降价。

      奥特曼表示,不断有开发者来向其抱怨,GPT-4定价太贵,也正是基于此,OpenAI这回干脆来了个大模型降价促销。

      降价后的GPT-4Turbo输入token价格是GPT-4的三分之一,输出token价格是原来的二分之一;GPT-3.5Turbo 4K 精调版本输入token价格是此前的三分之一,输出token价格是原来的二分之一;GPT-3.5Turbo 16K精调版本输入token价格是之前的四分之一。

      正如奥特曼所言开发者的需求是驱动OpenAI降价的根本原因,这背后还有技术、商业等多重因素。

      从技术降本看,根据外媒爆料,OpenAI此次可能将Stateless API变为Stateful API,奥特曼此前曾表示,基于Stateful API,用户不用再“重复一遍一遍地为同样的历史对话付费”,理论上Stateful API形式可将大模型应用的开销削减为原来的二十分之一。

      在商业上,OpenAI也一直在寻找突破点,从API、ChatGPT个人版再到企业版,一直在探索商业化。但其对手却未给喘息的机会,微软、Salesforce、开源生态主导者Meta都在以更具性价比的方式,背后“偷袭”OpenAI,商业化的紧迫感与日俱增。

      OpenAI降价的背后,也代表着国外大模型已经进入到了普惠化、追求高性价比的新时期。

      对初创企业、开发者而言是落地的机会,对OpenAI这类公司也是挑战,由降价而带来的或许是技术能力、资源分配、算力等多方面的挑战。

      “在综合考量后,我们优先考虑了价格,但速度却不能同时兼得,这将是接下来研究的重点”,奥特曼道。

      据多名使用GPT-4开发工具的技术人员称,GPT-4速率限制已经开始加倍。

      “算力应该还好,OpenAI储备足够多”,杨植麟对此发表了意见。

      为创业者提供“筑梦”工具

      光锥智能在与多位大模型创业者交流过程中发现,很多创业者不是缺乏好点子和创业想法,而是受困于数据、算力、工具、部署、训练、推理等一个个的技术难题。

      比如,知乎上一位基于大模型开发的对话解谜小游戏的开发者,就因为游戏用户数量远超预期,导致算力不足而被迫关闭了整个游戏,留给玩家的只有一片遗憾和不舍。

      同样在国内,创业者们不是不知道Agent是未来的创业方向,而是心有余力不足。一位Agent创业者告诉光锥智能,“数据清洗、长文本记忆、代码编写、运行测试、部署落地、成本等等九九八十一难,关关难过,关关卡死每一个创业公司”。

      据光锥智能了解,无论国内外,Agent离落地还差得很远,目前比较确定的场景可能是Code Agent。原因在于,编码本身就属于大模型训练推理和Agent执行任务的一环,距离最近,改造也越容易。

      而现在,OpenAI发布的all tools工具、assistant API(助手API)则有希望使上述这些问题迎刃而解。

      assistant API 是OpenAI专门为AI Agent开发者量身打造的工具助手,涵盖了长线程(Threading)、知识库(Retrieval) 、代码解释器(Code interpreter)、函数调用(Function calling)几项工具。

      持久且无限长的线程,允许开发人员将线程状态管理移交给OpenAI并解决上下文窗口约束;支持检索功能,利用模型之外的知识来增强,例如专有领域数据、产品信息或用户提供的文档;支持代码解释器功能,与ChatGPT Plus中一样,可以在沙盒执行环境中编写和运行Python代码,生成图形和图表,并处理具有多种数据和格式的文件;函数调用功能也迎来更新,现在可以一次性调用多个函数,并把响应合并到消息输出中。

      总而言之,这些新功能精准切中了开发者们卡脖子的痛点,在OpenAI打造的全流程工具链上开发运行,将降低研发的门槛,缩短研发、测试周期,同时节省人力成本。

      “我们对OpenAI又爱又恨,一方面它升级的工具有可能一瞬间让我们的业务跑通,但另一方面,我们也得时刻警惕被OpenAI取而代之”,一位Agent创业者道。

      让我们聚焦这次发布会的主角——“Agent”。奥特曼给Agent下的定义为,人们利用工具、AI来建立更个人化和定制化的分身,这些分身可以代表个人做很多事情。用户只需询问计算机所想要的东西,Agent分身就能替你完成所有任务。

      光锥智能梳理OpenAI做Agent思路后发现,Agent不是凭空而来,一切都基于GPT的大模型,在大模型基础上先是长出了GPT的分身“GPTs”,而后才是“AI Agent”。

      “在OpenAI,我们一直笃定渐进的、迭代的部署是解决安全问题的最佳方式,即人工智能的安全挑战。我们认为谨慎对待面向未来Agent尤为重要,这需要大量的技术工作以及关于社会的深思熟虑,所以我们正在迈出通往未来的一小步——GPTs”,奥特曼表示道。

      OpenAI通向未来Agent之路已初现雏形,正如其所言,“这还只是通向AI Agents迈出的第一步”,未来也许是多模态、多智能体。

      初建大模型生态

      技术的迭代固然让人兴奋,工具的推出也让开发者们更加方便快捷,但更重要的是,OpenAI凭借一己之力,让大模型的商业化进一步落地。

      早在今年5月,OpenAI开放插件系统后,首批上线了70个大模型相关的应用,包括猜词、翻译、查找股票数据等等工具,彼时便有人预测到,大模型的App Store来了,但后期应用逐渐增加,却并没有跑出“爆款级”应用。

      有投资人认为:现在的GPT Store很像刚刚面世时的小程序,处于能力逐步补齐中,此次升级便是逐渐走向成熟的象征,下一个微信或者抖音,很有可能在此诞生。

      此次发布会中,OpenAI重新梳理了应用商店的体系,小幅调整了页面布局,将ChatGPT变成了与第三方应用并列的应用层级,并将开发范围扩大到了一个全新的范畴,按照奥特曼的说法,每一个GPT像是为ChatGPT的一个特殊目的,而量身定制的版本。

      但让人更为兴奋的是,参考苹果App Store,用户可在GPT Store中搜索下载GPT应用,商店也将推荐生产力、教育和好玩等类别的优质产品,OpenAI也明确了创建者可根据自有GPT的适用人数进行分成。这意味着,基于大模型的应用有了“容器”,开发者找到了买卖的“市场”。

      举个简单的例子:大模型本身一块块地皮,工具箱是锤子钉子,不同的开发者将盖不同房子,GPT Store则是一个房地产市场,也就是说,盖出来房子不仅能自用,还能租出去和卖出去。

      有了商业化的“交易场”,创业者们就有了正反馈,这使得创业不再只靠激情和梦想,而是拥有了现实收益的可能。

      这或许也正是大模型创业者所言的“找落地”,上半年的AI创业离不开两个字“烧钱”,5000万的融资金额对大模型创业而言简直是“沧海一瓢”,投资人不敢出手,创业者们也讲不出新故事。

      在现场,OpenAI的工作人员展示了OpenAI搭建的一款旅游GPT的用法:它不仅能列出巴黎旅游建议,还能在地图上将计划中提到的地点按类别标记起来,而这完全可以对用户收费或者进行会员制。

      虽然,这并不代表每一个登陆了GPT Store的应用都能赚到钱,但至少有一个窗口可以获得第一批种子用户,从而反哺产品进步,形成增长飞轮。

      参考移动互联网应用爆发的年代,每一个细分领域创业者都能挖掘出无数的需求形成应用,这或许也正是创业者们为之兴奋的原因。

      这时,才按下了所有APP重新做一遍的启动键。

      “我们相信,AI会以一种前所未见的规模,予以个体和机构新的能力。这也将把整个人类提升到我们前所未见的规模”,奥特曼在结尾时提到。

      显然,OpenAI想做的,还有更多。基础设施已经初步搭建完毕,剩下的,就是等时间和生态的其他角色,来开花结果。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。