• 首页 > 云计算频道 > 大模型

    OpenAI突发新模型,GPT-3.5退役,大模型成本2年骤降99%

    2024年07月19日 09:37:39   来源:量子位公众号

      OpenAI突发新模型,全面取代老去的GPT-3.5。

      GPT-4o mini,能力接近原版GPT-4,价格却要便宜一个数量级:

      每百万输入tokens,15美分(约1.09元人民币)

      每百万输出tokens,60美分(约4.36元人民币)

      在ChatGPT应用中,GPT-3.5已经完全退役,免费用户已可使用GPT-4o mini模型。

      对应的API也已经开放,支持128k输入tokens(图像和文本),更令人瞩目的是支持16k输出tokens

      相比之下,隔壁Claude3.5Sonnet几天前刚刚升级8k输出tokens。

      以其低成本和低延迟特性,官方推荐用于多种场景:

      链式或并行化多个模型调用

      将大量上下文输入给模型(如完整的代码库或对话历史记录)

      或通过快速、实时的文本响应交互(如客服)

      在未来几天内,将开放GPT-4o mini微调

      CEO奥特曼表示,仅仅两年前,世界上最好的模型还是GPT-3的text-davinci-003版本。

      与今天相比表现差得多,还要贵上100倍。

      或者换另一个说法,大模型成本在两年内下降了99%

      GPT-4级别小模型,便宜一个数量级

      ChatGPT首发震撼世界,原版GPT-3.5模型功不可没。

      但尽管经过一系列升级降价,系列最新型号GPT-3.5Turbo也渐渐落后了。

      竞争对手新出的小模型,以Anthropic的Claude3Haiku和谷歌Gemini Flash为代表,开始抢占市场。

      GPT-4o mini就是专门来找回场子的。

      在多项文本和多模态推理学术基准测试中,GPT-4o mini都超过了其他小模型。

      特别是在数学(MGSM、MATH)和代码能力(HumanEval)上优势明显,与其他小模型拉开一个档次,只比GPT-4o完整版稍弱。

      此外,它还在函数调用方面表现出强大的性能。

      价格方面,也比Claude3Haiku和Gemini Flash要更便宜40%-60%。

      作为模型开发的一部分,OpenAI与Ramp和Superhuman等公司合作,已将GPT-4o mini用于实际应用,在“从文件中提取结构化数据”和“对邮件通信记录生成高质量回复”等任务明显优GPT于 -3.5Turbo。

      此外几周之前,新模型还化名GPT-mini登上大模型竞技场供广大网友测试检验。

      目前收集到6000+用户投票,与GPT-4Turbo表现相当。

      不过感兴趣的可以在大模型竞技场体验,目前版本为gpt-4o-mini-2024-07-18。

      这一次OpenAI对模型做了更多的安全设置,第一个应用了OpenAI指令层次结构方法的模型,有助于提高模型抵抗越狱、Prompt注入和系统Prompt提取的能力。

      简单测试中,确实不能简单的一句话套出系统提示词了。

      不过用上一系列复杂的越狱手段之后,还是没防住。泄漏出来的系统提示词倒也没什么特殊的内容。

      不过很可惜,新模型还是搞不懂9.11和9.9哪个大……

      One More Thing

      此外奥特曼还在回复网友提问中透露,GPT-4o实时语音模式也就是《Her》,将于本月晚些时候Alpha测试,更晚一些正式发布。

      不过也有网友略有点失望:我们要想要的是GPT-5,你却给我GPT-4o mini。

      同一天,DeepSeek与Mistral也都有了新进展。

      一边开源了 DeepSeek-V2-0628,直接摘得大模型榜单上开源大模型头名。

      另一边则是推出了12B的小模型,同英伟达合作开发,上下文长度为128K。

      大家打起来啊打起来啊~~~

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。