• 1/8成本比肩Claude 3.7,Mistral Medium 3来了

    2025年05月08日 17:50:30   来源:量子位公众号

      用1/8成本比肩Claude3.7,刚刚,“欧洲OpenAI”Mistral AI发布多模态新模型。

      MistralMedium3,主打编程和多模态理解,且在性能和成本间进行了平衡。

      官方称,在各类基准测试中,Mistral Medium3性能达到或超越Claude Sonnet3.7的90%,且成本大大降低。

      Claude3.7Sonnet的价格为每百万输入token3美元,每百万输出token15美元,而Mistral Medium3:

      每百万输入token仅0.4美元,每百万输出token2美元。

      整体性能,不管是和领先开源模型Llama4Maverick还是和企业级模型Cohere Command A相比,Mistral Medium3都能打得有来有回。

      目前,Mistral Medium3API已在Mistral La Plateforme和Amazon Sagemaker上线,不久后还将在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。

      具备一系列企业级能力

      下面具体来看看基准测试。

      Mistral Medium3在编程和STEM任务中尤为突出。

      官方原话是“其性能甚至接近非常大且运行速度慢得多的竞争对手”。

      不过呢,既不开放模型权重,也没有透露模型大小……

      另外,Mistral AI还发布了第三方人类评估。

      人类评估中,Mistral Medium3依旧是在编程方面占优势。

      在多模态和其他人语言任务中,相比Llama4Maverick,Mistral Medium3的表现也占上风。

      除了测试数据之外,官方还特别强调了其适应企业环境的能力,包括:

      混合部署或本地 / 虚拟私有云(VPC)内部署

      定制化后期训练

      与企业工具和系统集成

      企业可以轻松将智能全面集成到系统中,借助Mistral的应用AI解决方案,该模型可以持续进行预训练、全面微调,并融入企业知识库,使其成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。

      官方称,金融服务、能源和医疗保健领域的客户正在使用该模型测试,通过深入的背景信息来丰富客户服务、实现业务流程的个性化,并对复杂的数据集进行分析。

      另外,他们还推出了Le Chat Enterprise,这是一项面向企业的聊天机器人服务,提供了AI Agent建造器之类的工具,并将Mistral的模型与Gmail、Google Drive、SharePoint等第三方服务集成。

      据了解,Le Chat Enterprise将很快支持 MCP。

      Mistral Medium3发布后引发大批网友关注,有网友为其“高性价比”点赞。

      不过也有不少网友吐槽模型没说开源结果又高调地和开源模型比较,有点奇怪。

      还有行动派网友,想看什么自己比较。

      StabilityAI创始人翻出了Gemini2.5Flash的基准测试结果:

      看后表示:

      与Gemini2.5Flash竞争是多么困难,Gemini2.5Flash成本比Mistral Medium3低70%。

      期待开源模型的发布,这是Mistral的关键优势。

      One More Thing

      继三月份推出Mistral Small、今日推出Mistral Medium后,Mistral AI透露接下来几周正着手开发“大型”项目。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。