• 首页 > 云计算频道 > 大模型

    大模型新皇Claude 3即将入驻Amazon Bedrock,公有云成AI创新加速器

    2024年03月11日 13:17:14   来源:智能进化论AImatters

      2024年3月4日,Anthropic发布旗下最新一代大模型Claude 3系列,引发行业热议。

      在推理、数学、编码、多语言理解和视觉方面,Claude 3在多个基准测试上树立了新的标准,性能超越了包括GPT4在内的其他模型,被认为是通用大模型新皇。

      与此同时,亚马逊云科技宣布,Claude 3系列将入驻其生成式AI托管服务Amazon Bedrock。亚马逊云科技的客户将可以通过Amazon Bedrock访问Claude 3系列的三个模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。

      Claude 3对于通用大模型发展带来哪些改变?对于更多想要用好大模型的企业,什么是更好的使用通用大模型的方式?以下是笔者的一些观察。

      1 冲破一家独大,Claude3成通用大模型新“卷王”

      此次推出的Claude3共有三个模型,性能和价格由低到高为:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,也被形象概括为中杯、大杯、超大杯。

      其中,Claude 3 Haiku 主打快速紧凑,即时的响应能力。Claude 3 Sonnet 在智能和速度之间取得了理想的平衡,特别适合企业用例。Claude 3 Opus具有深度推理、高级数学和编码能力,在高度复杂的任务上具有领先性能。

      Claude 3的领先之处体现在基准性能、视觉能力、复杂开放性问题处理能力等。

      基准性能方面,Claude 3在多项AI系统常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K),均取得领先业界LLM的性能。

      Claude 3的三个模型均具备视觉功能,可以理解不同格式的结构化和非结构化数据,包括图像、图表、图表等。比如,官方演示视频中,Claude 3 Opus可以在几分钟内分析全球经济、未来美国GDP走势等。

      对于下图这样的复杂开放式问题, Claude3能够理解物体的外观及其与数学等概念的联系。

      此外,Claude3的三个模型都将至少支持200K token的上下文窗口。在200K token的「大海捞针」(NIAH)测试中,Claude 3 Opus准确率超过99%。Claude 3 Haiku 能够3秒读完10k token论文。

      笔者认为,目前大模型发展呈现两条不同的路径:

      一条路径,围绕如何练好大模型。像OpenAI、Anthropic、Google这样的科技巨头,有能力和资源在通用基础大模型赛道竞争。通用基础大模型的赛道相对同质化,各家都在追求更高更快更强,即更强大更全面的性能。

      而且通用大模型的竞争态势一直是动态变化的,任何一家的领先都是暂时的,榜单随时可能被刷新和超越。在这种态势下,任何一家独大,强者恒强未必对行业、对生态更好。

      从这个意义上,Claude3能够打破OpenAI长期领先的优势,加速通用大模型卷出更高的智能水平。

      另一条路径,围绕如何用好大模型。如何用大模型的能力解决不同行业不同场景下的专业问题,才是绝大多数企业最关注的。在这条路径上,云计算正发挥着举足轻重的价值。

      2 云计算,使用基础大模型的必经之路

      目前,AI大模型已经成为云计算厂商的第二增长曲线,全球头部云计算厂商都将AI大模型作为下一个十年发展的必争之地。

      如果我们回到企业需求的视角,企业使用基础大模型至少有以下几个核心诉求:

      首先,数据安全与合规

      数据安全合规是企业使用大模型的首要考量,包括数据泄露风险、数据滥用风险、模型安全漏洞等等。比如,很多企业担心客户信息、商业秘密和个人身份信息等敏感数据泄露。这些都对提供大模型能力的公有云厂商提出了更高的要求。

      在如何保障大模型安全使用方面,亚马逊云科技率先做出了很多探索。比如,Amazon Bedrock 处理的任何客户内容都会被加密,并静态存储在客户使用的亚马逊云科技区域中。客户可以使用Amazon PrivateLink建立从Amazon Virtual Private Cloud(VPC)到Amazon Bedrock的私有连接,而无需将VPC暴露给互联网流量。用户输入和模型输出不会与任何模型提供商共享。Amazon Bedrock还提供全面的监控和日志记录功能。

      其次,丰富的基础模型选择

      没有任何一款大模型可以满足所有需求。

      企业在使用大模型时,一定是博采众长,多款并用的。笔者观察到,很多企业在开发垂直领域的企业服务大模型时,底层都接入了不止一个头部大模型。

      在头部云厂商中,以亚马逊云科技为例,丰富的基础模型选择也是其在大模型赛道的差异化优势。目前,Amazon Bedrock平台的大模型提供商扩充至7家,包括AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI。

      “回顾2021年,当 Anthropic第一次开始在亚马逊云科技上构建时,没有人能想到Claude系列模型会带来多大的变革。自Amazon Bedrock于 2023年9月28日全面上线以来的短短几个月内,已有超过10,000名客户使用它,其中许多客户正在使用Claude。”亚马逊云科技数据和AI副总裁Swami Sivasubramanian博士表示。

      目前,已经有不少头部企业在云上使用Claude创建生成式AI应用。比如,全球领先的生物制药公司辉瑞正通过Amazon Bedrock使用Claude模型,加速创新癌症治疗方案的研发。通过运用生成式AI技术,辉瑞能够大幅缩短收集相关数据和科学内容所需的时间,进而利用这些内容分析趋势、制定肿瘤学目标并进行验证,从而提高成功概率。

      第三,易用的AI平台和工具集

      云计算厂商并非仅仅提供AI大模型的底层基础设施和基础模型接口,更关键是提供系统化的AI平台和工具集,帮助企业更好使用大模型进行创新。

      比如,Amazon Bedrock推出了丰富的AI功能,包括帮助客户识别、比较模型的模型评估功能、简化生成式AI应用构建并利用专有数据提供定制化响应的知识库功能、模型调优功能、能执行多步骤业务指令的代理功能、实现负责任AI的Guardrails安全功能等。

      Claude3的出现,让生成式AI领域再度风起云涌。Claude3不仅刷新了基础大模型的性能,也打破了长期以来通用大模型领域一家独大的市场格局。

      同时,亚马逊云科技与Anthropic的强强联合,不仅能让更多企业在云上便捷使用更新更强大的通用大模型,也代表了企业首选在公有云上使用大模型能力和生成式AI的发展趋势。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。