• 首页 > 云计算频道 > 大模型

    Anthropic大模型实力全面超越GPT-4 亚马逊云科技露锋芒

    2024年03月05日 14:28:39   来源:TechWeb

      3月5日消息,OpenAI最强竞对Anthropic发布Claude 3系列模型,已经实现了对GPT-4的全面超越。

      Anthropic是由前OpenAI员工创立的公司,在过去一年获得了来自亚马逊40亿美元的投资。

      此次,Anthropic宣布推出Claude 3模型系列,该系列包括三个模型,按能力升序排列依次是:Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。

      从Anthropic公布的测试数据看,其最高能力模型Claude 3 Opus的能力已经全面碾压GPT-4。

      如Anthropic所说,Claude 3模型将设定新的行业基准!

      目前,Claude 3 Opus和Sonnet已可以在Claude.ai和Claude API中使用。Sonnet正在Claude.ai上提供免费体验,Claude Pro用户则可以使用Opus。目前,Claude 3 Sonnet已可在159个国家可用,而Claude 3 Haiku很快将会上市。

      同时,今天起Claude 3 Sonnet也可以通过Amazon Bedrock,以及Google Cloud的Vertex AI Model Garden使用,Opus和Haiku很快就会在这两个平台同时推出。

      如果说微软通过绑定Open AI的GPT模型,在人工智能领域和亚马逊、谷歌等大厂的竞争中一骑绝尘,那么,随着全面碾压GPT-4的Claude 3 Opus的出现,在这场竞争中亚马逊也将吹起全面反击的号角。

      现在压力给到微软和Open AI,在马斯克的诉讼中,GPT-5何时发布?而Anthropic和Open AI的那些恩怨情仇还将继续上演……

      Claude 3 Opus模型性能全面超越GPT-4

      根据Anthropic公布的技术文档,Opus是Claude 3 模型家族中最智能的模型,在人工智能系统的大多数常见评估基准上都优于GPT-4,包括本科生级专家知识(MMLU)、研究生级专家推理(GPQA)、基础数学(GSM8K)等。它在复杂任务上表现出接近人类水平的理解力和流利性。

      Claude 3模型在分析和预测、细致入微的内容创建、代码生成以及西班牙语、日语和法语等非英语语言的对话方面都显示出更强的能力。

      总之,就是在各项测试领域,Claude 3 Opus的性能都已超越GPT-4。

      响应速度方面,据介绍,Claude 3 Haiku是市场上速度最快、性价比最高的模型。它可以在不到三秒的时间内阅读(约10k token)的包含图表和图形信息和数据密集的研究论文,并给出分析反馈。

      Anthropic表示正式发布后,预计Haiku性能将进一步提高。

      对于绝大多数工作负载,Sonnet比Claude 2和Claude 2.1快2倍,智能水平更高。它擅长于要求快速响应的任务,如知识检索或销售自动化。Opus提供了与Claude 2和2.1相似的速度,但具有更高的智能水平。

      Claude 3模型可以处理各种视觉信息数据,包括照片、图片、图表和技术图表。

      Anthropic称,一些客户的知识库,高达50%是如PDF、流程图或演示幻灯片以格式存储的信息。Claude 3 Opus在图表理解和多步推理上表现优秀。

      以例子来看,通过输入一张来自皮尤研究中心图表(如上)“年轻人比长辈更有可能使用互联网”,然后询问“G7国家的年轻人和老年人之间的平均差异百分比是多少?”

      模型顺利理解了G7概念,识别哪些国家是G7,并从输入的图表中检索数据并使用这些值进行数学运算。

      另外,全新的Claude模型在减少“过度拒绝”,与Claude 2.1相比,Claude 3 Opus模型在具有挑战性的开放式问题上的准确性提高了两倍,错误答案的水平也有所降低。

      在长语境理解能力方面,Claude 3系列的3个模型,都至少支持20万token的上下文窗口,都能处理超过100万token的输入。在200Ktoken的NIAH测试(大海捞针测试)中,Claude 3 Opus准确率超过99%。

      同时,Anthropic透露,计划在未来几个月内频繁发布Claude 3模型系列的更新。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。