Anthropic大模型实力全面超越GPT-4 亚马逊云科技露锋芒

2024年03月05日 14:28:39 来源：TechWeb

　　3月5日消息，OpenAI最强竞对Anthropic发布Claude 3系列模型，已经实现了对GPT-4的全面超越。

　　Anthropic是由前OpenAI员工创立的公司，在过去一年获得了来自亚马逊40亿美元的投资。

　　此次，Anthropic宣布推出Claude 3模型系列，该系列包括三个模型，按能力升序排列依次是：Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。

　　从Anthropic公布的测试数据看，其最高能力模型Claude 3 Opus的能力已经全面碾压GPT-4。

　　如Anthropic所说，Claude 3模型将设定新的行业基准!

　　目前，Claude 3 Opus和Sonnet已可以在Claude.ai和Claude API中使用。Sonnet正在Claude.ai上提供免费体验，Claude Pro用户则可以使用Opus。目前，Claude 3 Sonnet已可在159个国家可用，而Claude 3 Haiku很快将会上市。

　　同时，今天起Claude 3 Sonnet也可以通过Amazon Bedrock，以及Google Cloud的Vertex AI Model Garden使用，Opus和Haiku很快就会在这两个平台同时推出。

　　如果说微软通过绑定Open AI的GPT模型，在人工智能领域和亚马逊、谷歌等大厂的竞争中一骑绝尘，那么，随着全面碾压GPT-4的Claude 3 Opus的出现，在这场竞争中亚马逊也将吹起全面反击的号角。

　　现在压力给到微软和Open AI，在马斯克的诉讼中，GPT-5何时发布?而Anthropic和Open AI的那些恩怨情仇还将继续上演……

　　Claude 3 Opus模型性能全面超越GPT-4

　　根据Anthropic公布的技术文档，Opus是Claude 3 模型家族中最智能的模型，在人工智能系统的大多数常见评估基准上都优于GPT-4，包括本科生级专家知识(MMLU)、研究生级专家推理(GPQA)、基础数学(GSM8K)等。它在复杂任务上表现出接近人类水平的理解力和流利性。

　　Claude 3模型在分析和预测、细致入微的内容创建、代码生成以及西班牙语、日语和法语等非英语语言的对话方面都显示出更强的能力。

　　总之，就是在各项测试领域，Claude 3 Opus的性能都已超越GPT-4。

　　响应速度方面，据介绍，Claude 3 Haiku是市场上速度最快、性价比最高的模型。它可以在不到三秒的时间内阅读(约10k token)的包含图表和图形信息和数据密集的研究论文，并给出分析反馈。

　　Anthropic表示正式发布后，预计Haiku性能将进一步提高。

　　对于绝大多数工作负载，Sonnet比Claude 2和Claude 2.1快2倍，智能水平更高。它擅长于要求快速响应的任务，如知识检索或销售自动化。Opus提供了与Claude 2和2.1相似的速度，但具有更高的智能水平。

　　Claude 3模型可以处理各种视觉信息数据，包括照片、图片、图表和技术图表。

　　Anthropic称，一些客户的知识库，高达50%是如PDF、流程图或演示幻灯片以格式存储的信息。Claude 3 Opus在图表理解和多步推理上表现优秀。

　　以例子来看，通过输入一张来自皮尤研究中心图表(如上)“年轻人比长辈更有可能使用互联网”，然后询问“G7国家的年轻人和老年人之间的平均差异百分比是多少?”

　　模型顺利理解了G7概念，识别哪些国家是G7，并从输入的图表中检索数据并使用这些值进行数学运算。

　　另外，全新的Claude模型在减少“过度拒绝”，与Claude 2.1相比，Claude 3 Opus模型在具有挑战性的开放式问题上的准确性提高了两倍，错误答案的水平也有所降低。

　　在长语境理解能力方面，Claude 3系列的3个模型，都至少支持20万token的上下文窗口，都能处理超过100万token的输入。在200Ktoken的NIAH测试(大海捞针测试)中，Claude 3 Opus准确率超过99%。

　　同时，Anthropic透露，计划在未来几个月内频繁发布Claude 3模型系列的更新。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

“强悍小透明”真我Neo7 Turbo正式发布，国补到手1699.15

Anthropic大模型实力全面超越GPT-4 亚马逊云科技露锋芒

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

新闻

明火炊具市场：三季度健康属性贯穿全类目

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

专题

Anthropic大模型实力全面超越GPT-4 亚马逊云科技露锋芒

扩展阅读