英伟达发布AI芯片H200：性能飙升90%，Llama 2推理速度翻倍

2023年11月14日 09:44:01 来源：DoNews

　　11月14日消息，英伟达北京时间13日发布了下一代人工智能超级计算机芯片，这些芯片将在深度学习和大型语言模型(LLM)方面发挥重要作用，比如 OpenAI 的 GPT-4。

　　新芯片相比上一代有了显著的飞跃，将被用于数据中心和超级计算机，处理诸如天气和气候预测、药物发现、量子计算等任务。

　　此次发布的关键产品是基于英伟达的“Hopper”架构的 HGX H200 GPU，是 *** GPU 的继任者，也是该公司第一款使用 HBM3e 内存的芯片，这种内存速度更快，容量更大，因此更适合大型语言模型。

　　英伟达称：“借助 HBM3e，英伟达 H200 以每秒 4.8 TB 的速度提供 141GB 的内存，与 A100 相比，容量几乎是其两倍，带宽增加了 2.4 倍。”

　　在人工智能方面，英伟达表示，HGX H200 在 Llama 2(700 亿参数 LLM)上的推理速度比 *** 快了一倍。HGX H200 将以 4 路和 8 路的配置提供，与 *** 系统中的软件和硬件兼容。

　　它将适用于每一种类型的数据中心(本地、云、混合云和边缘)，并由 Amazon Web Services、Google Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure 等部署，将于 2024 年第二季度推出。

　　英伟达此次发布的另一个关键产品是 GH200 Grace Hopper“超级芯片(superchip)”，其将 HGX H200 GPU 和基于 Arm 的英伟达 Grace CPU 通过该公司的 NVLink-C2C 互连结合起来，官方称其专为超级计算机设计，让“科学家和研究人员能够通过加速运行 TB 级数据的复杂 AI 和 HPC 应用程序，来解决世界上最具挑战性的问题”。

　　GH200 将被用于“全球研究中心、系统制造商和云提供商的 40 多台 AI 超级计算机”，其中包括戴尔、Eviden、惠普企业(HPE)、联想、QCT 和 Supermicro。

　　其中值得注意的是，HPE 的 Cray EX2500 超级计算机将使用四路 GH200，可扩展到数万个 Grace Hopper 超级芯片节点。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信