日前,芯片行业的峰会Hot Chips 33召开,芯片行业的巨头英特尔、AMD和IBM纷纷拿出来自己的最新技术和产品。AMD把市场上获得成功的Zen3拿出来自我表演了一番。IBM在以前内存共享的基础上,搞出来缓存共享。
而最引人注目的是英特尔。英特尔除了拿出大小核的十二代酷睿以外,还拿出来一个惊世骇俗的顶级GPU产品。
这款GPU比nVIDIA最强大的GPU还要强很多,而更令人称奇的是英特尔的GPU并不是传统上的一块大芯片,而是由47个小芯片通过英特尔的EMIB技术连接成一个整体。这让参会者惊掉了下巴,纷纷质疑这个东西能量产吗?
一颗芯片47个模块,英特尔为何要这样搞?未来的CPU和GPU又会如何发展呢?我们来看一下。
一、英特尔为何要做GPU?
虽然英特尔起步的时候做过内存,但是多年来,它都是以CPU产品闻名的,从奔腾处理器到酷睿处理器,英特尔常年占据高性能CPU的王座,AMD在漫长的40年里面,只翻盘了两次。
英特尔也尝试过做GPU,那也是20多年前的事情了。当年英特尔收购了洛克希德马丁(造F22的厂商)旗下的3D技术,发展出i740独立显卡,试图在市场上争锋。
但是很快,显卡市场就淘汰了英特尔,英特尔的图形核心被集成到主板北桥芯片之中,后来又一起集成到CPU之中。成为入门级别的GPU解决方案。
那么,时隔20多年,为何英特尔又要重新做独立显卡,还要搞出一个47个模块的怪兽与nVIDIA和AMD争锋呢?
原因很简单,现在高性能计算已经不用CPU了。
长期以来,人们都是用高性能的CPU做计算,但是后来人们发现高性能CPU用来做计算不经济,CPU是为复杂逻辑计算设计的,而很多计算只需要简单计算,这样晶体管都被浪费了。
于是,IBM搞出来一个Cell的方案(Cell是PS3游戏机的处理器),用一个全功能的CPU,带上一堆暴力计算单元,这样可以用比较少的晶体管,获得比较强的计算能力。虽然编程麻烦一些,但是算力提升立竿见影。
差不多在同时,做显卡的nVIDIA也发现一个问题,为了3D显示把GPU搞出来强大的计算能力,平时用不少浪费啊,于是nVIDIA搞出来CUDA,把GPU中的计算单元通用化,用来算高性能计算。
这个道路走了十多年,遇到了人工智能的爆发,人工智能是一个典型的需要海量简单计算的应用,GPU相比CPU有天然优势,结果大量高性能计算需求,都用GPU了,英特尔的计算产品市场被吃掉一大块。
英特尔其实很早也尝试过计算卡这类东西,也是用多个小核心组成一个类似于GPU的大型计算卡,但是这个东西只能计算,无法通过游戏市场分摊成本,价格高昂,竞争不过nVIDIA和AMD,经过几代产品也就淘汰了。
痛定思痛,英特尔决定也搞GPU,搞出来GPU,可以在家用游戏市场卖,分摊掉研发和制造成本,这个GPU用于高性能计算的成本就下来了,就可以与nVIDIA竞争了。所以英特尔做GPU。
二、英特尔为什么搞47个模块的怪兽?
要做GPU,其实也不算太难。用先进的工艺,把计算单元做得足够多,晶体管效率上去,显存带宽上去,自然有高性能。
但是,这里有一个问题,就是要把单元做的足够多,GPU用掉的晶体管就要足够多,GPU的芯片就要做得很大。而芯片的良率与芯片大小是有关的。
因为芯片上的瑕疵是随机的,芯片面积越大,遇到瑕疵概率越大,遇到了就是废品,废品率高了,成品的价格就上去了。
那么,能不能用小芯片堆砌呢?当然可以,AMD的CPU就是这么干的,但是小芯片堆砌有个问题,是小芯片之间互联会降低效率,性能会损失很大。所以,GPU现在还是用大芯片。
而英特尔有一个叫做EMIB的技术,这个技术用一个比一颗香米粒还小的复杂多层薄硅片,可以在相邻芯片间传输大量数据。比传统电路基板的带宽要高,可以解决多个小芯片互联性能下降的问题。
有这个技术,英特尔就开始发威了。它的旗舰GPU用个47个模块,分成两个部分。
两个部分之间连接器用一个模块,每个部分有23个模块。这23个模块,8个模块是通用计算,8个模块是AI用的计算,两个模块连接这些计算单元,四个模块是存储器,一个模块用于外部互联。
这样就堆砌出47个模块,建立起强大的算力,而单个芯片的良率远比大芯片方案更高。
三、未来的芯片会走向何方?
随着nVIDIA要约收购ARM,英特尔做GPU,目前在高性能计算市场上,nVIDIA,英特尔、AMD三足鼎立已经形成。还有一个潜在的巨头是独立做CPU和GPU的苹果。
这四家都希望有CPU和GPU,完成高性能计算。从目前各家的技术探索来看。未来很可能形成统一的几个趋势。
第一个趋势是CPU和GPU统一内存架构。
现在AMD已经把三级缓存做到192M了,也把GPU的缓存做到了128M,AMD也在游戏机里面做到了统一内存架构。统一内存架构可以提升CPU和GPU和数据交换速度,提升性能,未来随着工艺的提升,CPU和GPU共享缓存,共享内存是一个趋势。
第二个趋势是小芯片堆砌。小芯片的成本优势一直有,英特尔EMIB的技术解决了芯片之间互联的带宽问题,减少了性能损失,这样一来,小芯片堆砌可以带来高性能和低成本,这种方案会越来越多。
第三个趋势是大小核,人们基本的计算需求对性能要求很低。用高性能核心,浪费功耗。而用大小核,可以在性能和功耗之间找到比较合适的平衡点。
所以,一颗芯片47个模块只是开始,未来我们会看到更多的怪兽级芯片。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。