为啥性能最好的开源CPU是中国的?
就这两天,海外大V的一条发问,在国外科技圈引发广泛热议。
这条信息两天内就吸引了超过50万次阅读、点赞量超5k。
Hackernews上也掀起了相关讨论。
“香山”处理器的GitHub Star在2天内迎来了一波暴涨。
而这个CPU说的不是别人,正是中科院计算技术所的核心成果,国产自研CPU:香山。
被热议和讨论的还不止CPU本身,也包括背后的项目:一生一芯。
老外感叹:中国人正在一砖一瓦建设核心工程。
背后自然是认可,所以项目核心负责人,中科院计算所研究院包云岗教授也表达了感慨:
这是对香山项目的一种肯定。
已知性能最强的开源处理器
简单来说,这次“香山”项目爆火出圈有点意外。
发布该推特的大V George Hotz是开源自动驾驶公司Comma AI的总裁,日常对芯片硬件领域非常关注。前段时间他给AMD替代CUDA的方案挑出了bug。
他推特中提及的“开源最强”,追溯数据可以追溯到2024RISC-V欧洲峰会上,香山最新版本“昆明湖”在SPECint2006测试中,以3GHz的频率达到了标准化分数45。
其性能可以媲美ARM Neoverse N2,是目前已知性能最强的开源处理器。
有人表示,尽管很难找到先进版本x86和ARM内核的SPECint2006分数,因为它们都使用PECint2017,最后的时钟频率也会有比较大影响;但由于“昆明湖”是在3GHz下,所以表现是相当不错的。
事情引发热议后,中科院计算技术研究所研究员包云岗也在知乎发表回应。
包云岗表示,香山开源CPU项目已经启动5年,现在随着产业发展,更加坚定了开源CPU这个信念。
目前,香山项目已经取得了一定进展。
性能上可以媲美ARM Neoverse N2,同时也已集齐了产业落地的“八大金刚”企业客户。
原回答如下:(上下滑动查看所有内容):
透过这一最新回应,香山项目的发展脉络也更加清晰地呈现出来。
香山项目的启动可以追溯到2019年。
包云岗和团队的唐丹博士一直认为要建立一个像Linux那样的开源RISC-V核主线,既能被工业界广泛应用,又能支持学术界试验创新想法。
于是在中国科学院支持下,由中国科学院计算技术研究所牵头发起了“香山”高性能开源RISC-V处理器项目。
之后团队做了一年多的准备工作,直到2020年6月,香山处理器的正式开发工作开始,GitHub代码仓库也随之建立,之后在深圳鹏城实验室完成了主要的物理设计流程。
据介绍,流水线前端、后端、访存流水线、L1Cache、L2/L3Cache 等在内的关键代码均由香山团队独立实现。
一年多之后,香山处理器第一版(雁栖湖架构)在2021年7月投片。
雁栖湖架构面向单核场景,支持RV64GC指令集,在28nm的工艺节点下达到1.3GHz的频率。
2022年1月,雁栖湖芯片回片并成功点亮,能够正确运行Linux/Debian等复杂操作系统。
这中间,2021年12月,香山的研发团队也进一步发展壮大,与16家机构联合成立了北京开源芯片研究院,进行香山处理器核的产品化改造和后续架构研发。
在第一代投片前的两个月,第二代香山芯片——南湖的设计工作也已经启动。
南湖V1版本面向双核场景, 支持RV64GCBK指令集,于2023年11月投片,在14nm工艺节点下频率达到2GHz。
南湖V2版本则包含了MBIST等改进设计,于2023年4月投片,同年10月回片并成功点亮启动Linux。
南湖V3版本将包含更多的微结构、PPA改进,目前项目正在进行中。
2022年8月24日,中科院计算所、北京开源芯片研究院、腾讯、阿里、中兴通讯等成立了联合研发团队,正式开展第三代香山(昆明湖架构)的联合开发。
昆明湖的设计探索,以及南湖的产品化,自此被确立为香山项目接下来的两项工作重点。
去年8月的第4届RISC-V中国峰会上,基于南湖的开发板正式亮相,并成功运行了《云·原神》。
而根据团队发布的双周报显示,2023年11月,昆明湖的研发已经接近尾声,此表述最后一次在双周报中出现是在去年4月。
在此之后的双周报显示,昆明湖各组正在持续推进面积、时序、功耗的优化。
不过目前,香山处理器还没有实现量产。
官方表示,香山将保持半年左右的微结构迭代周期、流片周期,除了微结构之外,还希望探索并建立一套高性能处理器的敏捷开发流程。
官方文档详解香山微结构
从技术角度看,香山处理器选用了Chisel硬件描述语言,微架构采用了乱序六发射结构、访存子系统分离的设计。
研发团队将访存子系统分离开,包括两条load流水线,两条store addr流水线,两条store data流水线,以及独立的load队列和store队列,store buffer等。
目前南湖微架构的技术文档已经完整公布,整体结构如下:
具体来说,香山处理器前端流水线包括分支预测单元、取指单元、指令缓冲等单元,顺序取指。
南湖架构采取了一种分支预测和指令缓存解耦的取指架构,分支预测单元提供取指请求,写入一个队列,该队列将其发往取指单元,送入指令缓存。
取出的指令码通过预译码初步检查分支预测的错误并及时冲刷预测流水线,检查后的指令送入指令缓冲并传给译码模块,最终形成后端的指令供给。
后端包括译码、重命名、重定序缓冲、保留站、整型/浮点寄存器堆、整型/浮点运算单元。
处理器的流水线后端负责指令的重命名与乱序执行。
如下图所示,香山处理器(南湖)后端可以分为CtrlBlock、IntBlock、FloatBlock、Memblock这4个部分。
CtrlBlock负责指令的译码、重命名和分派, IntBlock、FloatBlock、MemBlock分别负责整数、浮点、访存指令的乱序执行。
(在第三代香山处理器即昆明湖的后端还新增了VectorBlockworlds,负责向量的处理)
香山处理器的MemBlock包含核内的访存流水线及队列,以及与访存流水线紧耦合的一级数据缓存。
其中包含两条load流水线,彼此分离的两条sta流水线和两条std流水线,load和store流水线分别负责维护访存指令的顺序信息。
最新的昆明湖架构还没有详细的技术文档,但团队已经公布了整体的架构图。
可以看出其结构整体上与南湖相似,但后端的各个Block中的具体实现也有不少变化,还增加了一个处理向量的Block,另外部分环节的缓存容量也有提升。
开源协议方面,香山采用木兰宽松许可证第2版,坚持开放全部设计源码和流程,并欢迎来自社区的贡献。
网友:中国正在一砖一瓦建设核心工程能力
“香山”项目意外翻红,也把海外网友给整焦虑了。
在评论中,还有人非常肯定地表示:这正意味着中国在解决基本硬件问题。
在硅谷还在资助一波硬件初创企业时,中国正在一砖一瓦建设核心工程能力。
……
难题才是吸引真正人才的关键。
有人就说了,美国最好的芯片架构师都在英伟达和苹果,没人搞开源。
甚至还有人上升到,如果逻辑和数学是中国的强项,那这将如何影响计算机的未来呢?
还有人扒到了“一生一芯”计划:
这里提到的其实是中国科学院大学在2019年启动的一项计划。
简单来说,就是以流片为目标,让本科生主导完成一款64位RISC-V处理器SoC芯片设计并实现流片,芯片能成功运行Linux操作系统以及学生自己编写的国科大教学操作系统UCAS-Core。
首批参与计划的学生只有5人,经历几年,规模已逐渐扩大到6000余人。
这个计划的核心目标就是在“开源共享”的理念下,突破传统课程边界,缩短人才从培养阶段到投入科研与产业一线的周期。
类似的模式可以参考上世纪在MIT风靡一时的Mead-Conway式培训,它也是主打让学生全流程设计制造芯片。后来,很多学生就拿着自己的课程设计奔赴硅谷创业。
总之,在2025的开年,国产开源开始频繁刷屏。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。