近日有人询问,龙芯(Loongson)与英特尔(Intel)、AMD之间的差距究竟在哪里呢?
让我先给出结论,龙芯只需考虑性能,而英特尔、AMD甚至华为都需要考虑PPA(性能、功耗、面积)、功耗和功能。这正是设计上最大的区别。
咱们先简单对比一下英特尔的i5-10100和龙芯3a5000。其实3a6000和3a5000的布局几乎可以说是一样的,只是cpu的面积增大了一圈,并去掉了不必要的模块。
我们可以通过这个图来看到,l3缓存的面积甚至比CPU本体还要大。相较之下,i5-10100的l3缓存面积显得相当小气。而麒麟9000s更是对此垂涎三尺。就泰山120架构而言,只需提供更大的缓存,那么IPC(每时钟周期指令数)还有可能会明显提升,可惜目前还无法实现。
这一代龙芯3a6000从5000的锦标赛预测器改为了预测是某种tage预测器,而英特尔和香山(华为)采用的是tage-sc-l,AMD则是神经网络+tage。至于泰山(华为)采用的是何种预测器还不清楚,但我们也推测可能是某种tage预测器。从这一点来看,龙芯采用的技术策略已经处于主流水平。
以AMD的推土机(Bulldozer)所采用的锦标赛预测器为例,那么从3a5000升级到3a6000的性能提升应该与推土机升级到zen1的提升类似。性能提升幅度高达80%并不足为奇(AMD:别再说了,别再说了)。
我们应该理性地认识到,龙芯目前确实在跑分上超过了i5-10100,但这并不意味着龙芯的设计能力已经达到了英特尔或者AMD的水平。
但同时,我们也不应该低估龙芯的设计能力。毕竟,三星的猫鼬架构也是各种先进特性堆叠然后结果一团糟的典范。龙芯至少能够稳健地将这些特性整合起来,这证明龙芯至少具备保底的能力。
与过去相比,龙芯是目前唯一一款国产自研架构能够拿得出手的处理器。而现在无论是泰山还是香山,都是能够自豪地展示的架构。我们很高兴地看到,如今国产CPU至少有三款架构是足以引以为傲的,情况比过去好了太多