三星Exynos 990的M5内核细节曝光

今年稍早三星发布了Exynos990。该芯片具有更快的NPU,AI性能倍增,并配备了最新的G77 MP11 GPU和LPDDR5内存。同时也是第二颗使用三星7nm EUV制程的手机芯片。

三星Exynos 990的M5内核细节曝光

综观其设计,在各种层面上进行了相当幅度的升级。在通用计算方面,该芯片具有8个核心,其中有4个A55小核,两个A76中核和公司最新的高性能定制CPU核M5。在前几天的一个软件补丁中,三星用新的编译器调度程序模型提交了补丁,其中包含了新内核的一些细节。

M5的细节

M5是由三星奥斯汀研发中心(SARC)开发的第五代定制内核。不过这个开发团队前不久才被裁撤,因此这个核心可能也会是三星最后一个定制核心。

即便三星并不满意定制的成果,但是在营销口径上仍不放松。他们表示,M5内核可提供“高达20%的增强性能”,但是以三星上一代定制核心换算之下,M5的性能恐怕是在平均值以下。尽管LLVM调度程序模型的级别太高,无法说明发生了哪些较小的修改,但我们可以看到一些较大的更改。从LLVM补丁程序中,很难看到M5的大部分性能增长来自IPC的改进,而显着改进的预取器,分支预测器或其他类似的隐藏组件可能是最大功臣。

在指令集方面,M5具有与M4,也就是ArmV8.2-A相同的ISA级别。在较高的设计层次上,M5也与M4十分相似,流水线保持6宽解码,后端保留相同的228条目深度重排序缓冲区。而与M4相较之下,比较明显的差别在于三星将指令队列从48个条目略微增加到60个。更大的变化是错误预测损失,从原本的16个周期降低到15个周期。

三星Exynos 990的M5内核细节曝光

后端设计

在后端,三星添加了两个新的简单的32位整数ALU管道。这使整数管道(包括分支)的总数达到七个。添加两个32位ALU管道很有趣,因为它不会提高典型的简单ALU工作负载的吞吐量。感觉这个设计并不是那么必要。

三星Exynos 990的M5内核细节曝光

在浮点群集方面,三星再次重新平衡了执行管道。 最显着的变化是在三个FP管道的每一个上都增加了NEON执行单元。 在三个浮点管道中的每个管道上增加专用的NEON乘积单元也可以帮助加速解释32b整数ALU。

然而整体看来,性能成长确实不如直接使用A77,三星决定裁撤整个定制核心设计小组的决定,其实也不是那么令人意外了。


分享到:


相關文章: