雷锋网消息,不久前外媒ChipRebel刚刚发布了华为Mate 20手机的拆解,并公布了麒麟980处理器的透视照片,让我们有了一窥这款让华为表示“稳了”的处理器,并首次看到Arm全新Cortex A76 CPU和全新Mali G76 GPU的真容。
当高通和三星在2016年下半年发布骁龙835和Exynos 8895这两款使用10nm LPE工艺的产品时,麒麟960却只能选择台积电16nm FFC工艺,这种劣势显著的体现在芯片的能耗比方面。
麒麟970虽然缩小了制造工艺方面的差距,但由于其设计周期较早,错过了Arm当时最新的Cortex A75架构,只能基于Cortex A73架构设计,而推出较晚的骁龙845则全面基于Cortex A75和Cortex A55改进。
在这次的麒麟980,华为终于再次集齐了最先进的制造工艺和最新的架构设计,从这方面来看,麒麟980背负着比麒麟970和麒麟960更大的期望和历史任务,有望复制甚至超越几年前麒麟950的成功。
此次华为充分利用了Arm的新DSU集群及异步CPU配置,将麒麟980中Cortex A76架构的高性能CPU集群细分为两组,高频率的一组运行在2.6GHz频率上,另一组Cortex A76 CPU的运行频率为1.92GHz(这应该是一个很好的能效比平衡点),各自运行在不同的频率和电压上,可根据不同使用场景灵活调用,有效提升实际使用时的能效比。
缓存方面,所有Cortex A76都带有推荐的512KB L2缓存配置,而A55则采用128KB缓存。在雷锋网此前分析Cortex A76的文章中曾提到过,在最新的DynamIQ群集配置中,L2缓存是每个CPU核心独占的。DSU中的L3缓存则为4MB共享式设计,容量为骁龙845和麒麟970的两倍。
改进的内存延迟SoC的存储子系统对其性能表现至关重要,麒麟970便在这方面吃了一些亏,它在高频率下运行时似乎有些问题,这使得华为不得不在默认情况下选择降低其设备的频率,导致了一些性能下降,尤其是在对内存延迟敏感的工作负载中。
当然,只要控制好性能和功耗的关系,这样的提升方式并不能说是消极的。麒麟980的CPU性能是苹果A12的57%~62%,功耗是苹果A12的59%~62%,二者处理相同任务消耗的能量基本相同,这有什么不对的呢?相比之下Exynos 9810是个典型的反例,在冲击高频时付出了极大的功耗代价,却没有表现出与之相匹配的性能提升,能效比极差。
前三个CPU测试项使用了NNAPI尚未支持的函数的模型,影响性能的仅仅是CPU性能以及性能响应时间,这意味着DVFS和调度器响应等机制可能对结果产生巨大影响,比如Galaxy S9上的表现就要明显优于同为Exynos 9810处理器的Note9。
尽管如此,将麒麟970与麒麟980进行对比,依然能够展示Cortex A76的性能,以及华为的DVFS /调度器可能的改进。
接下来的FP16测试项终于启用了麒麟处理器的NPU,并且在新老两代处理器上都取得了领先的成绩。在这里麒麟980的双核NPU终于得以体现,Mate 20展现出了巨大的领先优势。不过一加6似乎在其NNAPI驱动程序中出现了一些非常奇怪的问题,使得它的性能比其他平台差一个数量级,不知道这项测试是跑在了其CPU上还是GPU上。
而在最后的FP32测试项中,大多数手机都再次回到CPU上进行运算,麒麟980的改进有限。
总体而言,AI-Benchmark至少验证了华为对NPU性能的一些宣传,不过从这些测试结果中得出的真正结论是,大多数具有NNAPI驱动程序的设备目前本身尚不成熟且功能仍然非常有限,与苹果如今的CoreML生态系统相比相差甚远。
雷锋网总结麒麟980的CPU性能表现应该在很大程度上可以代表下一代骁龙8150的情况,高通或许会在CPU频率上稍稍提升一些,但最大的问题在于内存子系统方面,高通能不能解决L4系统缓存引入的延迟惩罚问题。
而Cortex A76对于三星来说就实在是太可怕了,如果Exynos 9820所用的Exynos M4架构只是一次常规迭代,说实话在Cortex A76面前是没什么竞争力的。三星需要在性能和能耗比两个方面均作出重大改进,才能与麒麟980相匹敌。
GPU方面,雷锋网认为,虽然Arm玩GPU确实比从桌面端过来的Imagination和高通(GPU团队来自ATI)差得远,但这个锅恐怕还没办法直接甩给Arm的Mali G76架构,因为三星Exynos SoC的GPU能耗比要明显好于麒麟SoC,两家分别选择了牺牲面积换性能和牺牲功耗换性能的方式。
三星Exynos 9810和8895虽然GPU面积很大(24.53mm² & 32mm²),但由于频率只有560MHz左右,因此功耗表现尚可,Exynos 9810的能耗比甚至非常接近于骁龙845。而与三星的狂堆核心数相比,麒麟970则只使用了中等数量的核心,然后通过拉高核心频率来榨取性能。
雷锋网曾经提到,每种核心架构在某一工艺下,都有一个能耗比最佳的频率区间,越过这个区间后,继续拉高频需要付出极大的功耗代价。麒麟970的Mali G72 MP12频率为746MHz,功耗上升非常明显,能耗比仅略高于使用Mali G71的Exynos 8895。
因此在理论上说,对比三星Exynos SoC,华为的麒麟SoC从未曾表现出Arm Mali GPU应有的能耗比。不过,据悉三星集成NPU的Exynos 9820也只采用了Mali G76 MP12的配置,远不如以前动辄MP18或MP20那么豪迈了。由此来看,华为“少核高频”的策略,是为了给NPU腾地方不得已而为之吧,或许只能等三星Exynos 9820的具体参数和测试成绩公布后才能进一步揭秘了。
NPU方面,回顾一下此前麒麟970的测试,在麒麟980上仍然没有看到NPU对用户有明显的好处,因为我们还没有可用的软件来使用这部分硬件。我们不清楚华为是怎样使用NPU进行相机处理的,但除了这些自带的第一方软件外,NPU目前对设备体验仍然处于一种薛定谔状态。
via:Anandtech
花粉社群VIP加油站
猜你喜欢