花粉乐分享平台宣传视频
> 华为资讯 > 华为资讯 > 华为芯片 > Arm全新GPU深度解读:一次重大的飞跃|半导体行业观察
Arm全新GPU深度解读:一次重大的飞跃|半导体行业观察
来源:半导体行业观察
2022-12-03 18:47:27
511
管理

来源:本文由公众号半导体行业观察(ID:icbank)翻译自「anandtech」,作者 Andrei Frumusanu,谢谢。

在Bifrost架构的最后一次迭代中,Mali-G76对于Arm而言是一次更重要的飞跃,IP在很大程度上能够解决其前代产品的一些关键问题,从而为Exynos 9820和麒麟980芯片组带来了相对较好的结果。

不幸的是,当Arm迎头赶上并解决BiFrost的问题时,竞争对手并没有止步不前,而且还在挑战极限。高通的Adreno GPU架构多年来一直在移动领域处于领先地位,尽管Adreno 640今年没有取得令人印象深刻的改进,但它在性能、效率和密度方面仍明显领先于Arm。更令人担忧的是,苹果A12的GPU在性能和效率方面绝对是一个重大飞跃,甚至比高通最好的GPU都要好得多,更不用说Arm的Mali GPU了。

Valhall简介:一次重大的改进

今天我们要介绍Arm的全新GPU架构:Valhall(古挪威语Valhöll,即Valhalla)。新架构带来了全新的ISA和计算核心设计,试图解决Bifrost架构的主要缺点,并且看起来与我们看到的其他GPU供应商采用的设计方法非常相似。

新ISA的一部分是一种新的编码,它比我们在Bifrost中看到的更加规则。Valhall架构的一个重要新特性是,新ISA摆脱了固定的问题调度、子句和元组。在Bifrost中,Arm将指令的调度委托给编译器,将它们分组到所谓的子句中。这在实践中是有效的,尽管它在编译器上花费了大量的工作来获得最佳的结果,并试图隐藏指令和数据访问之间的延迟。

在ValHall中,调度完全由硬件完成,这本质上更类似于无序CPU的工作方式。这种新设计还意味着实际的ISA与实现的微架构更加脱节,这是一种更具前瞻性的设计选择。

新的ISA还将重点放在优化纹理指令上,这与新架构大幅增强的纹理能力有关。

其他变化包括对现有技术的增量更新和数据结构的演变,其中包括对几何流的优化和对AFBC(ARM帧缓冲压缩)的优化。

前端创建和撤消warp,并保持必要的状态。在前端内有一个动态调度程序,它决定每个warp执行哪些指令。等待dependency 的warp将替换为准备执行的warp。

I-cache在处理之间共享,是16KB(2048指令)4路组相联(4-way set associative),根据带宽每个周期能够发出4条指令。

着色器核心仍然包含执行引擎、带有缓存的加载/存储单元、属性单元、变化单元、纹理映射单元和像素后端,以及其他各种3D固定功能块。

这里最大的变化是纹理单元块,与我们在Mali-G76上发现的已经加倍的单元相比,它的吞吐量翻了一番。

Arm的性能声明非常有趣,因为Arm公布的性能是基于每mm²。基于供应商实现他们的GPU的方式,他们可以改变核心数量以及频率,实际上很难给出一个清晰的数字来描述两个独立GPU配置之间的改进。对于G77,Arm声称新IP能够提供比G76的每mm²性能提高1.2~1.4倍。就绝对值而言,G77着色器核心的大小据说与G76核心的大小相同。

这意味着这可以直接为供应商转换成更小的GPU,或只是更多的空间,以增加额外的GPU核心,从而提高性能。特别是,Arm声称G77在纹理重的游戏中表现得非常好,因此,关注器件实际的样子,以及不同工作负载的表现将是一件有趣的事情。

另一种提高性能的方法是提高GPU的时钟。这里的根本限制是智能手机的4~5W TDP限制。在ISO流程和性能方面的比较中,据说新的G77使用17%~29%的能源和功率来完成同样的工作负载。或者换言之,性能/W提高了1.2~1.39倍。Arm表示G76和G77之间的基本频率根本不会发生太大变化,内部Arm的目标仍然是850MHz。

今年我不打算尝试任何性能和效率预测,因为有太多的变量在发挥作用。我预计,明年更大的变化之一是SoC将支持LPDDR5,这可能会显着改变智能手机的功率动态。

Arm的确指出,他们预计明年使用G77的SoC性能将提高1.4倍。以三星的Exynos9820作为G76的参考,这意味着未来的G77 SoC将以更高的功率效率(假设维持功率水平不变)接近苹果的A12 GPU性能。这将使高通陷入麻烦,因为它将明显超越当前一代Adreno 640,但我们预计高通也将推出新一代GPU。

最后,Arm对最近两代Mali GPU进行了代际比较。在相同的工艺和相同的性能下,新的G77继续实现30%的同比能效改进,并且比Mali-G72节省50%的能源。

结论

在TechDay活动期间,Arm显然对新的Valhall架构和新的Mali-G77感到非常兴奋。他们非常有理由感到兴奋,因为看起来Arm似乎将展示Mali GPU IP的重大代际飞跃。

新的G77采用了一种全新的架构,从根本上改进了ARM的执行核心,旨在实现更现代的、符合台式计算机GPU的架构。这似乎是一个长期的转变,虽然G76是一个相对较好的GPU,但前代的G72和G71不是。

我期待今年晚些时候和明年年初在下一代三星Exynos和海思Kirin SoC中看到Mali-G77。从理论上讲,如果一切顺利,G77应该能够缩小与苹果和高通在性能和效率方面的差距。尤其是G77应该能够超越高通的Adreno GPU,至少是当前一代的Adreno。

我对此相当乐观,现在Arm和被授权的合作伙伴只需要正确地执行,就可以让用户享受最终成果。

花粉社群VIP加油站

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非花粉乐分享)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@hflfx.com
关于作者
Outlier(蜂界传说)
文章
524
主题
0
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行
随手拍
54个圈友 0个话题
华为手机随手拍,记录生活点滴之美好
华为P30pro
51个圈友 0个话题
这里是华为P30pro手机交流圈,欢迎华为P30pro用户进群交流
体验官
60个圈友 2个话题
华为花粉体验官,体验官专属的交流群
登录后查看您创建的圈子
登录后查看您创建的圈子
所有圈子
杭州互联网违法和不良信息举报平台 网络110报警服务 浙ICP备17046585号
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索