EETOP
(部分内容翻译自:anandtech) 昨天,华为在德国柏林和北京同时发布最新一代旗舰芯片麒麟990系列,包括麒麟990和麒麟990 5G两款芯片。两款芯片在性能与能效、AI智慧算力及ISP拍摄能力等方面进行全方位升级。这标志着,华为在5G和端侧AI两大领域同时实现了全球引领。
对于高速缓存,所有四个A76内核都具有512kB L2,而A55内核各为128 kB。
从技术上讲,华为将A76内核称为“基于A76”,因为对缓存系统中的内核进行了一些增强,以改善内存延迟。华为不会说它的“SmartCache”实现有助于GPU,也可以帮助CPU和NPU。我们认为这基本上是DynamiQ DSU之上的下一级缓存,类似于高通和三星的实施。
随着我们从10核750 MHz设计转向16核700 MHz设计,GPU的性能有所提升。
NPU除了实现了内置5G调制解调器,麒麟990最大的变化将是NPU。
在麒麟970和麒麟980 中,华为直接采用了寒武纪公司提供的NPU许可。随着麒麟810以及最新的990的问世,已经完全转向了采用华为自研达芬奇架构的NPU。
在AI 5G的全新赛道,麒麟990 5G将再度引领AI潮流。麒麟990 5G是首款采用华为自研达芬奇架构NPU的旗舰级芯片,创新设计NPU双大核 NPU微核计算架构,NPU大核展现卓越性能与能效,微核NPU实现超低功耗。达芬奇架构是华为在2018年推出的全新自研AI计算架构,基于其灵活可裁剪的特性,华为面向全场景推出昇腾(Ascend)系列芯片,可用于小到几十毫瓦,大到几百瓦的训练场景,横跨全场景提供最优算力,而此次麒麟990 5G搭载的正是面向智能手机场景的Ascend Lite和Ascend Tiny。
在双大核NPU(Ascend Lite*2)加持下,麒麟990 5G实现业界最强AI算力,与业界其他旗舰AI芯片相比,性能优势高达6倍,能效优势高达8倍,持续刷新端侧AI的算力高点。无论是在业界典型的中载神经网络模型ResNet50(用于检测、分割和识别),还是在移动端更流行的轻载神经网络模型MobilenetV1(用于分类、检测、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均达到业界最佳水平。业界首发NPU微核(Ascend Tiny)赋能超低功耗应用,在人脸识别的应用场景下,NPU微核比大核能效最高可提升24倍,让AI运算更省电。
在990 5G和990 4G之间也存在差异。除了调制解调器,GPU和制造工艺之外,芯片尺寸差异的一个原因是990 5G的NPU内核数量是其两倍。990 5G将拥有两个“大”NPU核心,同时支持双ML流程以及Tiny Core NPU。相比之下,990 4G只有一个“大”NPU核心,加上微核NPU。
这意味着我们可能会看到Kirin 990 4G设备可能无法实现的某些功能。
巴龙调制解调器除了是第一款集成智能手机5G设计外,最终华为并未提供有关新5G调制解调器或4G设计更新的详细信息。据称,麒麟990 5G是第一款商用的支持NSA和SA架构的全频调频调制解调器。
GPU方面,麒麟芯片始终追求更好的用户体验。针对GPU在运行重载游戏、播放高清视频等高负载场景下容易出现的发热、掉帧、卡顿等问题,麒麟990 5G搭载16核Mali-G76 GPU,与业界主流旗舰芯片相比,图形处理性能高6%,能效优20%,实现业界领先的性能与能效。全新系统级Smart Cache分流,支持智能分配DDR数据,在重载游戏等大带宽场景下带宽较上一代最高可节省15%,功耗可降低12%,进一步提升GPU能效。
余承东在现场表示,在双大核NPU加持下,麒麟990 5G实现业界最强AI算力,与业界其他旗舰AI芯片相比,性能优势高达6倍,能效优势高达8倍,持续刷新端侧AI的算力高点。无论是在业界典型的中载神经网络模型ResNet50(用于检测、分割和识别),还是在移动端更流行的轻载神经网络模型MobilenetV1(用于分类、检测、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均达到业界最佳水平。业界首发NPU微核(Ascend Tiny)赋能超低功耗应用,在人脸识别的应用场景下,NPU微核比大核能效最高可提升24倍,让AI运算更省电。
花粉社群VIP加油站
猜你喜欢