(CWW)当前,移动设备上出现越来越多包括生成式AI在内的智能技术。同时,市场对更高性能、更加智能以及更多视觉和触觉交互的需求仍在持续飙升,带来了比以往更大、更加复杂的计算需求。为此,Arm近日正式推出了Arm 2023全面计算解决方案(TCS23),致力于为智能手机推出性能最优异的移动计算平台。据了解,TCS23是通过一整套针对特定工作负载而设计和优化的IP,这些IP可作为一个完整的系统,无缝地协同工作,为沉浸式游戏体验和智能AI应用提供支持。
TCS23在设计时充分考虑了智能手机的需求,涵盖全新旗舰级Arm Immortalis GPU、全新Armv9 CPU集群。
“对于视觉计算来说,捕捉、创造和使用上的最佳体验是所有的关键,这需要出色的性能、全天侯的电池续航时间和一流的硬件支持。”Arm中国区业务全球副总裁邹挺表示,作为手机设计至关重要的组成部分之一,GPU目前已经达到了更高的技术水平。Arm推出的第五代GPU架构专为旗舰智能手机设计,重新定义了部分图形管道,减少了多达40%的内存带宽用量,使总体系统效率与功耗优化14%。该架构还引入延迟顶点着色功能,重新定义了GPU中的图形数据流,有助于实现更出色且持久的帧率,最终带来更高质量的图形,打造最佳视觉体验。据悉,相同配置下,对比前一代产品,Immortalis-G720的性能提高了15%,而面积仅增加2%。
(资料图片仅供参考)
Arm推出全新的Armv9 Cortex计算集群,包括超大核Corte-X4、大核Cortex-A720及能效核Cortex-A520,该集群已连续三年实现两位数的性能提升。据官方介绍,与Cortex-X3相比,Cortex-X4性能提高15%,功耗降低了40%,而面积仅增加10%,不论是更快速的即时应用响应,或是更流畅的网页浏览体验,Cortex-X4的增强性能将为移动设备带来显著升级。与上一代相比,大核Cortex-A720和能效核Cortex-A520在能效上均提高了20%,其中Cortex-A720是业界主流的CPU IP,可提高持续性能,是新CPU集群的核心主力。此外,为了完善全新的CPU集群,Arm推出了全新的DSU-120 ,满足高要求的多线程用例。
处理器的性能提升离不开制程工艺的进步。邹挺表示,今年早些时候,Arm在TSMC N3E制程工艺上顺利完成了业内首个Cortex-X4的流片,未来Arm与TSMC将通过设计分区和利用先进的封装技术,一同协作提高系统性能和能效。
安全对处理器来说同样至关重要。新CPU支持64位计算和Armv9安全创新功能,能够抵御更高级别的数字威胁。通过Armv9架构的CPU,Arm的内存标记扩展MTE功能,支持开发者在应用部署前后,检测和避免内存安全漏洞,消除占所有软件漏洞中70%的内存安全漏洞。
“Arm在10年前就开始陆续将64位处理器推向市场,并相信只有64位才是正确的方向。”Arm高级副总裁兼终端事业部总经理Chris Bergey表示,TCS23正式切换到64位,不仅保证了更高的性能,也进一步夯实了计算安全。在中国的顶级应用商店中,排名前3000位的应用都是100%兼容64位。当然,作为一个面向广泛市场应用的IP供应商,Arm仍然在处理器核心提供32位的支持,面向诸如物联网及更小型计算平台的应用。
此外,ChatGPT的出现使AI芯片的需求大增,对TCS23也提出了新要求。对此,Chris Bergey表示,大语言模型将塑造计算的未来,需要进一步提升AI方面的工作负载,Arm将继续推进对开源软件库Arm NN和Arm Compute Library的支持,以便那些以世界上部署最多的平台 (即Arm) 为目标的开发者能够继续利用类似ChatGPT或大型语言模型的应用程序来开发他们的应用。
“一方面,我们确实看到云在创造大型语言模型方面持续发挥着巨大的推动作用。但另一方面,有一个重要的趋势使得小型模型在设备上应用而生,如安卓。”在Chris Bergey看来,这主要有两个原因,一是隐私保护,出于隐私保护的考虑,用户更愿意在本地储存数据;二是能效问题,本地运行和处理在能效方面比云端更具成本效益。
据了解,Arm NN和Arm Compute Library已在安卓平台上面向Google应用开放,目前拥有超一亿的日活用户,助力开发者优化运行在Armv9 CPU和Arm GPU的ML工作负载的执行。