骁龙888深度解读:集成5G芯片,图形性能提升最大
对于处理器市场来说,今年是非常热闹的一年。AMD凭借Zen 3摘得PC领域的桂冠,而苹果则依靠基于ARM架构的Mac向英特尔发起挑战。现在,高通公司又希望通过发布最新的移动处理器——骁龙888来改变游戏规则。
骁龙888的主要功能包括:CPU性能比上一代提升25%,图形性能提高35%,集成高速5G芯片以及全新的人工智能和图像处理能力,所有这些都被基于5nm的制程工艺封装在一起。骁龙888还为游戏玩家、开发者以及注重安全的用户引入了新功能,下面,我们一起来了解一下。
让我们从最基本的CPU和GPU开始。正如预料的一般,高通作为ARM CXC计划的成员,获得了今年共同开发的Cortex-X1核心架构的使用权。Cortex-X1是ARM路线图中更大、更强的衍生产品,相对ARM最新的Cortex-A78来说性能提升约23%。像去年一样,高通将这些核心按照三丛集排列。
高通的Kryo 680 CPU集群由一个时钟频率为2.84GHz的大功率Cortex-X1和一个1MB的二级大缓存组成。下面是三颗峰值时钟频率为2.4GHz的Cortex-A78大核心,每颗核心有512KB的二级缓存,比去年的缓存增加了一倍。最后,是4颗低功耗的Cortex-A55核心,拥有128KB二级缓存,时钟频率达到1.8GHz,时钟速度与上一代相同,说明保守的性能提升换来了更好的续航能力。也说明多核处理的收益有限,而单颗Cortex-X1将在对单线程计算能力要求更高的场景中发挥更有意义的作用。
整个核心群配备了4MB的三级缓存和3MB系统缓存,与骁龙865相比没有变化。而大核Cortex-X1的二级缓存相对Cortex-A78来说增加了一倍。显然是高通发现了一些性能上的好处,给大核提供了更大的内存来工作。并且Cortex-A78的每个核心比Cortex-A77小了5%,为额外的缓存留足了空间。归根结底,骁龙888拥有高出25%的CPU性能和电源效率,而其很大程度上得益于5nm制程工艺。
在Adreno 680 GPU方面,高通公司没有透露其图形芯片的内部工作原理。但该公司宣称其性能提升了35%,是历代产品中提升幅度最大的。
高通公司最新的GPU支持亚像素渲染,作为显示引擎的一部分,这可以提高显示分辨率。下一代游戏机和PC GPU中的可变速率着色也已进入该架构。这可以在支持的游戏中减少40%的着色器渲染需求,从而使性能提升30%。但对于不支持该功能的游戏来说,效果可能会很有限。Adreno 680还包括新的机器学习指令,其AI性能提升高达43%。
机器学习(AI)处理是高通公司现代计算异构方法的一个关键部分。2018年的骁龙855将Tensor加速器引入到AI处理组合中。2020年,骁龙888将Hexagon 780 DSP内部的标量、张量和矢量处理单元 \\\"融合 \\\"在一起,共享内存量达到16倍。
最终的结果是在单元内部实现了工作负载的无缝共享,并将三种处理器类型之间的工作负载的交接时间提高了1000倍。此外,标量处理器的性能提升了50%,而Tensor的计算能力是上一代的两倍。结合CPU、GPU和DSP能力,高通宣称每瓦特的AI性能提升了3倍。整体AI计算能力提升了26TOPs(处理器运算能力单位),这比骁龙865的15top提升了73%。
然而,我们应该对TOPs的说法持谨慎态度。TOPs并没有告诉我们任何关于用于计算该数字的工作负载类型的信息。此外,很少有工作负载会一次性将骁龙888的各种AI核心发挥到极致,尽管高通表示在某些场景下有可能这样做。
而更重要的是,高通也为开发者提供了一些新的机器学习工具。新的高通AI Engine Direct作为Android NN、TensorFlow Lite和高通SDK的入口。这将帮助开发者充分利用骁龙的功能,无论他们喜欢哪种流行的框架。高通公司的AI平台现在还支持开源的TVM编译器,使开发人员能够使用Python而不是C或汇编进行编程。这比以往任何时候都更容易利用整个高通AI引擎。
骁龙888的另一个重要变化是集成了骁龙X60 5G调制解调器。许多基本规格似乎与上一代产品相似,包括峰值mmWave速度下行7.5Gbps,上行3Gbps。然而,X60还引入了6GHz以下的FDD和TDD载波聚合,以及跨6GHz以下和mmWave频段的聚合,以帮助实现这些理论上的峰值速度。载波聚合对于提升速度和容量非常重要,因为它可以同时在低频段、Sub-6GHz和mmWave频谱上发送数据。此外,还支持Voice-over-NR,可以在未来的5G独立网络上进行通话,但我们需要等待运营商在这方面的支持。