基于鲲鹏和昇腾异构平台的单节点HPL-AI设计与优化
华南理工大学学报(自然科学版)
页数: 10 2024-02-15
摘要: 鉴于低精度浮点运算拥有更快的运算速度,越来越多的高性能应用采用混合精度方案进行加速,而同样采用该方案来加速的AI(人工智能)大模型也受到广泛关注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基准测试被提出,用于评估高性能系统的混合精度运算性能。针对该基准测试,本研究在鲲鹏和昇腾异构平台上设计并... (共10页)