AMD Instinct MI200预计每个MCM GPU使用110个计算单元

时间:2021-09-03 11:01:29来源:
导读 Coelacanth& 39;s Dream网站找到了一个Github 提交,该提交可能预示着即将到来的基于 AMD Aldebaran GPU 的 Instinct 加速器的未来

Coelacanth's Dream网站找到了一个Github 提交,该提交可能预示着即将到来的基于 AMD Aldebaran GPU 的 Instinct 加速器的未来配置。代号为“GFX90A”的新 GPU 将采用 CDNA2 架构,这是 GFX 9th Family 结构(Vega 结构)的衍生物。

AMD Instinct MI200 可配备两个 110 计算单元 CDNA 2 GPU 芯片

共有三个代码,GFX906_60、GFX908_120 和 GFX90A_110,每个代码都针对不同的来源。推测GFX906_60指的是Instinct MI60,GFX908_120指的是Instinct MI100,GFX90A_110可能用于新一代AMD加速器。对于每个代码,第三部分是指计算单元。

据称,Aldebaran GPU 将展示 128 个计算单元,这与收到的有关新 AMD 加速器的下一代代码的信息不符。但是,任何 GPU 通常都会停用某些集群,如果这是正确的,则会将其减少到 110 个活动计算单元。

考虑到不同的Shader Engine和CU的设置,Aldebaran / MI200是2个GPU die的MCM配置,所以如果每个die的设置是对称的而不是Shader Engine,那么每个die都会有4个SE。可以有(56 个 CU),并禁用它们中的每一个,从而使总共 110 个 CU。网站VideoCardz指出,

目前尚不清楚 AMD 是否计划将 CDNA2 架构上的 FP32 内核数量增加一倍,但假设他们这样做,加速器将提供的理论 GPU 时钟为 1500 MHz,单精度计算性能为 42.2 TFLOPS,是 MI100 的 1.82 倍.如果不是这种情况,那么 MI200 必须至少具有 1650 MHz 的时钟才能达到 23 TFLOP 的相同 FP32 吞吐量。

对于 MI200 等 HPC 加速器,FP64 性能更为重要。根据之前的泄漏,MI200 将具有全速率 FP64 性能,这意味着性能是 MI100 的两倍或四倍,具体取决于架构。

标签:
最新文章