如果说推土机架构的Interlagos Opteron 6200系列处理器用于超级计算机、高性能计算集群是很自然的事情,那么Llano APU也参与其中就颇为意外了。近日,高性能计算专业厂商Penguin Computing就在新墨西哥州阿尔伯克基的美国桑迪亚(Sandia)国家实验室里成功搭建了全球第一套基于AMD Fusion APU加速处理器的高性能计算集群。 f7]C1!]
$J:~jY/J
这套系统基于Penguin Computing、AMD联合开发的Altus 2A00计算平台,专门用来支持AMD APU架构。它由104台服务器通过QDR Infiniband光纤网络互联而成,均放置在2U机架内,处理器为最高端型号A8-3850,理论峰值浮点性能59.6TFlops。 CH h6Mnw
bzMs\rj\
Penguin Computing没有透露具体使用了多少颗A8-3850,不过根据AMD公布的资料,该处理器的浮点性能为573GFlops,这就很容易推断出一共是104颗,每台服务器一颗(因为APU不支持单系统多路并行)。 oxqD/fY
ZZ;V5o6E
Penguin Computing表示,AMD APU处理器整合了x86处理核心、GPU计算核心、内存控制器、PCI-E控制器等,其中的最多400个并行处理核心(流处理器单元)可通过OpenCL编程框架用于高性能计算应用,而且不同于传统的GPU服务器架构,APU的并行处理核心可与CPU共享物理内存空间,因此编程更加简单,也避免了GPU与系统内存之间的瓶颈,更无需数据复制。 fNi_C"<
m4T`Tg#P
服务器版的推土机尚未发布,不过在超级计算机中的应用已经迅速展开,现已有: 3D7phq>.q
]
i\a[3
- “泰坦”(Titan):位于美国橡树岭国家实验室,“美洲虎”(Jaguar)的升级版,基于Cray XK6超级计算系统,配置了2.5多万颗Interlagos处理器,峰值浮点性能10-20PFlops,有望超过刚刚升级的日本“京”。值得一提的是,泰坦还会使用NVIDIA Tesla GPU加速计算技术,这也是其性能超高的主要原因之一。 B7qiCX}pD
.We"j_
}
- “NAMEN”:位于蒙古国首都乌兰巴托,用于天气预报和气象工程,构建局部天气和气候模型。 <wt9K2,
?r6uEZ
- “CSCS”:位于瑞士Manno的瑞士国家高性能计算中心。 %8GY`T:^
G@n%P~
- “HECToR”:位于英国爱丁堡大学,英国工程和自然科学研究委员会资助,为整个欧洲的科研人员服务。 %g&i.2v
Z,Tv8;
- “HLRS”:位于德国斯图加特大学的高性能计算中心,是欧洲高级计算合作伙伴计划(PRACE)的顶级超级计算资源,为整个欧洲的研究人员、科学家、工程师提供服务。 AfW9;{j&I
bQM_rqjJGw
此外,现有的Opteron 6100系列也在美国新墨西哥州的洛斯阿拉莫斯国家实验室(LANL)、巴西圣保罗大学天文系赢得了新的位置。前者的Appro Xtreme-X超级计算机使用了3.8多万颗处理器,峰值性能353TFlops;候着的SGI Altix ICE 8400高性能计算系统则在单个机柜内配置了1500多个处理核心。 >;@hA*<
!=c&U.B
f9 b=Zm'