如果说推土机架构的Interlagos Opteron 6200系列处理器用于超级计算机、高性能计算集群是很自然的事情,那么Llano APU也参与其中就颇为意外了。近日,高性能计算专业厂商Penguin Computing就在新墨西哥州阿尔伯克基的美国桑迪亚(Sandia)国家实验室里成功搭建了全球第一套基于AMD Fusion APU加速处理器的高性能计算集群。 k1X <jC]P
~(}zp<e|
这套系统基于Penguin Computing、AMD联合开发的Altus 2A00计算平台,专门用来支持AMD APU架构。它由104台服务器通过QDR Infiniband光纤网络互联而成,均放置在2U机架内,处理器为最高端型号A8-3850,理论峰值浮点性能59.6TFlops。 R!:1{1
.*8.{n5
Penguin Computing没有透露具体使用了多少颗A8-3850,不过根据AMD公布的资料,该处理器的浮点性能为573GFlops,这就很容易推断出一共是104颗,每台服务器一颗(因为APU不支持单系统多路并行)。 ^Xh9:OBF
zF{5!b
Penguin Computing表示,AMD APU处理器整合了x86处理核心、GPU计算核心、内存控制器、PCI-E控制器等,其中的最多400个并行处理核心(流处理器单元)可通过OpenCL编程框架用于高性能计算应用,而且不同于传统的GPU服务器架构,APU的并行处理核心可与CPU共享物理内存空间,因此编程更加简单,也避免了GPU与系统内存之间的瓶颈,更无需数据复制。 <jV_J+#
98x(2fCvF(
服务器版的推土机尚未发布,不过在超级计算机中的应用已经迅速展开,现已有: $AoN,B>
4rv3D@E
- “泰坦”(Titan):位于美国橡树岭国家实验室,“美洲虎”(Jaguar)的升级版,基于Cray XK6超级计算系统,配置了2.5多万颗Interlagos处理器,峰值浮点性能10-20PFlops,有望超过刚刚升级的日本“京”。值得一提的是,泰坦还会使用NVIDIA Tesla GPU加速计算技术,这也是其性能超高的主要原因之一。 fuQ?@F
sURHj&:t|
- “NAMEN”:位于蒙古国首都乌兰巴托,用于天气预报和气象工程,构建局部天气和气候模型。 Z[|(}9v?~
Fe:0nr9;
- “CSCS”:位于瑞士Manno的瑞士国家高性能计算中心。 9hcZbM]
-8g ;t3z
- “HECToR”:位于英国爱丁堡大学,英国工程和自然科学研究委员会资助,为整个欧洲的科研人员服务。 Uc\\..Cf
o <sX6a9e
- “HLRS”:位于德国斯图加特大学的高性能计算中心,是欧洲高级计算合作伙伴计划(PRACE)的顶级超级计算资源,为整个欧洲的研究人员、科学家、工程师提供服务。 <jfi"SJu
koe&7\ _@
此外,现有的Opteron 6100系列也在美国新墨西哥州的洛斯阿拉莫斯国家实验室(LANL)、巴西圣保罗大学天文系赢得了新的位置。前者的Appro Xtreme-X超级计算机使用了3.8多万颗处理器,峰值性能353TFlops;候着的SGI Altix ICE 8400高性能计算系统则在单个机柜内配置了1500多个处理核心。 RoPz?,u
]ZZ7j
pS9CtQqvgy