Arm宣布其"全面设计"计划取得重大进展。该计划于一年前启动,旨在通过促进行业合作伙伴之间的合作,加快数据中心定制芯片的开发。该生态系统现已发展到包括近30家参与公司,最近又增加了Alcor Micro、Egis、PUF Security和SEMIFIVE等公司。
A@*:<Hs% 5kNzv~4B,; 一个值得注意的进展是,Arm、三星代工厂、ADTechnology和Rebellions合作创建了一个人工智能CPU芯片平台。这项合作旨在为云、HPC和AI/ML工作负载提供解决方案,将Rebellions的AI加速器与ADTechnology的计算芯片结合起来,采用三星代工厂的2 nm Gate-All-Around(GAA)FET技术实现。
fq[;%cr4 l`-bFmpA 该平台有望为生成式人工智能工作负载带来显著的效率提升,据估计,对于像Llama3.1这样拥有4050亿个参数的LLM,其效率将比标准CPU设计提高2-3倍。
RP5+d gb=/#G0R Arm的方法强调了CPU计算在支持完整人工智能堆栈方面的重要性,包括数据预处理、协调和检索增强生成(RAG)等先进技术。公司的计算子系统(CSS)旨在满足这些要求,为合作伙伴构建多样化的芯片组解决方案奠定基础。
D}C,![ bI.t<; 包括Alcor Micro和Alphawave在内的几家公司已经宣布了为各种人工智能和高性能计算应用开发由CSS驱动的芯片的计划。该计划还关注软件就绪情况,确保主要框架和操作系统与基于Arm的系统兼容。最近的努力包括引入Arm Kleidi技术,该技术可为PyTorch和Llama.cpp等开源项目优化基于CPU的推理。
4_ v]O r7]zQIE 值得注意的是,正如Google所称,大多数人工智能工作负载都是在CPU上进行推理的,因此为人工智能打造最高效、性能最好的CPU非常有意义。
}N0Qm[R