论坛风格切换
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 53阅读
  • 0回复

[业界新闻]Arm与合作伙伴开发AI CPU:基于2纳米三星GAA FET的Neoverse V3 CSS [复制链接]

上一主题 下一主题
 

发帖
7086
今日发帖
最后登录
2024-12-23
只看楼主 倒序阅读 使用道具 楼主  发表于: 2024-10-17 10:44:35
  Arm宣布其"全面设计"计划取得重大进展。该计划于一年前启动,旨在通过促进行业合作伙伴之间的合作,加快数据中心定制芯片的开发。该生态系统现已发展到包括近30家参与公司,最近又增加了Alcor Micro、Egis、PUF Security和SEMIFIVE等公司。 A@*:<Hs%  
5kNzv~4B,;  
  一个值得注意的进展是,Arm、三星代工厂、ADTechnology和Rebellions合作创建了一个人工智能CPU芯片平台。这项合作旨在为云、HPC和AI/ML工作负载提供解决方案,将Rebellions的AI加速器与ADTechnology的计算芯片结合起来,采用三星代工厂的2 nm Gate-All-Around(GAA)FET技术实现。 fq[;%cr4  
l`-bFmpA  
  该平台有望为生成式人工智能工作负载带来显著的效率提升,据估计,对于像Llama3.1这样拥有4050亿个参数的LLM,其效率将比标准CPU设计提高2-3倍。 RP5+d  
gb=/#G0R  
  Arm的方法强调了CPU计算在支持完整人工智能堆栈方面的重要性,包括数据预处理、协调和检索增强生成(RAG)等先进技术。公司的计算子系统(CSS)旨在满足这些要求,为合作伙伴构建多样化的芯片组解决方案奠定基础。 D}C,![   
bI.t <;  
  包括Alcor Micro和Alphawave在内的几家公司已经宣布了为各种人工智能和高性能计算应用开发由CSS驱动的芯片的计划。该计划还关注软件就绪情况,确保主要框架和操作系统与基于Arm的系统兼容。最近的努力包括引入Arm Kleidi技术,该技术可为PyTorch和Llama.cpp等开源项目优化基于CPU的推理。 4_v]O  
r7]zQIE  
  值得注意的是,正如Google所称,大多数人工智能工作负载都是在CPU上进行推理的,因此为人工智能打造最高效、性能最好的CPU非常有意义。 }N0Qm[R