微软今日宣布,通过Azure AI Foundry接入DeepSeek-R1 7B和14B蒸馏模型,为Copilot+PC提供本地运行7B和14B模型的能力。
1EQLsg`d^ mk[<=k~ 早在今年1月,微软就宣布计划将DeepSeek-R1模型的NPU优化版本直接带到搭载高通骁龙X处理器的Copilot+PC上。如今,这个承诺终于兑现。
jygKw+C
91|~KR) 从微软官方博客获悉,模型将从搭载高通骁龙X处理器的Copilot+PC开始上线,随后是英特尔酷睿Ultra 200V和AMD锐龙的设备。
T854}RX[{ M9Qx F 由于模型运行在NPU上,因此可以减少对PC电池续航和散热性能影响的同时,持续获得AI计算能力,CPU和GPU将可用于执行其他任务。
\4Z"s[8}
PBb'`PV 微软强调,它使用了Aqua内部自动量化工具,将所有DeepSeek模型变体量化为int4权重。不幸的是,模型标记速度相当低。微软报告称,14B模型的标记速度仅为8 tok/秒,而1.5B模型的标记速度接近40 tok/秒。微软提到,该公司正在进一步优化提高速度。
[E;~Y_l +?^lnoX 开发者可以通过AI Toolkit VS Code扩展在Copilot+PC上下载和运行DeepSeek模型的1.5B、7B和14B版本。
CO{AC~