Copilot+PC是首款在设备上运行小语言模型(SLM)的计算机。这种方法的优势在于,它比基于云的Copilot应用程序更快地生成图像或文本生成等任务的结果。现在,微软推出了AI Dev Gallery,这是一种将设备上的人工智能功能集成到任何应用程序中的简便方法。
;-aF\}D@n @Feusprs AI Dev Gallery应用程序适用于希望尝试多种模型将人工智能功能集成到其应用程序中的开发人员。该应用提供超过25个样本,用户可以下载并在设备上运行。此外还可以将项目或源代码直接导出到应用程序中,并立即运行。它适用于Windows 10和11,同时支持x64和ARM64架构。
v jTs[eq> TO(2n8'fdO 目前,访问它的唯一方法是在Visual Studio中构建项目,然后运行它。此外,还需要至少20GB的空间和多核CPU。它还建议配备8GB VRAM的GPU。
Fi7G S; 4$5d*7 该应用有两种模式:样本和模型,程序将它们分为文本、图像、代码、音频和视频以及智能控件。
/mi9q SxX2+|0g`g 测试模型
0Q>yv;M <yoCW?# 图像生成和视频生成的模型相当大,接近5GB。我们从一个与升频有关的小模型开始,它不到100 MB。我们截取了一张屏幕截图,并尝试使用CPU对其进行缩放,工作时可以在CPU和GPU之间切换处理请求。
fbl8:c)I 4qd =]i 在这个配置较低的虚拟机中,缩放过程不到30秒,内存消耗瞬间攀升至1GB。应用程序展示的是分辨率为9272*4900的升频版图像。图像元素,尤其是文字受到严重影响,难以辨认。
T(GEFntY b]-~{' + 没有在更大窗口或全屏预览生成图像的选项。甚至连将其保存到磁盘的下载选项也没有
}NH\Q$ IU I.4o9Z[? 我们尝试了另一种名为Detect Human Pose的模型。它可以识别图像中某人的位置。虽然它能准确识别一个基本行走的人,但它甚至开始为我们打开了几个应用程序的桌面截图显示位置标记。
5B|&+7dCw (0wQ [( 我们不知道这些模型如何集成到应用程序中,但其中一些功能可以在本地运行。当然,这些机型的PC需要更大的存储空间,以及配备16GB或更大内存的强大CPU。
B%]yLJ #5Q?Q~E@ 是否值得下载一个5GB的模型来将文本提示转换成图片,或者等待30秒来在网络应用程序上实现这一功能?显然,这些功能大多有非常小众的用例和实施环境,而不是吸引整个Windows 11用户群。
%OV)O -