这款AI应用出现后,在极短的时间内迅速走红,成为众多玩家传承的“最美小姐姐”生成工具。 不过这款AI计算绘图工具在正式推出之初,无论是WEB UI的部署还是模型的训练和生成,基本都是基于CUDA加速的算法,因此A卡被起初并未得到官方支持。 但幸运的是,它是一个开源产品。 在众多社区玩家的支持下,也有不少分支支持A卡GPU加速计算。 加速。
如果要部署在本地,相对于方便的基于CUDA的WEB UI部署来说相对复杂一些。 不过网上已经有比较成熟的集成包可供玩家使用。 玩家只需下载对应的集成包即可开始一键本地傻瓜式安装部署,可以为您节省大量时间。
▲我们测试选择的集成包安装完成后,会自动进入AMD GPU加速计算模式,并在本地打开:7860即可打开本地AI绘图界面。
▲在本地WEB UI界面上,可以自由设置相关AI艺术图生成参数,点击“生成”即可开始绘制。 具体可以参考网上相关教程,这里不再赘述。
那么,部署分支是否可以基于对AMD显卡硬件计算加速的支持呢? 效率如何? 以前的A卡播放器往往只能运行在Linux系统下,通过ROCM(Open)模拟CUDA加速。 现在,A卡的AI加速计算可以在系统下直接实现。 我们能达到我们的预期目标吗? 为此,我们选择了AMD RX 5000系列、RX 6000系列和RX 7000系列的几款显卡,进行了详细体验。
体验平台
显卡:AMD RX (8GB)、RX 5700(8GB)、RX 4GB、RX 6600(8GB)、RX (12GB)、RX (12GB)、RX 6800(16GB)、RX (16GB)、RX 7900 XT(20GB) , RX 7900 XTX (24GB)
CPU:英特尔酷睿 i9-
主板:英特尔Z790
内存:DDR5 6000 16GB×2
固态硬盘:AORUS NVMe PCIe SSD 2TB
操作系统:11 Pro 22H2
驱动程序:AMD 23.4.3
通过测试,我们想知道:
AMD 5000系列、6000系列、7000系列的AI绘图算力差距有多大?
与传统CPU AI计算加速相比,AMD GPU的加速性能如何?
▲我们采用的网络开源共享部署方案可以正确实现AMD显卡的硬件加速计算,可以看到图像生成过程中GPU占用率一直保持在100%。
该模型为Novel AI Final-run(CKPT)
测试一:AI生成时尚美妆
第一部分测试中,我们通过关键词生成了一位大眼时尚美女,也具有一定的拍照感。 关键字设置如下(部分引用自网络开源共享关键字):
lora:15:0.6> 、最好、超高分辨率、(:1.4)、、白衬衫、黑裙子、黑色、可爱、(Kpop 偶像)、(撒娇:1)、(头发:1)、((蓬松)眼睛)),在,全身,正面,,
分辨率设置:512×512
采样步数:20
提示词引导系数:7
生成批次-每批次数量:1-1、4-1
测试中,由于大部分显卡显存都在8GB以上,所以我们在运行参数中基本都设置了普通高显存默认模式,只有4GB显存版本的RX以低显存模式运行添加–(否则它不会工作)。 从整体测试结果来看,AMD从RX 5000系列到RX 7000系列的显卡几乎都达到了应用的AI计算加速性能,尤其是RX 7000系列显卡的性能相比RX 6000系列有了很大的提升显卡。 例如,RX在此设置和模型算法下的图片生成速率约为每秒8.87张图片,而RX 7900 XT则可以达到每秒15.76张图片,性能提升接近100%。
与CPU相比,所有AMD显卡都有着非常明显的优势。 RX 7900 XT的性能达到了Core i9的约30倍。 -5次。
唯一的例外是 RX。 按照核心规格来看,应该比RX更强。 但由于内存配置仅为4GB,测试中开启低内存运行模式后,图像生成速度受到较大影响。 影响远低于GPU加速的正常性能,只能达到比CPU计算略高的水平。
测试二:AI生成更复杂的水边别墅风景照片
在接下来的测试中,我们使用了一系列相对复杂的关键字来生成一座位于水边的别墅,并伴有阳光、波纹、倒影等效果。 关键词如下:
' 一座靠近水边的都铎风格的房子, 。 , , 高 , 超 , , 景深, 超, 颜色编码, 8k,'
分辨率设置:512×512
样本步数:50
提示词引导系数:7.5
生成批次 – 每批次数量:1-1、2-1、4-1
这部分的测试结果与之前的测试基本一致。 RX 7000系列显卡的性能依然是最好的。 与RX 6000系列显卡相比,走线提升约100%。 与CPU的计算性能相比,GPU加速计算的性能提升还是非常显着的。 RX 7900 XT的性能达到100%。 大约是Core i9-的30倍,入门级显卡RX的性能几乎是Core i9-的5倍。
4GB显存配置的RX只能运行在低显存模式下,因此图像生成速度还是受到很大影响,远低于GPU加速的正常表现,大致相当于Core i9-。
写在最后
这是一个简单但有趣的测试。 通过这次经历,我们认为可以总结出几点可供玩家参考:
1、目前AMD显卡可以通过开源的部署方案实现系统下的AI计算加速,网上也有很多傻瓜式的集成包。 有兴趣的玩家可以尝试一下;
2、从测试结果来看,AMD显卡在AI图像生成的计算中的性能提升远远好于CPU计算,并且使用GPU加速计算可以带来事半功倍的效果;
3、从测试情况来看,当渲染分辨率设置超过512(如768×768)时,会出现显存爆裂的情况。 这与部署方案和型号有关,但也反映出在正常模式下下运行时,8GB显存几乎是硬性入门要求。 如果显存低于8GB,即使以512×512分辨率渲染也会出现显存不足的情况。 这时候就得用–低显存的运算方案了,但是会大大减慢计算速度,比如在测试中。 接收 4GB。 所以如果想要流畅播放,我们建议显卡显存为8GB以上;
4、从整体结果来看,我们认为AMD GPU还有很大的算法优化空间。 从不可靠的经验来看,RX 7900 XTX 与 Core i9 的性能差距还不够大。 这和我们部署的算法方案和模型有关系,我们希望各个社区的程序员能够为AMD显卡开发出更多更好的计算加速方案。
无论如何,AMD显卡的硬件加速计算性能已经展现出来,而且效果也比较明显。 这对于AMD显卡用户来说无疑是个好消息。 剩下的就是玩家和AMD需要坚持的持续优化了。 向上。
好了,今天的主题就讲到这里吧,不管如何,能帮到你我就很开心了,如果您觉得这篇文章写得不错,欢迎点赞和分享给身边的朋友。