这款AI应用出现后,在极短的时间内迅速走红,成为众多玩家传承的“最美小姐姐”生成工具。 不过这款AI计算绘图工具在正式推出之初,无论是WEB UI的部署还是模型的训练和生成,基本都是基于CUDA加速的算法,因此A卡被起初并未得到官方支持。 但幸运的是,它是一个开源产品。 在众多社区玩家的支持下,也有不少分支支持A卡GPU加速计算。 加速。

amd四核cpu很烂吗_amd四核优化补丁_amd 四核cpu优化

如果要部署在本地,相对于方便的基于CUDA的WEB UI部署来说相对复杂一些。 不过网上已经有比较成熟的集成包可供玩家使用。 玩家只需下载对应的集成包即可开始一键本地傻瓜式安装部署,可以为您节省大量时间。

amd四核cpu很烂吗_amd四核优化补丁_amd 四核cpu优化

amd 四核cpu优化_amd四核cpu很烂吗_amd四核优化补丁

▲我们测试选择的集成包安装完成后,会自动进入AMD GPU加速计算模式,并在本地打开:7860即可打开本地AI绘图界面。

amd 四核cpu优化_amd四核优化补丁_amd四核cpu很烂吗

▲在本地WEB UI界面上,可以自由设置相关AI艺术图生成参数,点击“生成”即可开始绘制。 具体可以参考网上相关教程,这里不再赘述。

那么,部署分支是否可以基于对AMD显卡硬件计算加速的支持呢? 效率如何? 以前的A卡播放器往往只能运行在Linux系统下,通过ROCM(Open)模拟CUDA加速。 现在,A卡的AI加速计算可以在系统下直接实现。 我们能达到我们的预期目标吗? 为此,我们选择了AMD RX 5000系列、RX 6000系列和RX 7000系列的几款显卡,进行了详细体验。

体验平台

显卡:AMD RX (8GB)、RX 5700(8GB)、RX 4GB、RX 6600(8GB)、RX (12GB)、RX (12GB)、RX 6800(16GB)、RX (16GB)、RX 7900 XT(20GB) , RX 7900 XTX (24GB)

CPU:英特尔酷睿 i9-

主板:英特尔Z790

内存:DDR5 6000 16GB×2

固态硬盘:AORUS NVMe PCIe SSD 2TB

操作系统:11 Pro 22H2

驱动程序:AMD 23.4.3

通过测试,我们想知道:

AMD 5000系列、6000系列、7000系列的AI绘图算力差距有多大?

与传统CPU AI计算加速相比,AMD GPU的加速性能如何?

amd四核优化补丁_amd 四核cpu优化_amd四核cpu很烂吗

▲我们采用的网络开源共享部署方案可以正确实现AMD显卡的硬件加速计算,可以看到图像生成过程中GPU占用率一直保持在100%。

该模型为Novel AI Final-run(CKPT)

测试一:AI生成时尚美妆

第一部分测试中,我们通过关键词生成了一位大眼时尚美女,也具有一定的拍照感。 关键字设置如下(部分引用自网络开源共享关键字):

lora:15:0.6> 、最好、超高分辨率、(:1.4)、、白衬衫、黑裙子、黑色、可爱、(Kpop 偶像)、(撒娇:1)、(头发:1)、((蓬松)眼睛)),在,全身,正面,,

分辨率设置:512×512

采样步数:20

提示词引导系数:7

生成批次-每批次数量:1-1、4-1

amd四核优化补丁_amd 四核cpu优化_amd四核cpu很烂吗

amd四核优化补丁_amd 四核cpu优化_amd四核cpu很烂吗

amd 四核cpu优化_amd四核cpu很烂吗_amd四核优化补丁

测试中,由于大部分显卡显存都在8GB以上,所以我们在运行参数中基本都设置了普通高显存默认模式,只有4GB显存版本的RX以低显存模式运行添加–(否则它不会工作)。 从整体测试结果来看,AMD从RX 5000系列到RX 7000系列的显卡几乎都达到了应用的AI计算加速性能,尤其是RX 7000系列显卡的性能相比RX 6000系列有了很大的提升显卡。 例如,RX在此设置和模型算法下的图片生成速率约为每秒8.87张图片,而RX 7900 XT则可以达到每秒15.76张图片,性能提升接近100%。

与CPU相比,所有AMD显卡都有着非常明显的优势。 RX 7900 XT的性能达到了Core i9的约30倍。 -5次。

唯一的例外是 RX。 按照核心规格来看,应该比RX更强。 但由于内存配置仅为4G​​B,测试中开启低内存运行模式后,图像生成速度受到较大影响。 影响远低于GPU加速的正常性能,只能达到比CPU计算略高的水平。

测试二:AI生成更复杂的水边别墅风景照片

在接下来的测试中,我们使用了一系列相对复杂的关键字来生成一座位于水边的别墅,并伴有阳光、波纹、倒影等效果。 关键词如下:

' 一座靠近水边的都铎风格的房子, 。 , , 高 , 超 , , 景深, 超, 颜色编码, 8k,'

分辨率设置:512×512

样本步数:50

提示词引导系数:7.5

生成批次 – 每批次数量:1-1、2-1、4-1

amd 四核cpu优化_amd四核cpu很烂吗_amd四核优化补丁

amd 四核cpu优化_amd四核优化补丁_amd四核cpu很烂吗

amd四核优化补丁_amd 四核cpu优化_amd四核cpu很烂吗

这部分的测试结果与之前的测试基本一致。 RX 7000系列显卡的性能依然是最好的。 与RX 6000系列显卡相比,走线提升约100%。 与CPU的计算性能相比,GPU加速计算的性能提升还是非常显着的。 RX 7900 XT的性能达到100%。 大约是Core i9-的30倍,入门级显卡RX的性能几乎是Core i9-的5倍。

4GB显存配置的RX只能运行在低显存模式下,因此图像生成速度还是受到很大影响,远低于GPU加速的正常表现,大致相当于Core i9-。

写在最后

这是一个简单但有趣的测试。 通过这次经历,我们认为可以总结出几点可供玩家参考:

1、目前AMD显卡可以通过开源的部署方案实现系统下的AI计算加速,网上也有很多傻瓜式的集成包。 有兴趣的玩家可以尝试一下;

2、从测试结果来看,AMD显卡在AI图像生成的计算中的性能提升远远好于CPU计算,并且使用GPU加速计算可以带来事半功倍的效果;

3、从测试情况来看,当渲染分辨率设置超过512(如768×768)时,会出现显存爆裂的情况。 这与部署方案和型号有关,但也反映出在正常模式下下运行时,8GB显存几乎是硬性入门要求。 如果显存低于8GB,即使以512×512分辨率渲染也会出现显存不足的情况。 这时候就得用–低显存的运算方案了,但是会大大减慢计算速度,比如在测试中。 接收 4GB。 所以如果想要流畅播放,我们建议显卡显存为8GB以上;

4、从整体结果来看,我们认为AMD GPU还有很大的算法优化空间。 从不可靠的经验来看,RX 7900 XTX 与 Core i9 的性能差距还不够大。 这和我们部署的算法方案和模型有关系,我们希望各个社区的程序员能够为AMD显卡开发出更多更好的计算加速方案。

无论如何,AMD显卡的硬件加速计算性能已经展现出来,而且效果也比较明显。 这对于AMD显卡用户来说无疑是个好消息。 剩下的就是玩家和AMD需要坚持的持续优化了。 向上。

好了,今天的主题就讲到这里吧,不管如何,能帮到你我就很开心了,如果您觉得这篇文章写得不错,欢迎点赞和分享给身边的朋友。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注