近半年来RTX 40系列的中高端显卡陆续发布,但对于更广泛的玩家来说,他们可能更关心甜点级60的表现——级别的显卡。 毕竟,根据Steam游戏平台的统计,当前硬件排行榜前五名的显卡中有四张是60级,近80%的玩家都在1080P或更低分辨率下运行游戏。 刚刚发布的RTX 4060 Ti显卡的起售价正好定在3199元,与上一代同定位产品大致相似。 那么本期我们就来实际测试一下它的表现。
01/ Ada架构和RTX 4060 Ti 8GB
艾达建筑
作为RTX 40系列显卡核心采用的新一代架构,Ada架构Ada架构核心搭载了全新的第三代RT Core(光线追踪核心)、第四代Core(张量核心)和SM(流媒体核心)。多处理器))。 而其SM(流式多处理器)可以带来高达两倍的性能提升,结合台积电全新4N工艺加持,可以带来高达两倍的能效提升。
Ada架构核心SM结构图
在光线追踪性能的提升上,Ada架构核心在RT Core上引入了两个新的硬件单元——Micro-Map引擎和Micro-Mesh引擎,可以提高光线追踪的计算效率,使能全景光线追踪。 ,产生更真实的阴影和纹理细节,
第三代RT Core的结构示意图,与上一代相比,增加了两个功能
搭载Ada架构核心的第四代酷睿,引入来自专业级H100数据中心GPU的FP8引擎,通过专业级产品配置的引入,带来更强大的AI算力。 算力的提升不仅对DLSS 3技术起到作用,也使其能够在AIGC内容制作中拥有更好的表现。
Ada架构核心的升级还带来了(SER/ )技术,可以更好地调度和排序着色器的工作。 在夜间访问该功能接口的应用中,可以根据使用时的不同负载进行渲染,对负载相对均匀的图像进行集中处理,提高效率,减少图像渲染的工作资源开销。
SER 着色器执行重新排序
针对有影视需求的用户,Ada架构核心还搭载全新第八代NVENC硬件编解码器。 这款全新的第八代NVENC硬件编解码器支持传统的H.265等格式,并集成了对AV1视频编码格式的支持,有效提高了视频内容创作中的生产力表现。
Ada架构的核心在现阶段内存带宽有限的情况下,大幅增加了Die上的L2缓存容量,从而有效提高数据命中率,减少对VRAM的频繁数据访问次数,提供支持光线追踪等相关性能场景。 绩效带来更高的回报。
DLSS 3
Ada架构核心的多方位升级,也让RTX 40系列显卡获得了DLSS 3技术的加成。 据官方介绍,DLSS 3技术是由DLSS 2(DLSS超分辨率技术)+DLSS帧生成技术+这三个方面组成。
DLSS 3帧生成技术依赖于Ada架构核心的独立光流处理器和Core的AI计算能力。 该技术运行过程中,光流处理器获得的一系列数据都会经过光流技术加速。 (Flow,简称OFA)以及Core提供的AI算力来计算屏幕的内容并优化屏幕,从而实现帧数的提升。
DLSS 3帧生成技术可以直接生成游戏第一帧和整个游戏第二帧的3/4像素,相当于用1/8的算力完成整个计算过程。 通过这个过程的循环,可以在提高帧率的同时节省资源开销,进一步带来更好的游戏体验。
DLSS 3帧生成技术可以大幅提升游戏的帧数性能,但由于可能会造成延迟的增加,所以DLSS 3中帧生成技术的开启需要集成该技术来降低渲染和运算的延迟,从而带来更高数量、更好流畅度的帧体验。 据官方说法,DLSS 3帧生成技术的结合可以让游戏体验拥有媲美甚至超越原生水平的渲染和操作体验。
RTX 4060 钛 8GB
RTX 4060 Ti采用新一代Ada架构核心AD106。 一个完整的AD106核心有完整的3组GPC,每组包含6个TPC,总共18组TPC,每组有2个SM单元,总共36组。 4608 个 CUDA 单元,带有 1 个 NVENC 和 2 个 NVDEC。
完整的AD 106核心架构切片图
不过,与完整的 AD106 核心相比,RTX 4060 Ti 少了 2 个 SM 单元、4352 个 CUDA 单元、少了 1 个 NVDEC。 与 RTX 4070 一样,它也有 1 个 NVENC 和 1 个 NVDEC。
RTX 4060 Ti 8GB核心架构切片图
显存带宽方面,我们可以注意到RTX 4060 Ti 8GB配备了128 Bit显存控制器,结合18 Gbps的显存速率和8GB的GDDR6显存容量,总显存带宽为288 GB/s。
从这个显存带宽数据来看,相比上一代RTX 3060 Ti的448GB/s显存带宽有着较大的下降。 不过官方的解释是,由于RTX 4060 Ti在Die上配备了32MB大容量L2,因此相比RTX 3060 Ti配备的4MB L2,容量提升了8倍。 大容量L2的配置大大提高了数据命中率,核心无需频繁访问VRAM,从而有效降低了对显存带宽的依赖。
官方表示,RTX 4060 Ti通过配备32MB的大容量L2,实现了554 GB/s的等效显存带宽,并且可以通过配置32MB大容量L2。 光追高帧率游戏体验。
小容量L2缓存需要频繁调度VRAM
大容量L2缓存可减少调度VRAM数量
我们这次测试的影驰RTX 4060 Ti 8GB星耀OC的Boost频率提升至2535 MHz,高于公版RTX 4060 Ti的2535 MHz,能够带来一定的性能提升。
02/外观拆解
外观方面,40系影驰星耀显卡主打纯白色美学,采用ARGB炫光设计。 外壳采用钻石切割设计,下部是纯白色的一体式金属装甲。 影驰RTX 4060 Ti 8GB星耀OC显卡含边框尺寸为327*147*48mm,比同系列的RTX 4070要小一些。
显卡采用新一代星卓III散热系统,配备3个直径92mm、厚度20mm的专用高规格风扇,每个风扇有11片透明静霜叶片,可实现更强的风力和更大的风量,并支持智能启停。
纯白色金属背板近一半采用镂空设计,让气流可以直接穿透显卡,大大提高了散热效率。
显卡供电接口采用传统的单8针设计。 除了安装更方便之外,对于纯白色主题安装,旧电源的白色模块线可以相互连接,无需转接至新接口,也让机箱更加整洁。
显卡侧面板提供3个DP1.4a和1个HDMI 2.1接口,整卡厚度约占2.5个插槽。
显卡附带星耀专属ARGB灯光支架,可与显卡灯光同步。
灯光效果也是星耀系列的设计亮点之一。 显卡顶部的信仰LOGO灯营造出千层镜面光效。 搭配三片透明ARGB扇叶,酷炫又具有未来科技感,电竞气息十足。
星耀系列的透明顶盖一直设计为易于拆卸,可支持个性化DIY涂装定制,且不影响售后保修,玩家可以更自由地打造属于自己的专属外观。
进一步拆解散热模块,我们还可以看到,星卓III散热系统包括三根6mm镀镍复合热管、大面积高效均热板和翅片,结合回流焊工艺,带来更强的热量耗散性能。
PCB部分,影驰RTX 4060 Ti 8GB星耀OC采用8+1相增强供电设计,规格高于公版的5+1相。
中间的自然是AD106-350-A1核心,周围环绕着四颗三星GDDR6显存,每颗显存容量为2GB,位宽为32bit,总共8GB,位宽。
03/ 基准测试
为了更好地模拟日常用户的配置,笔者将基于影驰 RTX 4060 Ti 8GB 星耀 OC 和英特尔第 13 代酷睿 i5-搭建了相应的测试平台,具体配置见下图。
通过GPU-Z查看相关信息,我们可以看到影驰RTX 4060 Ti 8GB星耀OC的相关信息,其Boost频率为,TGP为160W,MAX功耗可以手动解锁到200W以获得更高的手动超频空间。
在3D Mark的理论测试中,影驰RTX 4060 Ti 8GB星耀OC相比上一代甜品级产品RTX 3060 Ti,理论性能提升约13%。 得益于RTX 4060 Ti显卡在光追核心性能方面的提升,我们也可以看到影驰RTX 4060 Ti 8GB星耀OC在代表光追的Port Royal项目中有着15%的分数差距测试。
04/ 游戏性能测试
在测试的四款3A游戏中,影驰RTX 4060 Ti 8GB星耀OC在《战争机器5》游戏中与上一代RTX 3060 Ti基本一致,在其他游戏中可以有10个。 约%的性能领先,可实现流畅的屏幕操作。
当然,对于RTX 40系列显卡来说,更显着的优势会在支持DLSS 3帧生成的游戏中体现出来。 GALAX RTX 4060 Ti 8GB星耀OC可以依靠核心内置的光流加速器和更强的AI计算能力来计算游戏画面,提高游戏帧率表现。
随着与越来越多的游戏开发商合作,后续游戏中将会有越来越多的产品支持DLSS 3。 目前包括《F1 22》、《赛博朋克2077》、《巫师三重版》等一系列游戏都加入了DLSS 3的支持,以及即将推出的《指环王:咕噜》、《魔戒》 《指环王》IP游戏还将加入DLSS 3。
通过下面三款追光游戏的对比,我们也可以看到,影驰RTX 4060 Ti 8GB星耀OC在启用DLSS 3后,与只能启用DLSS 2的RTX 3060 Ti相比,帧率可以高于RTX 3060 Ti。 扩大到40%以上,甚至一些光追游戏在2K分辨率下也能得到平均60帧以上的帧数。
有的朋友可能会疑惑DLSS 3是否会对游戏画面和游戏延迟产生降级效果,因此笔者也对其进行了实际测试。
在同一个游戏画面中,通过 OSB 截取 DLSS 3 启用和禁用 DLSS 的画面,可以看到 DLSS 3 模式(下图左半部分)的画质甚至比原生分辨率(右半部分)还要好。下图的一半)。 实现清晰的图像性能。 因此,玩家基本不需要担心开启DLSS 3后游戏画面劣化的问题。
游戏延迟方面,我们可以看到,在影驰 RTX 4060 Ti 8GB 星耀 OC 上启用 DLSS 3 后,游戏不仅在帧率方面有所提升,而且因为干预,平均帧率有所提升。 ,带来更低的游戏延迟。
笔者还记录了RTX 3060 Ti和影驰RTX 4060 Ti 8GB星耀OC在游戏过程中的平均功耗。 可以看到,在同样“甜点”级别显卡的情况下,RTX 4060 Ti在游戏过程中所需的功耗相比上一代产品大幅降低。 结合我们上面测得的帧数来看,能耗有了很大的改善。
05/ 生产力测试
首先,在视频创作方面,将同样的10分钟1080P素材导出为H.265格式时,影驰RTX 4060 Ti 8GB星耀OC已经比RTX 3060 Ti快很多。 在将视频转码为AV1格式时,由于RTX 3060 Ti不支持AV1格式的编解码,只能依靠CPU进行软件编解码,效率大大降低。 与影驰RTX 4060 Ti 8GB星耀OC相比,效率提升了近10倍。
渲染能力方面,笔者使用V-Ray5,对RTX 3060 Ti和影驰RTX 4060 Ti 8GB星耀OC进行了对比。 从两个项目的测试可以看出,影驰RTX 4060 Ti 8GB星耀OC的表现相当明显,比RTX 3060 Ti有更好的性能表现。
在集成的众多工业软件基准测试中,RTX 4060 Ti也较RTX 3060 Ti形成了全方位的提升,更适合有相关需求的用户购买。
最近,基于AIGC的生成式AI应用也非常流行。 笔者在同代条件下进行了绘图测试。 相同条件下,影驰 RTX 4060 Ti 8GB 星耀 OC 生成 20 张图片需要 194 秒,而 RTX 3060 Ti 需要 222 秒。 综合换算后,影驰RTX 4060 Ti 8GB星耀OC每分钟可生成6.185张图片,RTX每分钟可生成5.405张图片。 RTX 4060 Ti 整体算力提升 14%。
此外,英伟达最近还推出了一项重大更新——RTX Video Super,翻译过来就是视频超分辨率技术,简称VSR。 它可以让用户在播放视频时使用配备GPU和强大AI计算能力的Core来计算内容,从而提高屏幕分辨率,带来最高4K分辨率的视频输出,提高用户的视频观感。
这里我们也通过 ICAT抓取同一帧并进行图片对比,让大家感受一下VSR带来的画面效果的提升。 可以看到,开启VSR增强后,画面的细节得到了明显的提升,画面的噪点也得到了明显的降低。
左480P原生图像,右480P RTX VSR 4X图像
左480P原生图像,右480P RTX VSR 4X图像
在本地VLC播放上,笔者选择了720P的《少女与战车》来播放。 通过播放内容的对比我们可以看到,在VLC播放时开启VSR功能后,画面的噪点得到了明显的抑制,而且画面的线条整体更加锐利清晰,为画面增色不少。外观和感觉。
左720P原生图像,右720P RTX VSR 4X图像
左720P原生图像,右720P VSR 4X图像
从图片对比可以看出,VSR功能带来了更好的画面观感,对于用户体验来说是一个明显的加分。 而有的朋友会好奇,VSR开启后,GPU会进行相关的内容计算。 这部分计算会带来更高的功耗吗? 因此我们也针对这个问题进行了功耗测试。
在4K分辨率屏幕下,在网页上播放1080P《某科学的超电磁炮》时,RTX 4060 Ti 8GB在不同VSR档位设置下的功耗范围如下:
在4K分辨率屏幕上通过本地VLC播放器播放720P《少女与战车》时,RTX 4060 Ti 8GB在不同VSR档位设置下的功耗范围如下:
功耗方面,RTX 4060 Ti 8GB开启VSR功能后,其功耗并没有增加太多,但能够带来更好的画面观感,因此建议用户开启该功能。
06/ 散热测试
在室温24±1℃、使用开放式测试台的情况下,笔者对影驰RTX 4060 Ti 8GB星耀OC进行了散热测试。
使用烤箱30分钟后,影驰RTX 4060 Ti 8GB星耀OC温度稳定在58℃左右,显卡风扇转速1553转,功耗160W左右。 温度低且安静。
07/总结
随着光线追踪游戏对配置的要求越来越高,影驰Ge 4060 Ti星耀OC作为新一代甜品显卡,通过DLSS 3技术为1080P游戏玩家带来超过100帧的全高光线追踪画质。 高帧流畅体验,即使在一些2K光追游戏中也有战斗力。 与RTX 3060 Ti相比,提升还是非常明显的。 同时,AV1编码功能的加入也为游戏主播和创作者带来了更高效的选择。 此外,其超低功耗以及传统的8针供电接口也为旧手机升级的用户带来不少便利。
好了,今天的主题就讲到这里吧,不管如何,能帮到你我就很开心了,如果您觉得这篇文章写得不错,欢迎点赞和分享给身边的朋友。