一、前言:套用RTX 3070设计的RTX 3060魔龙
在超龙出现之前,魔龙就是微星的顶级型号。虽然目前魔龙的定位略有下降,但是用在RTX 3060这样的低功耗核心上,用牛刀杀鸡来形容也不为过!
微星RTX 3060 GAMING X TRIO 12G魔龙(下面简称RTX 3060魔龙)在设计上既简单又暴力,它直接采用了RTX 3070魔龙的PCB板与散热系统。要知道RTX 3070魔龙的TDP高达240W,而RTX 3060魔龙仅170W。
RTX 3060魔龙所采用的TRI FROZR2散热系统包括3个100mm的刀锋6代风扇(支持智能启停),6条6mm热管看上去也十分夸张,大部分非公RTX 3060都是3~4条热管。如果强大的散热系统用在170W TDP的GPU上,运行起来会带来非常不错的温度表现。
以上为GPU-Z的截图。RTX 3060魔龙拥有3584个流处理器,48个ROP单元和112个纹理单元,显存容量12GB,显存频率15GHz,带宽360GB/s,以上这些与公版都毫无二致。
不过,RTX 3060 魔龙频率达到了1852MHz,比公版的1777MHz高出了75MHz。凭借更好的散热表现,其性能表现应该会比公版好一些。
关于安培GPU的构架此前我们已经有过详细的介绍,在这里我们化繁为简,将其做了简单的归纳如下:
1、整合INT32与FP32单元
图灵的INT32单元只能做整数运算,闲置率很高。为了解决这个问题,提升INT32单元的利用率,NVIDIA改进了INT32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算,相当于整合了INT32和FP32单元,因而使得以FP32单元计数的GPU流处理器数量直接翻倍,单精度浮点性能也同样翻倍。
2、RTX IO技术
这项技术可以让游戏在加载时完全规避CPU,直接将游戏数据包从SSD写入到GPU的显存中,由GPU替代CPU进行数据解包。GPU的整数/浮点性能数十倍于CPU,可以瞬间完成数据的解包工作。
不过这项技术需要微软DirectStorage API的支持,预计2022年会正式开始应用。
3、NVIDIA DLSS:备受欢迎的AI技术
从游戏内的物理和动画模拟到实时渲染和AI增强的直播功能,AI正在引发一场游戏革命。借助GeForce RTX GPU的专用AI处理器Tensor Cores,NVIDIA DLSS在提升帧率的同时,生成精美、清晰的游戏图像,为玩家提供更大的性能空间,以最大限度地提高光线追踪设置并提高输出分辨率。现在已有超25款游戏支持DLSS,并且数量还在逐月递增。
4、NVIDIA Reflex:降低输入延迟
NVIDIA Reflex技术可以降低系统延迟(或称输入延迟),使游戏的响应速度更快,使玩家在多人竞技游戏中占据优势。
在传统的PC体系中,虽然强力的显卡可以轻松渲染出足够高的帧率,但这些游戏画面都需要CPU进行调度分配,不合理的调度会使得CPU手忙脚乱,玩家鼠标发出的指令其实无法第一时间到达游戏世界,这个过程我们称之为延迟。
为了降低系统延迟,帮助GPU渲染的图像能够第一时间迅速呈现在屏幕,NVIDIA Reflex技术也随着RTX 30系列的发布而登场。NVIDIA Re flex SDK被直接植入到了游戏,
NVIDIA Reflex SDK能够更好的控制CPU的运行速度,允许及时向GPU提交例如点击鼠标的关键动作,同时还确保GPU没有间断运行,保证画面的流畅输出。
而最新发布的360Hz刷新率的电竞G-Sync显示器还内建了延迟分析器,可以让你更系统化的量化电竞游戏中的延迟数据。 NVIDIA Reflex技术是职业电竞选手和精英玩家唯一专业的选择。
5、第二代RT Core
光线追踪是一种在计算机世界中完美再现真实世界的渲染技术,它的算法符合物理规律,不会像传统光栅化渲染那样容易产生各种问题。比如一个典型的例子就是光栅化算法无法正确处理焦散这种光学现象,炎热的夏天阳光透过游泳池在水底投射得斑纹光影就是典型焦散,传统光栅化算法使用的是动态贴图,看起来虽然也像那么回事,但是无法和玩家互动,例如当角色进入泳池游泳就无法进行正确处理渲染,画面往往出现不合理渲染效果,或者游戏中的阳光位置变化,天气变化对泳池光影的影响也无法正确表现。而光线追踪技术可以实时自动的演算焦散效果,让画面更加真实。
但是光线追踪最大的问题是需要消耗巨大的计算资源,显示器就像一块窗子,虚拟的每一条光线都会穿过屏幕像素直达场景,并从存储器中查找会被击中的三角形,而且每条射线都要做这个动作,如果希望效果好的话,每像素可能还需要若干条甚至上万条射线。
如果场景里有几千万个三角形,逐个三角形做遍历求交,就需要消耗大量的高速缓存和总线带宽,计算单元需要浪费大量时间等待三角形数据传输。
RTX 30系列显卡基于新一代NVIDIA Ampere架构,拥有第二代光线追踪计算核心,相比于第一代光线追踪计算核心,RTX 30系列的光线追踪核心性能足足提高了1.7倍。而且硬件上特别支持对运动模糊场景的光追效果计算。从而带给玩家更流畅的光线追踪游戏视觉体验。
特别是体验《赛博朋克2077 》这样支持光线追踪技术的新一代游戏,RTX 30系列能够轻松驾驭赛博朋克的颓废风格,流畅渲染都市夜晚霓虹灯下,大量的赛车,追逐,打斗等运动场景。为玩家带来最极致的视觉体验。
6、第三代Tensor Core
NVIDIA 自 Volta架构开始,在GPU中增加了针对深度学习加速设计的矩阵运算单元,并称之为 Tensor Core(张量计算核心)。
在图灵架构里,NVIDIA 引入了第二代 Tensor Core,而到了RTX 30系列所采用的Ampere架构,则进化到了第三代Tensor Core。
深度学习技术在图形图像各个领域都有着价值巨大的应用,而在游戏体验中则是被称为深度学习超采样的DLSS 技术。最新一代的DLSS 能够使得游戏画质极大提升,细节和锐度媲美、甚至超越原生分辨率
DLSS 本质是一种图像重建算法,其加原理其实也很简单。开启DLSS后,游戏引擎中的诸如动态光源、阴影的计算,封闭空间环境遮挡(SSAO)、屏幕空间反射(SSR),甚至实时光线追踪。都会被降低到1/2甚至1/4像素的低分辨率下运行,GPU的负担大幅度减轻。渲染得出的最终场景会通过Tensor Core结合DLSS进行高分辨率重建,从而用较低的GPU负载获得流畅且画质极佳的游戏体验效果。
和图灵相比,安培的张量性能可以最高达到 2.7 倍。这使得RTX 30系列可以轻松使用DLSS技术在4K 甚至8K分辨率下,依然带给玩家最极致的光线追踪游戏体验效果。
7、GeForce Experience功能
所有NVIDIA GeForce GPU都能从GeForce Experience中获益,数以千万计的玩家都在使用该工具来优化游戏设置、记录和上传游戏、直播游戏、拍摄屏幕截图,天辰平台官网以及下载和安装Game Ready驱动。最新功能包括:
8、一键自动式GPU调校
GeForce Experience现已支持GPU调校,它能使用高级扫描算法自动创建GPU超频配置文件。
9、增强型游戏内监控悬浮窗
GeForce Experience强大的游戏内悬浮窗功能现已能让玩家查看更多详细的性能统计信息、温度和延迟指标,包括 NVIDIA Reflex的延迟分析器统计信息。
二、图赏:3个100mm刀锋6代风扇 + 6条热管直触
依然采用一直以来的铁灰+黑色配色,3个100mm风扇并且多达14片扇叶,看上去非常霸气。另外这3个风扇都支持智能启停,天辰登录核心温度低于60度时就会自动停转。
全尺寸石墨烯复合背板,作用当然就是加固PCB板并辅助散热。
底部视角图,可以看出这卡是2.5槽厚度。
顶部视角图,显卡采用的是双8pin供电接口。
3个DP 1.4与一个HDMI 2.1接口。
的散热系统比较夸张,三段式散热片,6条6mm热管直触GPU核心,可以迅速带走热量。
显存以及供电电路部分都覆盖有导热垫。
直接沿用了RTX 3070/3060 TiPCB板,只是在供电方面做了一些缩减,天辰测速7相核心供电每相配备一个75A的DrMOS,足以满足GA106核心170W的功率需求。
GA106核心,芯片面积是276mm2,比上一代的TU106的445mm2小不少。
GPU核心周围是三星GDDR6显存,一共有6颗,单颗容量2GB,总容量12GB。频率15GHz,位宽192Bit,显存带宽360GB/s。
三、理论性能测试:最高温度61度 最高转速仅1148RPM
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme测试中,RTX 3060魔龙图形分数达到了10100分,核心温度最高61℃,核心运行最高频率为1957MHz,最高风扇转速1148RPM,最高功耗173W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 3060魔龙图形分数达到了4999分,核心温度最高61℃,核心运行最高频率为1957MHz,最高风扇转速1287RPM,最高功耗173W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 3060魔龙图形分数达到了8585分,核心温度最高63℃,核心运行最高频率为1950MHz,最高风扇转速1253RPM,最高功耗174W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 3060魔龙图形分数达到了4056分,核心温度最高63℃,核心运行最高频率为1950MHz,最高风扇转速1251RPM,最高功耗174W。
四、游戏性能测试:比公版强1~2%
1、地平线:零之曙光
2、孤岛惊魂5
3、古墓丽影:暗影
4、德军总部:新血脉
5、绝地求生
五、温度与超频测试:核心轻松超200MHz 显存可以超2800MHz
1、温度测试
使用Furmark来对RTX 3060魔龙进行烤机测试,测试是室温为26度。
将Furmark的参数设定为1920*1080分辨率、0AA。运行23分钟之后,RTX 3060魔龙的温度稳定在61度附近,显卡的功耗维持在170W上下,满载时风扇转速为1295RPM。
2、超频测试
RTX 3060这一代的超频能力普遍不俗,相比RTX 3060魔龙也不会让人失望。
经过多次尝试,RTX 3060魔龙可以在核心频率提升200MHz的情况下通过各种测试,此时Boost频率达到了2017MHz;三星显存也能超频到16.8GHz,显存带宽为403GB/s,同时我们将功耗墙也调到了180W。
超频之后3DMark Fire Strike Extreme图形分数从达到了11082,这相比默频时的10100提高了982分,提升幅度接近10%,最高运行频率达到了惊人的2152MHz。最高功耗达到了183瓦,最高温度也只有62度。
六、总结:魔龙依旧是顶级非公
RTX 3060魔龙在3个100mm刀锋6代风扇6条热管组成的散热系统中,RTX 3060魔龙在运行3DMark时最高温度仅仅只有62度,风扇转速仅有1200RPM。
即便是使用FurMark进行了长达36分钟的高负载烤机测试,魔龙的温度依旧没有超过62度,风扇转速仅仅只有1295RPM。
一般来说100mm风扇在1500RPM之下就噪音就很难被察觉到了,RTX 3060魔龙满载1295RPM的转速在噪音方面的表现堪称顶级,而在如此低的转速下,核心最高温度也没超过62度,散热系统之强力可见一斑!
PS:RTX 3060魔龙的烤机温度没有低于60度时因为它的风扇支持智能启停,在60度以下就会停转,因此烤机温度一定会高于60度(现在还没有不依靠风扇能将RTX 3060温度压制在60度以下的显卡存在)。
RTX 3060魔龙在超频方面的表现也十分的出彩,虽然他的Boost频率已经比公版高了75MHz,但还能继续再超200MHz,此时的Boost频率已高达2057MHz。它所搭载的三星显存也能从14GHz大幅度超频到16.8GHz,提升了整整20%。
这样的表现算是目前市面上超频能力最好的非公RTX 3060显卡之一。
综合各方面的表现来说,微星RTX 3060 GAMING X TRIO 12G魔龙是顶级非公的存在!