水龙头净水器安装方法视频(真核弹降临影驰 GeForce RTX 4090 HOF OC LAB Plus显卡评测)

Posted 2023-05-31

篇首语：积累知识，胜于积累金银。本文由小常识网(cha138.com)小编为大家整理，主要介绍了水龙头净水器安装方法视频(真核弹降临影驰 GeForce RTX 4090 HOF OC LAB Plus显卡评测)相关的知识，希望对你有一定的参考价值。

水龙头净水器安装方法视频(真核弹降临影驰 GeForce RTX 4090 HOF OC LAB Plus显卡评测)

1前言&显卡外观赏析

前言

GeForceRTX4090显卡已经上市有一段时间了，想必大家对它的性能表现已经了然于心，而包括公版和非公版在内的RTX4090的设计都相当“规矩”，现在有张显卡摆脱了限制，在规格、配置以及外观方面都做到了顶尖水平！用料也是极致豪华，就为了给极客玩家带来极致体验。

没错，它就是影驰GeForceRTX4090HOFOCLABPlus显卡，隶属于名人堂系列，该系列被广大玩家称之为“旗舰中的旗舰”，专为追求极致性能的玩家量身打造，自从HOF系列显卡推出以来，就不断有超频发烧友及爱好者利用这些显卡刷新世界超频纪录，至今影驰GeForceRTX4090HOFOCLABPlus显卡已经拥有20项超频纪录的美誉。

今天我们也有幸上手这张真正的卡皇，下面就给大家送上它的详细评测。

下文“影驰GeForceRTX4090HOFOCLABPlus”简称为“影驰RTX4090HOFOC”

外观赏析

第一次收到影驰RTX4090HOFOC显卡的时候还是有些震惊的，毕竟超规格的外包装盒从里到位都显露出这是一种“奢侈品”的感觉，不愧是旗舰之名的显卡定位。

拆开后，影驰RTX4090HOFOC显卡仍然采用我们熟悉的家族式的白色涂装，正面一改之前的钻石切割工艺，而是换成了更具特色的机甲风，还戴上了尊贵的象征——皇冠。这样的设计不仅拥有丰富的视觉层次感，同时还彰显出顶级显卡才具备的高贵气质。

这张影驰RTX4090HOFOC显卡不止视觉上看起来巨大，体积方面更是重量级，足足有2.7kg重，完全就是一个巨无霸般的存在。

一众显卡厂商也是深知这次RTX4090的重量，因此在包装盒内也配备了全金属通用显卡支撑杆套件，能够彻底杜绝显卡变形，给予显卡有效保护。

正面抢眼的除了皇冠灯件外，就属三把巨大的散热风扇了，它们都大到快要撑破显卡外壳了，左右两边的是112mm的静霜风霜，中间的则是92mm，三大特大的散热风扇组成了显卡不可或缺的主动散热部分。

将镜头拉近，每个散热风扇都配有11片专属的静霜叶片，并且扇叶表面明显经过特殊优化处理，表面有磨砂质感，这样做的目的是保证显卡进风量，高效散热保证性能释放。

显卡的背面更加惊艳，同样是全白设计，不过在设计上加入了些小巧思，整个背板被大面积的“HOF”Logo覆盖，并且还配有名人堂特有的皇冠，无不彰显其高贵地位。

高强度的压铸金属背板比一般的金属背板更有助巩固显卡不易变型，而且还可以提升散热效能，加上背板末端设有开孔设计，有效加强风扇气流，影驰RTX4090HOFOC显卡在高频运作下仍能稳定耐用。

并且背板上的HOF皇冠Logo标志还是一个RGB灯件，在显卡接通电源后能够亮起，与其他硬件同步灯效后，RGB效果更是炸裂。

既然说到RGB，前面提到的可拆式皇冠灯件其实也支持ARGB灯效，其背后藏有一个5VARGB接口，神光同步功能信手捏来。

当它与正面融为一体时，一个璀璨夺目的皇冠跃然纸上，时刻提醒你手上正在使用的影驰RTX4090HOFOC显卡是尊贵的象征，是性能的象征。

玩家也可通过影驰官方的魔盘XtremeTuner工具自定义灯光效果，多种灯效配合这个显眼的皇冠设计别有一番韵味，打造专属于你的高颜值显卡。

皇冠灯件除了可以展示炫酷的RGB灯效，还自带检测功能，黄灯表示显卡外接供电异常，而红灯则表示主板异常，玩家排障更直观。

皇冠灯件其实是可拆式设计，即使你的显卡不是竖装放置，它也可以拆卸后独立放置在显卡顶部，一样能够让你360°欣赏它的美。

卸下皇冠灯件后，隐藏在其之下的“HallOfFame”慢慢显现，影驰几乎在你看得到的地方都安排了RGB灯效，采用海景房装机，你将大饱眼福，时刻感受惊艳众人的ARGB。

你以为这就是玩灯的极限了吗，影驰RTX4090HOFOC显卡还有HOFPANELIII多功能外置全彩显示系统，其本质是一个LED显示屏，使用新版的HOFAi软件，你可以在这块显示屏上监控显卡状态，展示图片，播放视频，应有尽有。

通体白色的设计与魅力四射的RGB灯效相结合，放在白色的侧透机箱内恰到好处，既给玩家带来了视觉盛宴，又没有过分高调，更像是一位优雅的武林高手，在小小的机箱内满血输出。

显卡的顶部和底部都配有大面积的鳍片出风口，鳍片的厚度也是相当“离谱”，不过这样豪华的堆料有利于内部空气的快速流动，降低显卡核心温度。

显卡供电用的是全新的12VHPWR供电接口，使用一根12VHPWR的电源线就可达到供电需求。不过影驰RTX4090HOFOC配备了两个12VHPWR供电接口，最大能够给这张显卡提供1200W的供电能力，带666W的最大TDP完全足够了。

供电接口的附近可以看到一个小按钮，这其实是影驰RTX4090HOFOC的BIOS切换按钮，用户通过DualBIOS拨动开关就能选择不同的工作模式。左侧还有ARGB的接口，新的AuroraSyncPro功能能够让名人堂RTX40系列显卡与支持5VARGB外接扩展功能的主板实现灯效同步。

显卡底部还可以看到显卡的PCIe金手指，标准的PCIe4.0x16速率，它可以为显卡提供更快的传输速度。

视频输出接口方面配备了3个DP1.4a和1个HDMI2.1，支持4屏显示或最高8K@60Hz的超清输出。视频输出接口还专门采用镀金处理，不仅抗氧化性能更强，还能让视频讯号传输更清晰。

IO挡板上还有一个小按钮，其实这是名人堂RTX40系列显卡才具有的HyperBoost一键加速功能，用户只需要通过功能按键就能实现HyperBoost功能一键开启，提高显卡散热器效能以及提升GPU超频能力，同时按键上配备了状态指示灯，开启一键加速功能，按键亮绿灯，关闭功能时则无灯光。

另外从这个角度也可以看出影驰RTX4090HOFOC显卡惊人的厚度，足足有77mm，已经超越4槽厚度了，妥妥的性能巨兽。

2显卡拆解

显卡拆解

影驰RTX4090HOFOC可谓是相当“厚实”，那它的内部一定也是堆料十足，我们拆开来一探究竟，卸下影驰RTX4090HOFOC金属背板上的螺丝后就可以分离散热系统和PCB。

首先映入眼帘的是一张纯白的PCB板，名人堂专属定制，14层OC工艺加持。整体设计合理，安排规整，单从PCB上的接口、供电、核心、显存等细节就可以看出这一定是大厂出品的品质。

PCB的背面相比正面就要简洁很多了，不过还是排布了密密麻麻的的电容，影驰为这张RTX4090可以说是煞费苦心，疯狂堆料。

核心背部电容位置使用了四个POSCAP(导电聚合物钽电容)代替四组MLCC(一组10个MLCC)，整体电气性能更强。

PCB的正中央就是本次的主角——AD-102-300-A1核心，影驰RTX4090HOCOC显卡的心脏，别看它小小的一颗，但其实它集成了763亿个晶体管，相比RTX3090Ti足足多了2.7倍，称它是地表最强卡皇都不足为过。

核心的周边则是12颗GDDR6X显存，来自美光科技，型号为2RU47D8BZC，单颗显存容量2GB，12颗组成24GB超大显存。并且这几颗显存的速率可是满血的，显存速率为21Gbps。

影驰RTX4090HOFOC在供电MOSFET上也是堆料到了极致，供电总相数达到了32相之多，其中28相为核心供电，4相为显存供电，这个规格基本上在一众RTX4090中也是Top1的存在。

无论是核心供电还是显存供电，影驰RTX4090HOFOC全部采用英飞凌的DrMOS芯片，型号为TDA21472，持续输出电流可达70A。

不同于其他显卡的设计，影驰RTX4090HOFOC采用全新的方案，PWM芯片也来自英飞凌，型号是XDPE1A2G7B，不过目前还查询不到相关信息。

附近还有一颗uS5650Q，它主要负责管理显存供电部分。与上面的PWM芯片通力合作，为显卡提供充足动力。

在核心周围还能看到两颗BIOS控制芯片，型号为IS25WP016，分别控制这款显卡的P-Mode与S-Mode。

想要有666W的TDP，单一12VHPWR供电接口是不够的，影驰RTX4090HOFOC有两个12VHPWR接口，每个接口都能提供600W的供电能力，双口完全能够支撑其这张卡皇。

在两个供电接口的后方，还有4颗R22电容坐镇，为显卡电源输入提供稳定安全的保障。

当然供电不止12VHPWR接口一处，PCIe也是供电之一，影驰RTX4090HOFOC的PCIe接口为标准的PCIe4.0x16，值得注意的是使用前一定要在主板打开ResizableBAR功能，这张显卡的性能才能完全释放。

奢华至极的不止供电，连视频输出接口也是镀金设计，抗氧化能力极强，经久耐用，还可以有效提升信号传输品质。

继续拆解散热系统，首先见到的便是大面积的液冷均热板，面积达到了95mm*88mm，如此规格的配置能够迅速吸收GPU产生的热量，并将热量迅速均匀传递到热管，让AD102核心时刻保持冷静。

影驰在均热板上为显存、电感、MOS管接触的地方用上了高系数的导热垫辅助散热。就连核心处也是厚厚的一层硅脂，可见这个散热系统真的是下足了功夫，堆足了料。

不仅仅正面的均热板有散热，金属背板上同样安排了导热垫，配合金属导热性强的特性，影驰RTX4090HOFOC的散热效能可以说是拉满了。

整个散热器除了正面的液冷均热板外，其他地方被大面积的导流型鳍片覆盖，并且还在部分地方安排了不少加强件，用于保护鳍片不变形。

散热鳍片下隐藏着4根Φ8mm+5根Φ6mm的镀镍复合热管，9热管的配置用于压制AD102核心绰绰有余。

所有热管在散热鳍片下蜿蜒曲折，最终贯穿整个散热器，并且统统采用回流焊接工艺，有利于保证散热系统的高效导热。

三把专属的静霜散热风扇是整个散热系统的主动散热来源，肩负着加速空气流动，快速带离热量的作用，20mm的厚度设计让散热效能显著提升，这也是为什么这张显卡在烤机时能够做到低温的原因所在

拆解后细看，每把散热风扇上有11片静霜扇叶，升级优化后不仅进风量更大，还支持智能启停功能，让显卡随时随地能够全力输出。

总的来说，影驰RTX4090HOFOC完全称得上堆料豪华，极致散热。旗舰级的AD102核心配上如此规格的硬件，明显是为超频预留了更多余量，这也是名人堂HOF系列显卡的“头号招牌”。

3测试平台&理论/游戏性能

测试平台介绍

见识过影驰RTX4090HOF的堆料设计后，就该进入实测环节了，老样子，我们先介绍一下此次的测试平台。我们请出了目前最强的游戏硬件，CPU用的是最新的IntelCorei9-13900KS，华硕的Z790Hero主板搭配4根16GB的金士顿DDR5-6000高频内存。

散热方面也是下足了功夫，用的是鑫谷冰封360冰山版水冷散热器，只有这个规格的散热器才有可能驯服13900KS这颗可以超频到6.0GHz的性能怪兽。

既然影驰RTX4090HOF是一块纯白色的显卡，那装机自然离不开时下最流行的白色主题海景房，机箱上我们选用了昆仑御风机箱白色版。其拥有出色的功能支持与惊艳众人的颜值，非常适合DIY玩家。

昆仑御风机箱的风道设计不错，因此我们在其前后还加装了多把鑫谷冰霜12散热风扇，不仅能够给散热添砖加瓦，在颜值方面也是给白色主题装机添彩。

有了强悍的硬件，显示设备也不能拖后腿，显示器我们采用了爱攻&保时捷联名PD32M电竞显示器，其搭载了目前顶级的4K144Hz面板，可以完美体验到RTX4090带来的丝滑4K144Hz游戏体验。

理论性能测试

正式测试前，我们先在GPU-Z中对影驰RTX4090HOFOC进行一个简单的了解。从图中可以看到这款显卡的基准频率为2235MHz，Boost频率为2625MHz，远远高于公版FE的2520MHz，这也是其能够位列“名人堂”的底气。

另外从GPU-Z中我们还可以了解到这款显卡的功耗和温度设定，眼尖的玩家可能已经发现了，影驰RTX4090HOFOC的默认TGP设定为550W，这已经比普通的RTX4090的最大TGP还要高了，并且这款显卡支持解锁功耗至666W，温度墙也能放宽至88℃，这显然是为冲击超频做足了准备。

接下来我们一起玩一下全世界最好玩的游戏《3DMark》，从3DMark的理论性能来看，影驰RTX4090HOFOC对比上代RTX3090Ti完全是碾压般的存在，首先是代表DX11的FireStrike测试，性能提升在70%左右。而在代表DX12的TimeSpy测试中，RTX4090与RTX3090Ti也是拉出了远远的差距，TimeSpyExtreme直接突破两万分大关，这让笔者很好奇它的游戏表现。

3DMark中的理论性能提升已经足够“离谱”，AIDA64的GPGPU理论性能测试中，影驰RTX4090HOFOC的表现更令人惊喜，整体性能相比RTX3090Ti提升了92%以上，近乎翻倍的性能可谓惊人。不少项目甚至有2倍甚至3倍的飞跃，这才是一张卡皇应有的表现。

游戏性能测试

想必买的起这张卡的玩家都是标配4K分辨率的显示器吧，不过照例我们还是看看1080P与2K分辨率下这张显卡的表现，不得不说卡皇之所以为卡皇就是因为超强的性能释放，影驰RTX4090HOFOC显卡在两个分辨率下，大部分游戏都在200FPS以上，这已经不是入门电竞的水平了，而是专业电竞的表现，现在3A也能用电竞的水准游玩，完全不敢想象。

4K分辨率才是这款显卡的主战场，从实测结果中可以看出，有着“显卡杀手”之称的《赛博朋克2077》中，影驰RTX4090HOFOC显卡在DLSS2下已经能够做到77FPS，更不用说性能更强的DLSS3，而RTX3090Ti仅有48FPS，属实有点不够看。而在《光明记忆：无限》中，即使是高画质加复杂光追的苛刻条件下，这代显卡的表现依旧强势，87FPS的成绩领先前代近70%。

既然都是地表最强游戏显卡了，不试试8K分辨率怎么行，在8K游戏测试方面，影驰RTX4090HOFOC显卡能够将大部分游戏跑到60FPS以上，像一些优化好的游戏，例如《极限竞速：地平线5》甚至能有85FPS左右，想想8K超高画质驰骋在墨西哥是一种怎样的视觉享受。

总的来说，用RTX4090已经能够满足部分游戏运行在8K画质下的需求，相较于RTX3090Ti几乎是翻倍的提升，如果游戏厂商优化到位，8K电竞指日可待。

4DLSS 3性能测试

DLSS 3性能测试

提到RTX40系显卡就不得不提DLSS3这个黑科技了，它无疑是这代显卡升级的重点，相比DLSS2，DLSS3不仅可以实现画质于帧数的双向提升，还新增帧生成功能，实现游戏帧数翻倍，老黄在发布会上更是直言“DLSS3让游戏性能翻倍”！

3DMarkDLSS3理论性能测试

3DMark中新增了DLSS3性能测试，实测下来有DLSS3的加持下，影驰RTX4090HOFOC显卡相比RTX3090Ti真的实现了性能的翻倍，在4K分辨率下，不开DLSS3仅能勉强维持在60FPS附近，一旦开启DLSS3后，性能直接提升三倍，已经可以满足4K@144Hz的电竞需求。

8K分辨率下更是离谱，不开DLSS3只可以13FPS，测试过程卡成PPT，而开启DLSS3后，帧数暴涨80FPS，逼近百帧，相较上代提升3倍有多，似乎已经可以开始期待8K@120Hz甚至8K@144Hz了。

游戏实测

光说不练假把式，现在《赛博朋克2077》也更新了DLSS3，所以我们也在第一时间测试了DLSS3与DLSS2下的区别，实测下来可以看到4K分辨率下，有了DLSS3的加持后，游戏帧数能够进一步提升，并且提升幅度还不小。

2K或1080P的情况下提升幅度更加明显，几乎是近百帧的性能差距。不得不说DLSS3是一个划时代的技术，体验下来真的非常棒，它能让低端卡玩游戏变快，高端卡变得更快。

在另一款支持DLSS3的《F122》中也是如此，在4K画质下开启全高特效，有了DLSS3的加成，影驰RTX4090HOF能够跑到175帧，若只使用DLSS2，则帧数只有133帧左右，相当于DLSS3这个黑科技给游戏带来了32%的游戏性能提升，相当不错。

总的来说，影驰RTX4090HOFOC显卡不开启DLSS功能的游戏性能已经足够了，开启DLSS3后，无论是质量档还是性能档，其游戏流畅度都高于120FPS，对于一款赛车游戏来说，这流畅度是真再爽不过了。

当然不少玩家可能担心DLSS3会有降画质的问题，这里我们也截取了DLSS3各个档位下的游戏实际画面，可以看到无论是哪个档次，游戏画质均没有明显影响，甚至因为DLSS3是通过AI进行超分渲染，因此在文字等细节纹理上会比原生画质更加清晰。

DLSS3-F122-DLSS-Balance

DLSS3-F122-DLSS-Perfoemance

DLSS3-F122-DLSS-Quality

DLSS3-F122-DLSS-SuperPerfoemance

DLSS3-F122-TAA

UnrealEngine5LyraDLSS3测试

最后我们还测试了利用UnrealEngine5引擎打造的LyraDEMO，此DEMO除了能够支持最新的DLSS3技术外，还带上了NVIDIAReflex。笔者这里上传了两个图片给大家看看LyraDEMO里的DLSS3开启与关闭的画质对比，游戏流畅度自然是DLSS3开启后提升较为明显的，达到192FPS，而PCL延迟也进一步降低到了50ms的水平。

Unreal-Engine-5-Lyra-DLSS3-OFF

Unreal-Engine-5-Lyra-DLSS3-ON

5生产力性能测试

视频内容创作性能测试

测完了游戏，必不可少的还有创作生产力测试，这里我们选择PugetBench、PCMark10、等多款常见的测试软件，来测试影驰RTX4090HOFOC显卡在日常办公、视频内容生产等方面的性能表现。

首先我们来看看PCMark10Extended项目上各显卡的性能表现如何，可以看到影驰RTX4090HOFOC显卡在各个项目均完成了对前代卡皇RTX3090Ti的超越，这与我们上面的实测相符。

影驰RTX4090HOFOC显卡在更快的显存、更强的性能加持下，跑Pugetbench的Pr项目确实比前代卡皇快了很多，有大约30%的性能提升，换用新显卡对剪视频、预览、导出等操作均有帮助；Ae项目没有Pr进步那么大，但总归于是新显卡，还是有一定性能提升的。

要说提升最大的要属达芬奇了，作为首批支持AV1编解码的剪辑软件，占尽优势，同一项目下，架构革新后的影驰RTX4090HOFOC有着更快的渲染时间，原本RTX3090Ti需要几十秒才能完成的操作，现在仅用17秒！如果你习惯用达芬奇进行创作，那换用影驰RTX4090HOFOC显卡将大幅提升你的工作效率。

专业内容创作性能测试

另一个提升可感的行业就是3D渲染了，Blender与OctanceBench测试中影驰RTX4090HOFOC显卡的性能表现同样给力，相比前代RTX3090Ti有95%以上的性能提升。翻译成人话就是你用影驰RTX4090HOFOC显卡渲染一个相同的项目，它的耗时只需要前代显卡的一半！

即使是在SPEX的专业领域测试中，影驰RTX4090HOFOC显卡也没让人失望，有了更快的显存和全新的架构加持后，可以说完全打通了AD102核心的任督二脉，比起上代旗舰来说，65%的性能提升相当惊人，这个成绩也比其他RTX4090显卡高了近10%。

总的来说，40系显卡这一代光追单元的增强，对于支持光追加速的3D渲染软件是很有利的，多款渲染软件相比上代卡皇的提升都接近2倍，因此对于从事这些相关工作的用户，影驰RTX4090HOFOC这款显卡还是值得考虑的。

双编码器专项测试

RTX40系显卡还有一个重磅升级点就是支持最新的AV1编解码，这次影驰RTX4090HOFOCLABPlus换上了最新的双NVENC编码器，作为第八代NVENC编码器，其编解码性能相比前代有了质的飞跃。

最新的RTX4090显卡支持AV1编码，而RTX3090Ti仅支持AV1解码，二者差距相当明显，新的AV1编码技术能够在占用相同空间情况下，提供更加快速的视频编码和更高质量的流媒体传输性能，并且目前许多主流媒体也逐步支持AV1编码，像达芬奇、万兴喵影、剪映等软件均已支持AV1编码。

我们使用NVIDIA提供的8K片源与工程文件进行测试，同样的素材下AV1编码相比H.265编码所需时间更短，而即使同为H.265格式导出，影驰RTX4090HOFOCLABPlus的导出时长也比前作快了70%以上。

另外我们来看看H.265格式与AV1格式下的画质区别，从肉眼来看，其实画质几乎完全一样，这样也意味着AV1可以用更小的空间占用量实现与H.265同等规格的画质表现，总的来说，无论是导出速度、空间占用还是画质表现，它都完胜H.265。

6功耗&超频&总结

超频体验

在拆解部分我们看到影驰给这张RTX4090HOFOC显卡安排了超规格的供电模组与散热装置，并且TDP给到了最高的666W，可见超频就是它的最强杀招，那笔者自然是不可能错过这个绝佳的机会，下面一同看看这款显卡的超频潜力究竟有多大吧。

我们使用影驰官方提供的XTREMETUNER魔盘工具对显卡进行超频，这款工具不仅可以解锁GPU核心的电压限制、功耗限制等，还可以自由调节风扇转速，实测这款显卡的散热配置明显是超规格的，因此风扇转速还可以进一步下探，超低的风扇噪音还你舒适的使用体验。

在解锁了功耗与温度墙后，我们先小试牛刀，将GPU核心频率先提升至3090MHz，此时显卡在运行TimeSpy时已经超过了4W分大关，并且功耗也突破了550W，要知道这是其他RTX4090都达不到的地步。并且在测试过程中温度始终没有突破60℃，明显这是高规格的散热系统起到了作用。

有了前面的尝试后，我们稳步提升，笔者最后成功将影驰RTX4090HOFOC的GPU核心频率提升了235MHz，显存频率提升了1000MHz，最终影驰RTX4090HOFOC在3DMark中能够稳定运行在3150MHz下，这还只是在风冷状态下，如果是水冷，那它还能再高一些，此时TimeSpy测试得分40459，相比默频状态的38155分提高2000多分，超频潜力可见一斑。

功耗与散热

前文中我们提到，影驰RTX4090HOFOC显卡采用了非常优秀的散热设计，那么这款显卡在散热性能测试中的实际表现如何呢？

在使用Furmark烤机15分钟后，这款显卡的GPU温度稳定在65.5℃，这样的成绩比起上代的RTX3090Ti可以说是质的飞跃，如果跟其他RTX4090比起来，那也是妥妥的第一梯队，可见其散热效率的确非常高。

再聊聊内部的发热大户——GDDR6X显存，笔者原以为显存温度也会较高，但没想到有高系数导热垫直触均热板后，显存温度只比核心高了0.5℃，果然旗舰级的显卡散热都不是盖的，用这套散热系统压制AD102核心已经绰绰有余了。

我们也横向对比了一下影驰RTX4090HOFOC显卡与上代卡皇的功耗，从功耗来看，解锁了功耗墙的影驰RTX4090HOFOC的确惊人，不过相比其前代卡皇，它的功耗可以说是相当保守了，不少项目测试下来，功耗都没有上代那么高，但性能提升却是实打实的强。

不得不说老黄的AdaLovelace架构和TSMC的4N工艺确实有点东西，妥妥的吊打前代显卡，让RTX40系列显卡的每瓦性能实打实的提升到了一个新高度。

评测总结

这次能够上手这张影驰GeForceRTX4090HOFOCLABPlus显卡还是相当幸运的。全新AdaLovelace架构、TSMC4N定制工艺、DLSS3等数不胜数的黑科技聚集于一身，让这张显卡无论是游戏性能还是专业生产力都遥遥领先RTX3090Ti，不愧为地表最强游戏显卡。

而影驰GeForceRTX4090HOFOCLABPlus显卡本身更是极致奢华的代表，无论是性能、颜值、还是配置都是当今最强的RTX4090之一。因此对于游戏玩家来说，游戏帧数、散热表现都是旗舰中的旗舰；除此之外它的双12VHPWR供电以及32相的豪华供电规模则为硬核的超频玩家提供了绝佳的舞台，风冷下轻松超3.1GHz，完美诠释了顶级非公应有的表现。

一身白衣加身的影驰GeForceRTX4090HOFOCLABPlus也是赚足了眼球，光是皇冠灯件就彰显了这张显卡的高端定位。纯白色的设计配上极具个性的棱角线条，奢华而优雅的外观无疑是颜值党的最佳选择。

总的来说，如果你想见识一下顶尖的RTX4090显卡，那影驰GeForceRTX4090HOFOCLABPlus就是你的不二之选。最高666W的功耗能够完全榨干AD102核心，两倍于前代卡皇的性能表现，毫无疑问，它就是目前地表的性能王者，几乎没有对手能与之抗衡。现在影驰GeForceRTX4090HOFOCLABPlus已经上市，售价19999元，各大‏‏电商平台均已开售‏‏，感兴趣的话可以去了解一下。

7Ada Lovelace架构讲解

Ada Lovelace架构讲解

Turing、Ampere上两代架构核心均以人物来命名，前者是计算机科学之父——艾伦·麦席森·图灵；后者则是“电学中的牛顿”——安德烈·玛丽·安培，电流的国际单位安培就是以其姓氏命名。那AdaLovelace定非凡人，度娘一下果然，这是人称“数字女王”的阿达·洛芙莱斯，编写了历史上首款电脑程序，是被世界公认的第一位计算机程序员，果真是一代比一代还要更牛。PS：她的父亲是《唐璜》的作者，诗人拜伦喔。

从Turing架构开始，NVIDIA首次在显卡中加入了加速光线追踪的RTCore单元，以及面向AI推理的TensorCore单元，这革命性的创新使实时光线追踪成为可能。而Ampere架构则是全面的架构改进，在加入新一代的二代RTCore和三代TensorCore基础上，还有着更先进的SM单元设计，这样显卡工作效率那是翻倍的提升。而来到AdaLovelace架构，同时是以效率提升为大前提，自然是引入了最新的第三代RTCores与第四代TensorCores单元，同时加入众多新颖的黑科技，从执行效率来说AdaLovelace架构是上代Ampere架构的2倍以上，甚至光线追踪能力更是达到了恐怖的4倍性能。

在讲述核心架构前，我们先了解几个关键词：GeForceRTX4090、AdaLovelace、TSMC4N、608mm²、760亿个晶体管、2倍性能功耗比。

大家带着几个关键字来看上面的【显卡规格参数对比】表格，就可以更容易读懂上述表格了。最新一代的桌面显卡GeForceRTX40系列均采用全新的AdaLovelace架构核心，GeForceRTX4090的核心是AD102，目前AdaLovelace架构核心中最为强大的，具有760亿个晶体管、16384个CUDA核心和24GB高速美光GDDR6X显存。

得益于NVIDIA与台积电深度合作的TSMC4N制程工艺，GeForceRTX4090核心面积仅是608mm²（上代RTX3090Ti628mm²），在更小的核心面积下却能塞下多达760亿个晶体管，比上一代的Ampere架构多出了约70%晶体管数量。

值得注意的是，制程工艺的提升不单能拥有更多的晶体管，其核心频率更是能跑得很高，GeForceRTX4090Boost频率就已经达到了2520MHz，这样在核心频率与高规格的双向保证下实现了比上代显卡高达2倍的性能功耗比。

从GTC2022秋季大会中，其实我们就已经发现了，目前GeForceRTX4090显卡中配备的AD102-300核心其实并非完整的AD102核心。完整的AD102核心应该包括了12个GPC(图形处理集群)、72个TPC(纹理处理集群)、144个SM(流式多处理器)和⼀个带有12个32Bit显存控制器的384Bit显存位宽。

再来看上面的GeForceRTX4090架构图，和完整版本的AD102核心对比起来就很容易看出差别。首先，GeForceRTX4090核心代号为AD102-300，其拥有9个完整规格的GPC(图形处理集群，每个内建6个TPC)，与2个非完整的GPC(图形处理集群，每个内建5个TPC)，共组成了64个TPC，那么SM单元自然就是128个了。至于显存位宽方向那是相当的完整——384Bit。

如果你还是不太懂，这里笔者就逐一为了AdaLovelace架构显卡的构成。

刚才我们已经说到，一个完整的AdaLovelace架构AD102核心内部拥有12个GPC，而每个完整的GPC中包含了一个专用的RasterEngine（光栅化引擎），两组ROPs共16个ROP（光栅化处理单元），以及6个TPC与12个SM单元。

全新的SM流式多处理器

AdaLovelace架构中最大的亮点之一：全新的SM流式多处理器，每个SM包含了128个CUDA核心、1个第三代的RTCores,4个第四代TensorCores（张量核心）、4个TextureUnits（纹理单元）、256KBRegisterFile（寄存器堆），以及128KBL1数据缓存/共享内存子系统，于是这一个全新的SM单元有着超过上一代2倍之的性能表现。

过去的Turing架构INT32计算单元与FP32数量是一致的，而两者相加才组成了64个CUDA核心。但是Ampere架构开始，左侧的计算单元实现了FP32+INT32的计算单元并发执行，也就是说CUDA核心数量翻倍到了128个。

再来看看AdaLovelace架构的SM，FP32/INT32的计算单元组合，同样实现了每个SM内含128个CUDA的设计，看似提升不大，但是当你了解到GeForceRTX4090拥有128个SM，16384个CUDA核心，那你也就应该明白达82.6TFLOPS的着色器能力是如何实现的了，比上一代的RTX3090Ti显卡的40TFLOPS，还真是提升了两倍有多。

另外缓存方面AdaLovelace架构也进行了大规格的提升，首先每个SM单元中单独配上了128KB的缓存，这样RTX4090显卡中就实现了163MBL1/共享内存。其次核心的二级缓存进行进行了重新的设计，并且完整AD102核心是96MB二级缓存，而RTX4090显卡拥有72MB二级缓存，也可能是因此AdaLovelace架构核心对显存位宽的依赖性并不高。

8第三代RT Cores与第四代Tensor Cores

技术讲解：第三代RT Cores与第四代Tensor Cores

以为刚才的CUDA数量与超大L2缓存就已经很猛了，实现上AdaLovelace架构最大的提升还是在第三代RTCores与第四代TensorCores身上。

第三代RTCores

RTCores用于光线追踪加速，第三代RTCores的有效光线追踪计算能力达到191TFLOPS，是上一代产品2.8倍。

在Ampere架构中，第二代RTCores支持边界交叉测试（BoxIntersectiontesting）和三角形交叉测试（TriangleIntersectiontesting），用于加速BVH遍历和执行射线三角交叉测试计算，虽然光线追踪处理能力已经比初代的Turing架构核心更高效，但是随着环境和物体的几何复杂性持续增加，传统的处理方式很难再以更高效率、正确反应出的现实世界中的光线，尤其是光的运动准确性。

所以在第三代RTCores增加了两个重要硬件单元：OpacityMicromapEngine与DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine，主要是用于alpha通道的加速，可以将alpha测试几何体的光线追踪速度提高2倍。

在传统光栅渲染中，开发人员使用一些Alpha通道的素材来实现更高效的画面渲染，例如Alpha通道的叶子或火焰等复杂形状的物体。但在光线追踪时代，这传统的做法会为光线追踪带为不少无效的计算，例如运动性的光线多次通过一块叶子，光线每击中一次叶子，都会调用一次着色器来确定如何处理相交，这时就会做成严重的执行成本与时间等待成本。

而OpacityMicromapEngine用于直接解析具有非不透明度光线交集的不透明度状态

三角形。根据Alpha通道的不透明，透明与未知等三个不同的块状态进行处理：透明则直接忽略继续找下一个，不透明块则记录并告之命中，而未知的则交给着色器来确定如何处理，这样GPU很大部分都不需要进行着色器的调试处理，能够实现更为高效的性能。

DisplacedMicro-MeshesEngine

如果说OpacityMicromapEngine加速的是面处理，那么DisplacedMicro-MeshesEngine就是几何曲面细节的加速器。如上图所示，在AdaLovelace架构中，通过1个基底三角形+位移地图，就可以创建出一个高度详细的几何网格，所需要资源占用比二代RTCores更低，效率也更高。

通过NVIDIA给出的创建14:1珊瑚蟹例子来说事，这里我们需要需要1.7万个微网格、160万个微三角形，在AdaLovelace架构中BVH创建速度可加快7.6倍，存储空间缩小8.1倍。DisplacedMicro-MeshesEngine起到了关键性的作用，其将一个几何物体根据不同细节分成密度不一的微网络处理，红色密度超高，细节处理越为复杂。相应的低密度微网络区域则可以释放更多的资源与存储空间，这样DisplacedMicro-MeshesEngine就可以帮助BVH加速过程，减少构建时间和存储成本。

同时AdaLovelace架构SM中新增了着色器执行重排序（ShaderExecutionReordering，SER），这是由于光线追踪不再只有强光或者阴影渲染处理，未来将会更多的是在光线的运动性，这样光线就会变得越来越复杂，想要第三代RTCores与第四代TensorCores有着更高的执行效率，那就得为他们来安排一位管家。而着色器执行重排序（SER）就是为了能够即时重新安排着色器负载来提高执行效率，为光线追踪提供2倍的加速，也能更好地利用GPU资源。不过目前仍未有实例，想实现这个功能，还得游戏与开发工具的支持才行。

第四代TensorCores

TensorCores是专门为执行张量/矩阵运算而设计的专用执行单元，这些运算是深度学习中使用的核心计算功能。第四代TensorCores新增FP8引擎，具有高达1.32petaflops的张量处理性能，超过上一代的5倍。

9DLSS 3技术讲解

技术讲解：DLSS 3

或者说第四代TensorCores太硬核你不会知道是啥？提升意义在哪？但是TensorCores最经典的应用DLSS你肯定会知道，这一次AdaLovelace架构支持NVIDIA最新的DLSS3技术。

之前我们也聊过DLSS技术，其设计之初是为了弥补光线追踪技术后的性能损失，具体的表现为开启光线追踪技术后游戏帧数大幅度的下降，甚至很难保证游戏流畅的运行。于是DLSS使用低分辨率内容作为输入并运用AI技术输出高分辨率帧，从而提升光线追踪的性能。

在DLSS3中包含了三项技术：DLSS帧生成、DLSS超分辨率（也称为DLSS2）和NVIDIAReflex。你可以理解为DLSS3是在DLSS2的基础上，新增了DLSS帧生成技术；而后两技术中，DLSS超分辨率只需要GeForceRTX显卡都能使用上，NVIDIAReflex则是GeForce900系列以后的显卡都用使用上。

想实现DLSS帧生成可不简单，这需要配合上AdaLovelace架构的GeForceRTX40系列显卡才行。DLSS帧生成技术原理是：利用AI技术生成更多帧，以此提升性能。DLSS会借助GeForceRTX40系列GPU所搭载的全新光流加速器分析连续帧和运动数据，进而创建其他高质量帧，同时不会影响图像质量和响应速度。

从Ampere架构开始，NVIDIA显卡就已经支持了光流加速器，而AdaLovelace架构的光流加速器升级到了第二代，其提供了高达300TeraOPS(TOPS)，比安培架构的初代光流加速器（OpticalFlowAcceleration，OFA）快2倍以上。为了实现DLSS帧生成，OFA扮演了重要的角色，其配合上新的运行⽮量分析算法在DLSS3技术框架内实现精确和高性能的帧生成能力。

另外，由于DLSS帧生成是在GPU上作为后处理执行的，那么即使在游戏受到CPU性能限制的时候，我们同样能够从中获得更好的游戏性能提升。尤其是那种物理计算密集型的游戏或大型场景游戏，DLSS2均可以让GeForceRTX40系列显卡以高达两倍于CPU可计算的性能来渲染游戏。

最后由于DLSS3是建立在DLSS2基础之上的，游戏开发者可以在已支持DLSS2或NVIDIAStreamline的现有游戏中快速集成该功能，所以DLSS3已在游戏生态得到广泛应用，目前已有超过35款游戏和应用即将支持该技术。

阅读小亮点：NVIDIAReflex

NVIDIAReflex也是DLSS3其中的一环，它可以使GPU和CPU同步，确保最佳响应速度和低系统延迟。

想要实现端对端的最低延迟，你需要确保游戏、显示器以及鼠标三者都同时支持并开启了Reflex技术。

当GeForceRTX40系列显卡和NVIDIAReflex搭配上后，直接达到1440p分辨率360FPS的体验，这着实是性能有点强劲了。

在GTC2022大会时已经透露将会还有4款1440p分辨率的新型G-SYNC电竞显示器将要发布，包括采用mini-LED技术的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款显示器刷新率均为300Hz，而最猛的是ASUSROGSwift360HzPG27AQN，刷新率直接来到了360Hz。

但唯一一个问题就在于，部分显示器厂商认为此类产品受众人群较少，会降低此类显示器的产能，甚至产品就已经被内部PASS掉，所以1440p360Hz是很美好，但现实也是相当的骨感。

10双NVIDIA编码器讲解

技术讲解：双NVIDIA编码器(NVENC)

GeForceRTX40系列显卡还有一个全新的升级，那就是双编码器NVENC。第八代的NVENC双编码器不仅支持H.264与H.265，还支持开放式视频编码格式AV1。

而由于AV1是一种免版税的视频编码格式，上游软件厂商与下游戏的配套端都在大力推广此编码格式，我们也会看到越来越多的硬件与软件支持AV1格式，包括剪映专业版、DaVinciResolve、以及AdobePremierePro较为流行的Voukoder插件均支持，且均可通过编码预设使用双编码器，这样我们等待视频导出的时间缩短将近一半。

不单是视频制作软件，AV1格式也将会是主播、游戏直播UP主们的新宠儿，在保证画面最高质量的情况下，AV1编码器可将效率提高40%，同时显卡的占用也更低。包括OBSStudio一一代软件中也会增加AV1格式的支持。另外我们还能通过GeForceExperience和OBSStudio录制高达8K60的内容，这样我们做游戏录制也会变得更为轻松。

包括我们之后测试时使用的游戏内录视频都是支持AV1格式，同时双编码器NVENC在资源占用和适配上做得越来越好。