DLSS 4 是英伟达(NVIDIA)第四代深度学习超级采样(Deep Learning Super Sampling)技术,其核心原理是通过AI驱动的多帧生成与神经网络渲染,在提升游戏帧率的同时保障画面质量。以下是其技术原理的详细解析:
核心创新:多帧生成(Multi-Frame Generation)
AI插帧技术
DLSS 4首次引入“多帧生成”技术,利用AI模型为每个实际渲染的帧额外生成最多3帧。例如,若GPU渲染1帧,DLSS 4可生成总计4帧(1实+3虚),理论上将帧率提升至原始性能的4倍,结合超分辨率优化后整体性能提升最高达8倍。
该技术依赖Blackwell架构的第五代Tensor Core进行实时AI运算,通过分析运动向量、场景深度信息等数据,预测并合成中间帧。
降低延迟:Reflex技术协同
- 生成帧可能导致输入延迟增加,DLSS 4与NVIDIA Reflex技术深度整合,通过优化渲染管线,确保额外生成的帧不影响操作响应速度。
AI模型升级:Transformer架构实时应用
取代传统卷积神经网络(CNN)
DLSS 4首次在图形领域引入Transformer模型(参数量是前代CNN的2倍,计算量达4倍),显著提升画面稳定性与细节还原能力。
Transformer擅长处理时序数据与长距离依赖关系,有效减少动态场景中的拖影、闪烁现象,并增强抗锯齿效果。
训练方式
- 模型在英伟达超级计算机上使用数万张超高精度离线渲染图像训练,学习从低分辨率输入生成高分辨率画面的映射关系。
技术协同:光线重建与超分辨率
光线重建(Ray Reconstruction)
继承自DLSS 3.5,通过AI替换传统人工设计的降噪器,直接处理光线追踪采样数据,生成更逼真的光照效果(如全局光照、反射)。
在多帧生成基础上,光线重建可跨帧优化光线路径,提升画面连贯性。
超分辨率(Super Resolution)
- 将低分辨率渲染图像(如1080p)通过AI升采样至高分辨率(如4K),补充细节并锐化边缘19。结合多帧生成后,进一步减少画面模糊。
硬件依赖与性能表现
仅支持RTX 50系列显卡
- 多帧生成功能需Blackwell架构的专用硬件单元(如第五代Tensor Core、AI管理处理器AMP),因此RTX 40系列无法支持。
实际效果
- 在《赛博朋克2077》4K分辨率+光追全开设置下,DLSS 4可将帧率从原生34 FPS提升至185 FPS(约5.4倍),1% Low帧同步优化。
对RTX 5060等中端卡意义重大,使其能以高画质运行4K光追游戏17。
总结:DLSS 4的技术意义
DLSS 4代表了实时渲染从“像素填充”到“帧生成”的范式转变。通过AI生成多帧、重建光线路径、提升分辨率,它解决了高画质与高性能的矛盾,且依赖专用硬件实现低延迟协同。这一技术不仅提升了游戏体验,也为未来实时图形学中的AI应用铺平了道路。