NVIDIA GeForce 20系列

Geforce RTX 20 系列
	; RTX 2080Ti 创始版
发布日期	2018年9月20日，6年前; 2019年7月9日，5年前; (Super系列)
代号	TU10x
架构	Turing
产品系列	GeForce RTX
电晶体	108亿 12nm(TU106); 136亿 12nm(TU104); 186亿 12nm(TU102);
制造工艺	台积电 12nm(FinFET)
显卡
中端GPU	GeForce RTX 2050; GeForce RTX 2060; GeForce RTX 2060 Super
高端GPU	GeForce RTX 2070; GeForce RTX 2070 Super; GeFroce RTX 2080; GeForce RTX 2080 Super
旗舰GPU	GeForce RTX 2080 Ti; NVIDIA TITAN RTX
API支持
Direct3D	Direct3D 12 (12_2)
OpenGL	OpenGL 4.6
OpenCL	OpenCL 1.2
Vulkan	Vulkan 1.2
历史
前代产品	GeForce 10系列
相关产品	GeForce 16系列
后继产品	GeForce 30系列

NVIDIA GeForce RTX 20系列，是由NVIDIA继GeForce GTX 10系列后开发的图形处理器系列。于2018年8月20日的Gamescom（科隆游戏展）上发布。^[1]^[2]^[3]本系列首发产品是GeForce RTX 2080及2080Ti，2018年9月20日正式发售^[4]。此系列产品新命名为RTX，而未沿用推出多年的GTX，以突显支持光线跟踪的特色。

架构特性

RTX 20系列基于图灵微架构（Turing），具有实时光线跟踪（Ray tracing）功能。^[5]通过使用RT核心（光线追踪运算核心）可以加速这一过程。这些核心能够高效处理四叉树和球形层次结构，并在碰撞模拟的过程中更快地为三角面组成的立体模型进行物体碰撞模拟。

RT核心的光线追踪功能在模拟反射、折射和阴影的操作上可以取代传统立方体贴图和深度贴图的光栅技术。从光线追踪运算得到的信息可以增强阴影使画面更加逼真，尤其是可以将发生于屏幕画面以外的动作通过阴影和光线反射渲染到画面之中。

张量运算核心（Tensor Core）进一步加速了光线追踪，并用于填充部分渲染图像中的空白，这种技术被称为“降噪”。张量核心原是为深度学习而设计的，例如学习如何提高图像的分辨率。但通常消费者的张量核心主要是执行一些已经完成的深度学习模型，这些模型是在超级计算机进行分析和解决的，超级计算机确定如何实现这些目标的方法，例如学习如何提高图像的分辨率，然后由消费者的张量核心实际使用这个方法，也就是使用超级计算机找到的方法来提高图像的分辨率。

因此，图灵架构的光线跟踪特性，实际上是旧有光线跟踪技术与近年兴起的人工智能（AI）、深度学习结合的产物，先是利用光线跟踪专用的运算单元RT core生成图像的关键要素，剩余的非关键要素则是交由深度学习运算单元Tensor Core来补全，而图像中的关键要素，也借由Tensor Core执行相关的深度学习程序来决定。除此以外，Tensor Core还被用于执行消除混叠的深度学习程序（深度学习超级采样，DLSS），来柔化画面锯齿边缘。^[6]

将深度学习、光线跟踪用于画面运算虽然不是首个，NVIDIA早在基于帕斯卡、伏打图形处理微架构的GeForce GTX TITAN系列上有先行铺路，光线跟踪更是早已有之的技术，只是当时设备的性能仅能到作生成静态画面之用，而本代GeForce RTX系列则是首个在画面处理中大量使用深度学习技术、引入与深度学习相结合的光线跟踪实时动态画面技术的图形处理器。不过它仍然保留了性能强劲、规格庞大的传统光栅化渲染3D画面所需的运算组件。^[7]

细节

采用台积电12nm FFN制程打造，由伏特微架构使用的12nm FFC制程改进（但本质上依旧是台积电16nm FF+制程的延伸版本），性能是后者的1.1倍，功耗只有后者的70%，核心面积则可以缩小20%
为容纳数量庞大的运算单元，核心面积相比帕斯卡微架构的大幅增加，由GP102（GeForce GTX 1080Ti）的471mm²增加至TU102（GeForce RTX 2080Ti）的754mm²
CUDA 7.5
采用全新的SM数组设计: TPC包含了两个SM单元(Pascal为1个)，SM单元重新分配为64个FP32、64个INT32、8个Tensor Core 、1个RT Core ，同时添加了独立的INT数据路径，支持FP32和INT32操作的并发执行。
为共享暂存、一级暂存、纹理暂存引入了统一架构，一级暂存与共享暂存大小是灵活可变的，可以根据需要在64+32KB或者32+64KB之间变换，让一级暂存更充分利用资源，也减少一级暂存延迟，并提供比Pascal GPU中使用的一级暂存更高的带宽，同时二级暂存容量提升。
Tensor Core（张量核心） : 负责人工智能、神经网络运算，增加了新的INT8和INT4精度模式，FP16半精度也能够被完整支持通常会用到矩阵融合乘加(FMA)运算，新的INT8精度模式的工作速率是此速率的两倍，张量核心为矩阵运算提供了显著的加速，除了新的神经图形功能外，还用于深度学习训练和推理操作。
NGX (Neural Graphics Acceleration)框架: 利用张量核心，在游戏中实现深度学习功能，GeForce Experience会自动匹配Turing显卡并且下载可用的NGX Core软件包，对应如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
DLSS (深度学习超级采样) : 反锯齿技术，利用张量核心实现在较低的输入样本数下更快地渲染，具有与64×超级采样画面相同质量的细节，还可以避免TAA产生的运动模糊等问题，相比TAA等其它反锯齿技术，渲染能力得到大幅提升。
AI InPainting : 算法利用大量真实世界图像的训练，可以补全图片中缺失的内容，也可以移除照片的噪点、失真部分以及增强照片的清晰度等功能。
AI Super Rez : 将原影片的分辨率清晰地放大2倍、4倍、8倍，图像更加锐利。
AI Slow-Mo : 将普通常见的30fps进行智能补帧计算，可以获得240/480fps的慢动作影片，而不需要专门高帧率摄影机。
RT Core : 专门为光线追踪计算，是一条特异化的专用流水线，用于加速计算边界体积层次（BVH）遍历以及光线和三角求交（光线投射）。
GDDR6显示内存的支持
附有影像流压缩技术（Display Stream Compression，DSC）1.2版的DisplayPort 1.4a
功能集PureVideo的硬件加速视频解码
NVLink连接器（与伏打微架构的不兼容）
VirtualLink VR
GPU Boost 4^[8]

设计

RTX是GeForce 20系列引入的开发平台。RTX的光线追踪示范程序中使用了微软的DXR，OptiX和Vulkan来进行光线追踪。^[9]

芯片规格

型号	推出日期	核心代号	制程 (nm)	晶体管数 & 晶粒面积	核心配置				时钟频率			填充率		显示内存				运算性能 (TFLOPS)				每秒光线数 (十亿)	总线接口	TDP (W)	NVLink 支持	发售价格(美金)
型号	推出日期	核心代号	制程 (nm)	晶体管数 & 晶粒面积	核心配置 ^{SPs:TMUs:ROPs^[a]}	光追核心	张量核心	二级暂存 (MB)	默认 (MHz)	加速 (MHz)	存储器 (MT/s)	像素 (GP/s)	材质 (GT/s)	容量 (GB)	带宽 (GB/s)	类型	接口带宽 (比特)	单精度 (加速)	双精度 (加速)	半精度 (加速)	张量浮点	每秒光线数 (十亿)	总线接口	TDP (W)	NVLink 支持	零售版	创始版
GeForce RTX 2060	2019年 1月15日	TU106- 200A- KA-A1	12	108亿 445mm²	1920:120:48 （30 SM）	30	240	3	1365	1680	14000	65.52	163.8	6	336	GDDR6	192	5.24 (6.45)	0.16 (0.20)	10.5 (12.9)	51.6	5	PCIe 3.0 x16	160	否	$349
GeForce RTX 2060 TU104	2020年 1月10日	TU104- 150-KC- A1		136亿 545mm²	1920:120:48 （30 SM）	30	240	3	1365	1680		65.52	163.8	6	336		192	5.24 (6.45)	0.16 (0.20)	10.5 (12.9)	51.6	5		160		$300
GeForce RTX 2060 Super	2019年 7月9日	TU106- 410- A1		108亿 445mm²	2176:136:64 （34 SM）	34	272	4	1470	1650		90.5	191.4	8	448		256	6.12 (7.18)	0.19 (0.22)	12.2 (14.4)	57.4	6		175		$399
GeForce RTX 2070	2018年 10月17日	TU106- 400-A1			2304:144:64 （36 SM）	36	288		1410	1620		90.24	203.04					6.50 (7.47)	0.20 (0.23)	12.3 (14.9)	59.7					$499	不适用
GeForce RTX 2070	2018年 10月17日	TU106- 400A-A1			2304:144:64 （36 SM）	36	288		1410	1620+		90.24	203.04					6.50 (7.47)	0.20 (0.23)	12.3 (14.9)	59.7					$499+	$599
GeForce RTX 2070 Super	2019年 7月9日	TU104- 410-A1		136亿 545mm²	2560:160:64 （40 SM）	40	320		1605	1770		102.72	256.8					8.22 (9.06)	0.26 (0.28)	16.4 (18.1)	72.5	7		215	2路 NVLink	$499
GeForce RTX 2080	2018年 9月20日	TU104- 400-A1			2944:184:64 （46 SM）	46	368		1515	1710		96.96	278.76					8.92 (10.1)	0.28 (0.32)	17.8 (20.1)	80.5	8				$699	不适用
GeForce RTX 2080	2018年 9月20日	TU104- 400A-A1			2944:184:64 （46 SM）	46	368		1515	1710+		96.96	278.76					8.92 (10.1)	0.28 (0.32)	17.8 (20.1)	80.5					$699+	$799
GeForce RTX 2080 Super	2019年 7月23日	TU104- 450-A1			3072:192:64 （48 SM）	48	384		1650	1815	15500	105.6	316.8		496			10.1 (11.2)	0.32 (0.35)	20.3 (22.3)	89.2			250		$699
GeForce RTX 2080 Ti	2018年 9月27日	TU102- 300-K1- A1		186亿 754mm²	4352:272:88 （68 SM）	68	544	5.5	1350	1545	14000	118.8	367.2	11	616		352	11.8 (13.4)	0.37 (0.42)	23.5 (26.9)	107.6	10				$999	不适用
GeForce RTX 2080 Ti	2018年 9月27日	TU102- 300A-K1- A1			4352:272:88 （68 SM）	68	544	5.5		1545+		118.8	367.2	11	616		352	11.8 (13.4)	0.37 (0.42)	23.5 (26.9)	107.6	10				$999+	$1,199
NVIDIA Titan RTX	2018年 12月18日	TU102- 400-A1			4608:288:96 （72 SM）	72	576	6		1770		129.6	388.8	24	672		384	12.4 (16.3)	0.39 (0.51)	24.9 (32.6)	130.5	11		280		$2,499

^ 流处理器数量 : 纹理映射单元数量 : 渲染输出单元数量

另见

参见

^ GeForce RTX 2080 launch live blog: Nvidia's Gamescom press conference as it happens. TechRadar. [2018-08-21]. （原始内容存档于2018-08-20）（英语）.
^ Nvidia’s new RTX 2080, 2080 Ti video cards ship on Sept 20, starting at $799. Ars Technica. [2018-08-20]. （原始内容存档于2018-08-20）（美国英语）.
^ Nvidia unveils powerful new RTX 2070, RTX 2080, RTX 2080 Ti graphics cards. Polygon. [2018-08-20]. （原始内容存档于2018-08-20）.
^ Nvidia’s new RTX 2080, 2080 Ti video cards shipped on Sept 20, starting at $799. Ars Technica. [2018-08-20]. （原始内容存档于2018-08-20）（美国英语）.
^ Nvidia announces RTX 2000 GPU series with ‘6 times more performance’ and ray-tracing. The Verge. [2018-08-20]. （原始内容存档于2018-08-20）.
^ GeForce RTX 2080 即可享受 4K HDR 60FPS 遊戲效能，DLSS 反鋸齒效能再增加 1 倍. techbang.com. 2018-08-24 [2018-10-08]. （原始内容存档于2018-10-09）（中文（台湾））.
^ 新增 RT 與 Tensor ，NVIDIA GeForce RTX 2080/2080Ti Turing 架構、Founders Edition、效能表現一次看懂. techbang.com. 2018-09-19 [2018-10-08]. （原始内容存档于2018-10-09）（中文（台湾））.
^ The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. [2018-10-08]. （原始内容存档于2018-09-15）.
^ NVIDIA RTX™ platform. Nvidia. [2018-08-21]. （原始内容存档于2018-08-24）.

扩展链接

官方网站
Nvidia Nsight（页面存档备份，存于互联网档案馆）
Nvidia Turing GPU Architecture: Graphics Reinvented (PDF). Nvidia. Nvidia Corporation. [2018-10-25]. （原始内容存档 (PDF)于2018-09-24）（英语）.

[a-10] 流处理器数量 : 纹理映射单元数量 : 渲染输出单元数量

[1] GeForce RTX 2080 launch live blog: Nvidia's Gamescom press conference as it happens. TechRadar. [2018-08-21]. （原始内容存档于2018-08-20）（英语）.

[2] Nvidia’s new RTX 2080, 2080 Ti video cards ship on Sept 20, starting at $799. Ars Technica. [2018-08-20]. （原始内容存档于2018-08-20）（美国英语）.

[3] Nvidia unveils powerful new RTX 2070, RTX 2080, RTX 2080 Ti graphics cards. Polygon. [2018-08-20]. （原始内容存档于2018-08-20）.

[4] Nvidia’s new RTX 2080, 2080 Ti video cards shipped on Sept 20, starting at $799. Ars Technica. [2018-08-20]. （原始内容存档于2018-08-20）（美国英语）.

[5] Nvidia announces RTX 2000 GPU series with ‘6 times more performance’ and ray-tracing. The Verge. [2018-08-20]. （原始内容存档于2018-08-20）.

[6] GeForce RTX 2080 即可享受 4K HDR 60FPS 遊戲效能，DLSS 反鋸齒效能再增加 1 倍. techbang.com. 2018-08-24 [2018-10-08]. （原始内容存档于2018-10-09）（中文（台湾））.

[7] 新增 RT 與 Tensor ，NVIDIA GeForce RTX 2080/2080Ti Turing 架構、Founders Edition、效能表現一次看懂. techbang.com. 2018-09-19 [2018-10-08]. （原始内容存档于2018-10-09）（中文（台湾））.

[anandarch-8] The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. [2018-10-08]. （原始内容存档于2018-09-15）.

[nvidiartx-9] NVIDIA RTX™ platform. Nvidia. [2018-08-21]. （原始内容存档于2018-08-24）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[a]