本頁使用了標題或全文手工轉換

NVIDIA GeForce 30系列

維基百科,自由的百科全書
跳至導覽 跳至搜尋
GeForce RTX 30系列
RTX 30 series logo with slogan.svgRTX 3090 Founders Edition!.jpg
GeForce RTX 3090 創始版
發布日期2020年9月17日,​2年前​(2020-09-17
代號GA10x
架構Ampere
產品系列GeForce RTX
電晶體
  • 133億 (GA106)
  • 174億 (GA104)
  • 283億 (GA102)
製造工藝三星 8nm
顯示卡
中階GPUGeForce RTX 3050
GeForce RTX 3050 Ti
GeForce RTX 3060
高端GPUGeForce RTX 3060 Ti
GeForce RTX 3070
GeForce RTX 3070 Ti
旗艦GPUGeForce RTX 3080
GeForce RTX 3080 Ti
GeForce RTX 3090
GeForce RTX 3090 Ti
API支援
Direct3DDirect3D 12 Ultimate(12_2)
OpenGLOpenGL 4.6
OpenCLOpenCL 3.0
VulkanVulkan 1.3
歷史
前代產品NVIDIA GeForce 20系列
後繼產品NVIDIA GeForce 40系列

NVIDIA GeForce RTX 30系列NVIDIAGeForce RTX 20系列之後開發的圖形處理器系列。於2020年9月1日正式發佈,並於2020年9月17日開始發貨[1]

GeForce 30系列圖形處理器基於安培微架構,擁有第二代光線追蹤核心和第三代張量核心,Nvidia稱其運行效能和能效約為之前圖靈微架構圖形處理器的兩倍[1][2],使用三星電子8奈米工藝製造。

架構特性[編輯]

在上一代圖靈架構,引入了分數據類型計算的理念,將整數型(INT32)和單精度浮點型(FP32)兩種不同的數據類型交給兩種不同的ALU進行計算,提高了SM單元的並行計算效率。不過現代遊戲應用中最為常見的還是FP 32計算,INT 32 ALU的使用率比FP 32 ALU的低。為提升計算效率,新一代安培架構引入了可同時支援INT 32和FP 32兩種數據類型的新ALU,取代了原本只支援INT 32計算的ALU。也就是說,現在有兩條不同的數據路徑(Datapath),一條能夠處理整數或單精度浮點,另一條只能處理單精度浮點計算。原本整個SM單元同時可以處理64個INT 32計算指令和64個FP 32計算指令,安培上則是變成128個FP 32計算指令或64個INT 32計算指令和64個FP 32計算指令。為配合規模有一定擴張的計算單元,安培SM的共享快取/L1數據快取容量從96KB增長到了128KB,同時其帶寬變為原來的兩倍。

第二代RT Core[編輯]

安培微架構的RT Core(Ray Tracing core,光線追蹤核心)在圖靈架構的基礎上將三角形求交模組數量增加到兩個(以並行方式運作),在基礎的BVH計算上面,新一代RT Core也能夠快上2倍。同時,第二代RT Core還增加了一個三角形位置內插模組,在允許BVH內的數據做少量更新的情況下,就能實現移動物體運動模糊效果的顯著效能提升。在OptiX 7.0 中,開發人員可以為幾何體指定特定的移動路徑,讓每條射線和時間關聯起來,從而實現移動物體的所有運動模糊效果加速。

第三代Tensor Core[編輯]

Tensor Core(張量核心)是專門針對深度學習加速設計的矩陣運算單元,可以執行基於深度學習的應用,例如光線追蹤降噪和DLSS抗鋸齒彩現。圖靈中每個SM都配有8個Tensor Core(每個子核有兩個Tensor Core),每個Clock(週期)可以執行512個FP16 Tensor操作。而在安培架構,每個SM裡有4個Tensor Core(每個子核有一個Tensor Core),但是每個Tensor Core的處理能力倍增,因此每個SM也能執行512個FP16 Tensor操作。

第三代Tensor Core引入了BF16、TF32 兩種新的數據格式,並引入硬體稀疏化技術,操作的能力上增加一倍達到等效每週期1024 個FP16 操作。

產品[編輯]

型號 推出日期 核心代號 製程 電晶體數
&
晶粒面積
核心組態[a] 二級暫存(MB) 時脈頻率 顯示記憶體 填充率 運算效能 (TFLOPS) 匯流排介面 TDP (W) NVLink支援 發售價格 (美金)
預設 (MHz) 加速 (MHz) 記憶體 (MT/s) 容量 (GiB) 頻寬 (GB/s) 類型 介面頻寬 (bit) 像素 (GP/s) 材質 (GT/s) 單精度 雙精度 半精度 張量 (FP16) 光追
GeForce RTX 3050 2022年1月27日 GA106-150-KA-A1 三星
8N
133億

276mm2

2560:80:32:80:28
(20) (3)
2 1552 1777 14000 8 224 GDDR6 128 49.6
56.86
124.1
142.2
7.946
9.098
0.124
0.142
7.946
9.098
PCIe 4.0
x8
130 $249
GeForce RTX 3060[3] 2021年
2月25日
GA106-300-A1 3584:112:48:112:28
(28) (3)
3 1320 15000 12 360.0 192 63.4

85.3

147.8

199.0

9.46

12.74

0.148

0.199

9.46

12.74

25 PCIe 4.0

x16

170 $329
2021年
9月1日
GA104-150-A1[4] 174億

392.5mm2

GeForce RTX 3060 Ti[5] 2020年
12月2日
GA104-200-A1 4864:152:80:152:38
(38) (6)
4 1410 1665 14000 8 448.0 256 112.8

133.2

214.3

253.1

13.72

16.20

0.214

0.253

13.70

16.20

?

129.6

32 200 $399
GeForce RTX 3070[6] 2020年
10月29日[7]
GA104-300-A1 5888:184:96:184:46
(46) (6)
1500 1725 144.0

165.6

276.0

317.4

17.66

20.31

0.276

0.318

17.66

20.37

141.31

162.98

40[8] 220 $499
GeForce RTX 3070 Ti[9] 2021年
6月10日
GA104-400-A1 6144:192:96:192:48
(48) (6)
1575 1770 9500 (19000)[b] 608.3 GDDR6X 151.18

169.9

302.36

339.8

19.35

21.75

0.302

0.340

19.35

21.75

290 $599
GeForce RTX 3080[10] 2020年
9月17日
GA102-200-KD-A1 283億

628.4mm2

8704:272:96:272:68
(68) (7)
5 1440 1710 10 760.0 320 138.2

164.2

391.68

465.12

25.07

29.77

0.392

0.465

25.06

29.76

200.54

238.14

58 320 $699
GeForce RTX 3080 Ti[11] 2021年
6月3日
GA102-225-A1 10240:320:112:320:80
(80) (7)
6 1395 1665 12 912.4 384 153.5

186.5

438.5

532.8

28.57

34.71

0.438

0.533

28.06

34.10

350 $1199
GeForce RTX 3090[12] 2020年
9月24日
GA102-300-A1 10496:328:112:328:82
(82) (7)
1395 1695 9750 (19500)[b] 24 935.8 156.2

189.8

457.6

555.96

29.28

35.58

0.459

0.558

29.38

35.68

235.08

285.48

69[8] 350 2路 NVLink $1499
GeForce RTX 3090 Ti[13] 2022年

3月22日

GA102-350-A1 10752:336:112:336:84

(84)(7)

1560 1860 10500

(21000)

1008 174.7

208.3

524.1

625.0

33.54

39.99

0.524

0.625

33.54

39.99

320 450 $1999
  1. ^ 流處理器數量:紋理對映單元數量:彩現輸出單元數量:張量核心數量:光線追蹤核心數量(SM數量)(GPC數量)。面向非專業用途的Ampere架構中每個GPC由16個ROP及最多12個SM組成,每個SM固定包括128個流處理器(單精度浮點處理器)、64個32位元長整型處理器、4個TMU、4個張量核心和1個光線追蹤核心;GA100核心的浮點處理器組態則略有不同,參見NVIDIA Tesla
  2. ^ 2.0 2.1 類似於早已在快閃記憶體行業應用的MLC技術,GDDR6X一次存取可以操作兩個位元,括號內用於比較GDDR6的等效傳輸速率

另見[編輯]

參考文獻[編輯]

  1. ^ 1.0 1.1 GeForce Special Event. 輝達. [September 1, 2020]. (原始內容存檔於2020-09-02). 
  2. ^ Walton, Jarred. Nvidia GeForce RTX 3090 and GA102: Everything We Know. Tom's 硬體指南. August 31, 2020. 
  3. ^ NVIDIA GeForce RTX 3060 Graphics Card Announcement. [2021-01-12]. (原始內容存檔於2022-02-26). 
  4. ^ Mujtaba, Hassan. Custom GALAX & Gainward GeForce RTX 3060 Cards With NVIDIA Ampere GA104 GPUs Listed. Wccftech. 2021-09-25 [2021-09-25]. (原始內容存檔於2021-11-13) (美國英語). 
  5. ^ NVIDIA GeForce RTX 3060 Ti Graphics Card. [2020-12-01]. (原始內容存檔於2021-01-12). 
  6. ^ NVIDIA GeForce RTX 3070 Graphics Card. [2020-09-06]. (原始內容存檔於2021-05-14). 
  7. ^ GeForce RTX 3070 Availability Update. [2021-11-13]. (原始內容存檔於2022-01-11). 
  8. ^ 8.0 8.1 Smith, Ryan. NVIDIA Announces the GeForce RTX 30 Series: Ampere For Gaming, Starting With RTX 3080 & RTX 3090. www.anandtech.com. [2020-09-02]. (原始內容存檔於2022-01-12). 
  9. ^ NVIDIA GeForce RTX 3070 Family. [2021-06-02]. (原始內容存檔於2022-02-26). 
  10. ^ NVIDIA GeForce RTX 3080 Graphics Card. [2020-09-06]. (原始內容存檔於2021-05-19). 
  11. ^ NVIDIA GeForce RTX 3080 Family of Graphics Card. [2021-06-02]. (原始內容存檔於2022-03-01). 
  12. ^ NVIDIA GeForce RTX 3090 Graphics Card. [2020-09-06]. (原始內容存檔於2022-02-26). 
  13. ^ 3090 & 3090 Ti 顯示卡. www.nvidia.com. [2022-05-12]. (原始內容存檔於2022-05-12) (中文(臺灣)). 

外部連結[編輯]