跳至內容

圖靈微架構

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
Nvidia Turing
發佈日期2018年9月20日 (2018-09-20)
製造工藝台積電 12 nm (FinFET)
歷史
前代產品
後繼產品安培[1]
艾倫·圖靈(Alan Turing)的相片

圖靈微架構(英語:Turing microarchitecture),是由輝達公司(nVIDIA)所開發的一種GPU微架構,用以取代伏打微架構(Volta microarchitecture)。命名為「圖靈」以向英國電腦科學家艾倫·圖靈(Alan Turing)致敬。這個微架構於 2018 年 8 月在 SIGGRAPH 2018 年會上首次在面向工作站的 Quadro RTX 卡中推出[2], 並於一周後在 科隆遊戲展(Gamescom)上在消費類 GeForce RTX 20 系列顯示卡中推出[3]。圖靈微架構以​​其 HPC 專有前身的前期工作為基礎,推出了首款能夠實現即時光線追蹤的消費產品,這是電腦繪圖產業的長期目標。關鍵要素包括專用人工智能處理器("Tensor cores")和專用光線追蹤處理器("RT Cores")。 圖靈微架構利用 DXR、OptiX 和 Vulkan 來存取光線追蹤。 2019年2月,Nvidia發表了NVIDIA GeForce 16系列GPU,採用了新的圖靈設計,但缺乏光線追蹤(RT)和張量(Tensor)核心。

圖靈微架構採用台積電12 nm FinFET 半導體製造製程。 高階 TU102 GPU 包括使用此製程製造的 186 億個電晶體。 圖靈微架構也使用三星電子 (Samsung Electronics) 和先前的美光科技 (Micron Technology) 的 GDDR6 記憶體。

細節資訊

[編輯]
RTX 2080 卡中使用的 TU104 GPU 的晶片拍攝圖
RTX 2060 卡中使用的 TU106 GPU 的晶片拍攝圖
RTX 1660 卡中使用的 TU116 GPU 的晶片拍攝圖

圖靈微架構結合了多種類型的專用處理器核心,並實現了即時光線追蹤技術(儘管大多數仍限於對物理建模的材質、室內反射和照明)[4]。這得益於新的 RT 核心的使用,這些核心被設計用於處理四叉樹和球形階層,並為單個三角形的碰撞測試提速。

圖靈微架構的特性包括:

  • CUDA 核心(串流多處理器)
    • 計算能力(Compute Capability):7.5
    • 傳統的柵格化着色器和計算
    • 整數和浮點操作的並列執行(繼承自伏打微架構)
  • 光線追蹤(RT)核心
    • 層次包圍體結構(Bounding Volume Hierarchy)加速[5]
    • 陰影、環境光遮蔽、照明、反射
  • 張量(AI 中的 Tensor)核心[6]
  • GDDR6/HBM2 支援的主記憶體控制器
  • 帶有顯示壓縮流(DSC 1.2)技術的 1.4a 版本 DisplayPort 介面
  • 支援使用 PureVideo 技術的 Feature Set J 來進行硬件加速的影片解碼
  • GPU Boost 4
  • 支援通過 NVLink Bridge 實現多個顯示卡的連接,並使用 VRAM 堆疊的方式匯集多個顯示卡的主記憶體
  • VirtualLink 標準虛擬實境
  • NVENC(NVIDIA Encoder)硬件編碼引擎

GDDR6 主記憶體由三星電子為 Quadro RTX 系列生產[7]。RTX 20 系列在最初發佈時使用美光的主記憶體晶片,在 2018 年 11 月換為三星晶片[8]

柵格化(Rasterization)

[編輯]

NVIDIA 報告稱,在現有的軟件標題中,柵格化(使用 CUDA 技術)的效能相較於前一代提升了大約 30-50%[9][10]。這表示圖靈架構的 NVIDIA GPU 在處理現有軟件時,通過柵格化技術取得了相當可觀的效能提升,提高了圖形處理的效率。

光線追蹤(Ray-tracing)

[編輯]

RT 核心執行的光線追蹤可用於生成反射、折射和陰影,從而取代一些傳統的柵格技術,如立方體貼圖(Cube maps)和深度貼圖(Depth maps)。需要注意的是,光線追蹤技術並非完全替代柵格化技術,光線追蹤收集到的資訊可以用於增強着色,使圖像更加寫實,特別是在處理攝像放像機視野之外發生的動作(off-camera action)時。NVIDIA 表示,光線追蹤效能相較上一代消費者架構 Pascal 提高了約 8 倍。

張量核心(Tensor cores)

[編輯]

利用張量核心,最終圖像的生成能夠得到進一步加速,這些核心用於填充部分彩現圖像中的空白,這一技術被稱為去噪(de-noising)。張量核心負責執行深度學習的結果運算結果,對處理特定任務的方法進行編碼,使得系統能夠理解和應用這些方法。這種編碼過程使得系統能夠更有效地執行某些任務,例如增加特定應用程式或遊戲生成圖像的解像度。在張量核心的主要用途中,需要解決的問題會在超級電腦上進行分析,該電腦通過範例學習期望的結果,確定實現這些結果的方法,隨後,這些方法通過驅動程式更新傳遞給消費者,最終由消費者的張量核心執行操作[9]。超級電腦本身使用了大量的張量核心。

圖靈晶粒(Turing dies)

[編輯]
圖靈晶粒的對比
晶粒 TU102 TU104 TU106 TU116 TU117
晶粒大小 754 mm2 545 mm2 445 mm2 284 mm2 200 mm2
電晶體數量 18.6B 13.6B 10.8B 6.6B 4.7B
電晶體密度 24.7 MTr/mm2 25.0 MTr/mm2 24.3 MTr/mm2 23.2 MTr/mm2 23.5 MTr/mm2
圖形處理叢集
(GPC)
6 6 3 3 2
流處理多處理器
(SM)
72 48 36 24 16
CUDA核心數 4608 3072 2304 1536 1024
紋理對映單元
(TMU)
288 192 144 96 64
彩現輸出單元
(ROP)
96 64 64 48 32
張量核心 576 384 288 不適用
光線追蹤核心 72 48 36
L1 快取 6.75 MB 4.5 MB 3.375 MB 2.25 MB 1.5 MB
96 KB per SM
L2 快取 6 MB 4 MB 4 MB 1.5 MB 1 MB
最大熱設計功耗
(Max TDP)
280 W 250 W 185 W 125 W 75 W

開發

[編輯]

圖靈微架構的開發平台是 RTX。可以通過 Microsoft 的 DXR(DirectX Raytracing),OptiX, 以及使用 Vulkan 拓展(最後者在 Linux 驅動上也可以使用)來呼叫 RTX 的光線追蹤功能[11]。AI 加速功能可以通過 NGX 整合到應用程式中[12]。網格着色器(Mesh Shader)和着色率圖像(Shading Rate Image)功能可以在 Windows 和 Linux 平台上使用 DX12、Vulkan 和 OpenGL 擴充來訪問[13]

Windows 10 在 2018 年 10 月的更新中包括了 DirectX 光線追蹤的公開發布[14][15]

採用圖靈微架構的產品

[編輯]
  • GeForce MX 系列
    • GeForce MX450 (Mobile)
    • GeForce MX550 (Mobile)
  • GeForce 16 系列
    • GeForce GTX 1630
    • GeForce GTX 1650 (Mobile)
    • GeForce GTX 1650
    • GeForce GTX 1650 Super
    • GeForce GTX 1650 Ti (Mobile)
    • GeForce GTX 1660
    • GeForce GTX 1660 Super
    • GeForce GTX 1660 Ti (Mobile)
    • GeForce GTX 1660 Ti
  • GeForce 20 系列
    • GeForce RTX 2060 (Mobile)
    • GeForce RTX 2060
    • GeForce RTX 2060 Super
    • GeForce RTX 2070 (Mobile)
    • GeForce RTX 2070
    • GeForce RTX 2070 Super (Mobile)
    • GeForce RTX 2070 Super
    • GeForce RTX 2080 (Mobile)
    • GeForce RTX 2080
    • GeForce RTX 2080 Super (Mobile)
    • GeForce RTX 2080 Super
    • GeForce RTX 2080 Ti
    • Titan RTX
  • Nvidia Quadro
    • Quadro RTX 3000 (Mobile)
    • Quadro RTX 4000 (Mobile)
    • Quadro RTX 4000
    • Quadro RTX 5000 (Mobile)
    • Quadro RTX 5000
    • Quadro RTX 6000 (Mobile)
    • Quadro RTX 6000
    • Quadro RTX 8000
    • Quadro T1000 (Mobile)
    • Quadro T2000 (Mobile)
    • T400
    • T400 4GB
    • T500 (Mobile)
    • T600 (Mobile)
    • T600
    • T1000
    • T1000 8GB
    • T1200 (Mobile)
  • Nvidia Tesla
    • Tesla T4

參考資料

[編輯]
  1. ^ Tom Warren; James Vincent. Nvidia’s first Ampere GPU is designed for data centers and AI, not your PC. The Verge. May 14, 2020 [2020-10-21]. (原始內容存檔於2020-12-08). New 「RTX 3080」 cards could be just months away then, but we still don’t know for sure if they』ll be using this new Ampere architecture. 
  2. ^ Smith, Ryan. NVIDIA Reveals Next-Gen Turing GPU Architecture: NVIDIA Doubles-Down on Ray Tracing, GDDR6, & More. AnandTech. August 13, 2018 [April 9, 2023]. (原始內容存檔於2020-04-24) (美國英語). 
  3. ^ Smith, Ryan. NVIDIA Announces the GeForce RTX 20 Series: RTX 2080 Ti & 2080 on Sept. 20th, RTX 2070 in October. AnandTech. August 20, 2018 [April 9, 2023]. (原始內容存檔於2018-08-21) (美國英語). 
  4. ^ Warren, Tom. Nvidia announces RTX 2000 GPU series with '6 times more performance' and ray-tracing. The Verge. August 20, 2018 [August 20, 2018]. (原始內容存檔於2018-08-20) (美國英語). 
  5. ^ Oh, Nate. The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. September 14, 2018 [April 9, 2023]. (原始內容存檔於2024-05-12) (美國英語). 
  6. ^ TENSOR CORE DL PERFORMANCE GUIDE (PDF). Nvidia. (原始內容存檔 (PDF)於2020-11-11). 
  7. ^ Mujtaba, Hassan. Samsung GDDR6 Memory Powers NVIDIA's Turing GPU Based Quadro RTX Cards. Wccftech. August 14, 2018 [April 9, 2023] (美國英語). 
  8. ^ Maislinger, Florian. Faulty RTX 2080 Ti: Nvidia switches from Micron to Samsung for GDDR6 memory. PC Builder's Club. November 21, 2018 [July 15, 2019]. 
  9. ^ 9.0 9.1 #BeForTheGame. Twitch. [2024-01-12]. (原始內容存檔於2023-03-30) (美國英語). 
  10. ^ Fisher, Jeff. GeForce RTX Propels PC Gaming's Golden Age with Real-Time Ray Tracing. Nvidia. August 20, 2018 [April 9, 2023] (美國英語). 
  11. ^ NVIDIA RTX platform. Nvidia. July 20, 2018 [April 9, 2023]. (原始內容存檔於2018-03-31) (美國英語). 
  12. ^ NVIDIA NGX. NVIDIA Docs. February 14, 2023 [2024-01-12]. (原始內容存檔於2024-04-16) (英語). 
  13. ^ Turing Extensions for Vulkan and OpenGL. Nvidia. September 11, 2018 [April 9, 2023] (美國英語). 
  14. ^ Pelletier, Sean. Windows 10 October 2018 Update a Catalyst for Ray-Traced Games. Nvidia. October 2, 2018 [April 9, 2023]. (原始內容存檔於2023-09-22) (美國英語). 
  15. ^ van Rhyn, Jacques. DirectX Raytracing and the Windows 10 October 2018 Update. Microsoft. October 2, 2018 [April 9, 2023] (美國英語). 

外部連結

[編輯]