緊接上月上市的旗艦級「GeForce RTX 2080 Ti」與高端級「GeForce RTX 2080」之後,NVIDIA再發佈全新中端級的「GeForce RTX 2070」,同樣基於全新 NVIDIA「Turing」GPU架構,它是十多年來 GPU 最大的架構躍進,包括新增 Tensor 核心、RT 核心及許多新的進階著色功能,透過全新硬件加速引擎及混合渲染技術,能實時提供光線追蹤渲染,提供更逼真的物體陰影、反射及折射效果,除了性能表現進一步提升外,更將 PC 遊戲真實感帶進另一個層次。
與 NVIDIA「Turing」GPU 架構開發並行,Microsoft 已在全新Windows 10 1809版本中加入了 A.I 人工智能及 DXR 光線追蹤的 DirectML API,令遊戲開發人員可以快速部署 A.I 人工智能技術與光線追蹤於新遊戲中,融合光柵化、實時光線追蹤、人工智能和模擬,在 PC 遊戲中實現令人難以置信的真實感,提供驚人的新效果、電影級交互式體驗和流暢創建或導航複雜 3D 模型的交互性。
此外,全新「Turing」GPU 還繼承了「Volta」架構中所有增強的「CUDA」功能,例如獨立線程調度、針對多個 CUDA 應用的地址空間隔離 MPS 硬件加速能力以及全新的協作加速,令新一代 GeForce RTX 的「CUDA」運算能力更靈活、性能更強大。
有別於以往 GTX 1070 與 GTX 1080 是基於相同核心,透過屏蔽運算單來劃分市場區間,全新「GeForce RTX 2070」改用上「TU106」繪圖核心,相較「TU104」核心內建136億個晶體管數、核心面積約為 545mm²,全新「TU106」繪圖核心縮減至108億個晶體管數、核心面積約為 445 mm²,有效降低了晶片生產成本。
架構方面,NVIDIA「TU106」繪圖核心並非完全由「TU104」按比例作出縮減,內部單元的比例作出了相應的調整,完整的「TU106」繪圖核心內含 3 個 GPC 圖形處理,24 個 TPC 紋理處理及 36 個 SM 串流多處理器,但刪除了NVLink多卡能力。
每個 GPC 內擁有一組獨立的 Raster Engine 光柵處理引擎及 6 個 TPC 紋理處理,每個 TPC 群集包含 2 個 SM 模組,每個 SM 內建 64 個 CUDA Cores、8 個 Tensor Cores、1 個 RT Cores、256KB Register File 及 4 個 Texture Units,並擁有 96KB L1 Cache/Shared Memory 可因應運算或圖形工作負載作出可改變的配置。
每個 SM 單元具備兩個 FP64 運算單元,總數合共 96 個 FP64 運算單元,但圖中並沒有標示出來,它的作用是確保 FP64 代碼的程式可以正常運作,但並非主要的硬件運算單元。
內建 8 個 32 bit GDDR6 內存控制器、總共 256bit 內存帶寬,每個內存控制器綁定 8 個 ROP 單元及 512KB L2 Cache,合共擁有 64 個 ROP 單元及 4,096KB L2 Cache。
閱讀更多 浪險電競 的文章