紧接上月上市的旗舰级「GeForce RTX 2080 Ti」与高端级「GeForce RTX 2080」之后,NVIDIA再发佈全新中端级的「GeForce RTX 2070」,同样基于全新 NVIDIA「Turing」GPU架构,它是十多年来 GPU 最大的架构跃进,包括新增 Tensor 核心、RT 核心及许多新的进阶著色功能,透过全新硬件加速引擎及混合渲染技术,能实时提供光线追踪渲染,提供更逼真的物体阴影、反射及折射效果,除了性能表现进一步提升外,更将 PC 游戏真实感带进另一个层次。
与 NVIDIA「Turing」GPU 架构开发并行,Microsoft 已在全新Windows 10 1809版本中加入了 A.I 人工智能及 DXR 光线追踪的 DirectML API,令游戏开发人员可以快速部署 A.I 人工智能技术与光线追踪于新游戏中,融合光栅化、实时光线追踪、人工智能和模拟,在 PC 游戏中实现令人难以置信的真实感,提供惊人的新效果、电影级交互式体验和流畅创建或导航複杂 3D 模型的交互性。
此外,全新「Turing」GPU 还继承了「Volta」架构中所有增强的「CUDA」功能,例如独立线程调度、针对多个 CUDA 应用的地址空间隔离 MPS 硬件加速能力以及全新的协作加速,令新一代 GeForce RTX 的「CUDA」运算能力更灵活、性能更强大。
有别于以往 GTX 1070 与 GTX 1080 是基于相同核心,透过屏蔽运算单来划分市场区间,全新「GeForce RTX 2070」改用上「TU106」绘图核心,相较「TU104」核心内建136亿个晶体管数、核心面积约为 545mm²,全新「TU106」绘图核心缩减至108亿个晶体管数、核心面积约为 445 mm²,有效降低了晶片生产成本。
架构方面,NVIDIA「TU106」绘图核心并非完全由「TU104」按比例作出缩减,内部单元的比例作出了相应的调整,完整的「TU106」绘图核心内含 3 个 GPC 图形处理,24 个 TPC 纹理处理及 36 个 SM 串流多处理器,但删除了NVLink多卡能力。
每个 GPC 内拥有一组独立的 Raster Engine 光栅处理引擎及 6 个 TPC 纹理处理,每个 TPC 群集包含 2 个 SM 模组,每个 SM 内建 64 个 CUDA Cores、8 个 Tensor Cores、1 个 RT Cores、256KB Register File 及 4 个 Texture Units,并拥有 96KB L1 Cache/Shared Memory 可因应运算或图形工作负载作出可改变的配置。
每个 SM 单元具备两个 FP64 运算单元,总数合共 96 个 FP64 运算单元,但图中并没有标示出来,它的作用是确保 FP64 代码的程式可以正常运作,但并非主要的硬件运算单元。
内建 8 个 32 bit GDDR6 内存控制器、总共 256bit 内存带宽,每个内存控制器绑定 8 个 ROP 单元及 512KB L2 Cache,合共拥有 64 个 ROP 单元及 4,096KB L2 Cache。
閱讀更多 浪險電競 的文章