NVIDIA“惡補”顯卡這門課

憑藉AI人工智能,這家顯卡公司的股價在過去的三年飆漲至少10倍,並在2018年10月創下股價歷史最高點——每股289.36美元,市值一度超過IBM和麥當勞。

然而高潮過後,滑鐵盧式的股價大跌讓NVIDIA不得不面對現實,顯卡始終是其主要收入來源,AI也並不能讓其擺脫“顯卡公司”的標籤。

隨著AI、挖礦、數字貨幣熱潮的褪去,NVIDIA也“冷靜”下來,AI是未來,這固然重要,但是顯卡在NVIDIA“心”中的地位依舊不可撼動,全球第一顯卡廠商NVIDIA開啟了顯卡在遊戲領域的新一輪佈局。

NVIDIA“恶补”显卡这门课

老黃的未來 光線追蹤技術深度解析

2018年8月,新一代Turing圖靈架構顯卡在德國科隆遊戲展前首次亮相,老黃(NVIDIA創始人兼CEO黃仁勳)手中拿起了他的全新“核彈”——RTX 2080Ti。

NVIDIA“恶补”显卡这门课

隨後的日子裡,NVIDIA陸續推出了搭載圖靈架構的RTX 2080/2080Ti、RTX 2070、RTX 2060、GTX 1660/1660Ti、GTX 1650桌面級顯卡,以及RTX 2080、RTX 2070、RTX 2060、GTX 1660Ti、GTX 1650移動端顯卡。

提起新一代圖靈架構顯卡,就不得不提老黃的“光追大計”。自首次提出後,“光線追蹤”便成為了顯卡和遊戲行業的高頻詞彙,“光追是未來”似乎已經成為了一個肯定的結論。

什麼是光線追蹤?目前網上對於它的相關解釋已經非常多了,從實際遊戲角度來說光線追蹤是一種能夠有效改善/提升遊戲畫面品質的技術,能夠為遊戲玩家提供更加真實的光影效果,沉浸感更強,其直觀效果有點類似HDR技術,而光線追蹤與HDR的結合也將成為未來遊戲硬件的最優解決方案之一。

NVIDIA“恶补”显卡这门课

為了讓現階段用戶更好享受光線追蹤帶來的遊戲增益,NVIDIA同時推出了兩項核心技術RT Core和DLSS,RT Core簡單來說是NVIDIA專為光線追蹤打造的一個處理核心,其可以讓遊戲畫面發生質的改變,但對硬件性能要求很高;而DLSS是在硬件性能無法達到要求時提供的AI算法優化,通過Tensor Core(張量計算核心,針對AI深度學習)提升遊戲性能,二者互補。

RT Core:專為光線追蹤計算服務

NVIDIA方面表示,此前不支持光線追蹤時,顯卡是不需要提供與光線追蹤相關的BVH(Bounding Volume Hierarchy)算法的,因此以前光線追蹤方面相關的算法都是通過CUDA核心來實現的;而如今,光線追蹤的加持會讓這部分算法量級顯著增加,成為顯卡核心中的重點之一,NVIDIA為此專門設計了RT CORE來完成這項工作。

在遊戲的3D世界中,每一個物體都是由三角形組成的(3D世界中,三角形是最基本的圖形),RT Core要去計算光線和三角形的交匯點,並判斷光線如何反射。同時,在自然界中光線數量是無數條的,而計算機不可能完全模擬現實世界的光影,但它卻會盡可能模擬更多的光線,只有當光線數量足夠多的時候,最後輸出的遊戲畫面才會越平滑,噪點也會越少。此外,這其中還會融入很多AI降噪技術以實現更接近現實世界的光影。

每個遊戲光線追蹤的應用效果都不同

值得一提的是,光線追蹤在不同遊戲中的應用效果是不一樣的,“我們現在其實是一個混合渲染”,NVIDIA方面強調,“有部分場景應用了光線追蹤反射(高級反射和普通反射,其中高級反射會反射很多次,需要更大的計算力)、陰影的效果,但是有些地方還是用以前傳統的光柵化方式,擁有很多不同的模式。我們追求的是畫面顯示效果和最終性能的平衡,在不同遊戲中游戲開發商也可以選擇加入不同光線追蹤的效果,每一個遊戲都不太一樣。”

NVIDIA“恶补”显卡这门课

不同光線追蹤效果的應用往往影響遊戲對於顯卡性能的要求,目前NVIDIA提供的主要光線追蹤效果包括全局光照、反射、陰影、環境光遮蔽等,其中全局光照能夠把整個遊戲場景渲染得更逼真,也是對顯卡性能要求是最高的光線追蹤效果。

已經上市的幾款支持光線追蹤的遊戲中,《地鐵:離去》採用的便是全局光照,這是目前光影效果營造比較好的遊戲之一,但是對於硬件性能要求也極高。“GTX顯卡基本運行不了,GTX 1080Ti只有16幀,而RTX 2060則可以跑到30幀以上,可以運行”,NVIDIA產品經理解釋道。

《戰地 V》融入的光線追蹤效果只是反射(包括高級反射),其展現的效果包括水面、汽車、以及武器上的反射等;而《古墓麗影:暗影》只採用了陰影,雖然陰影的計算量也很大,但是其帶來的直觀感受並沒有反射那麼震撼,這也是很多遊戲玩家表示其光影效果展示並不是很好的主要原因。而即將支持光線追蹤的《原子之心》則採用了反射和陰影兩大效果。

NVIDIA“恶补”显卡这门课

從目前NVIDIA提供的解決方案來看,針對多重複雜光線追蹤效果和光線數量較多的遊戲,NVIDIA推薦顯卡為RTX 2060及以上,而對於基礎光線追蹤效果或者光線數量較少的遊戲,NVIDIA推薦顯卡則為採用帕斯卡或圖靈架構的GTX顯卡,以及VOLTA架構的TITAN V顯卡。而DLSS技術也將幫助一些性能不足的顯卡提供光線追蹤方面的優化。

DLSS(深度學習超級採樣):性能不足時的補償

對於DLSS,NVIDIA給出的解釋是,DLSS的收益是和遊戲幀數成反比的,當顯卡的性能較差時DLSS會提供更好的效果。簡單來說,DLSS是NVIDIA針對硬件性能不足時提供的一種AI算法優化。

舉個例子,一款遊戲在2K分辨率開光線追蹤後的遊戲幀數只有30幀,無法流暢有運行,此時開啟DLSS後顯卡會將遊戲原始的分辨率降低以提升遊戲幀數,並通過Tensor Core把降低的這部分分辨率補回來,最終實現性能提升。

NVIDIA“恶补”显卡这门课

NAS:更節省Shader資源的圖像渲染

此外,NAS(自適應著色技術)的加持也能夠顯著提升遊戲性能。我們知道圖像渲染是需要利用Shader(著色器,集成於DX12)中的資源,一個畫面裡並不是所有的部分都需要用百分之百的精度去做渲染,比如陰影部分用百分之百的精度和百分之八十的精度看上去沒什麼區別。NAS技術便是根據每一幀畫面中的場景利用不同的精度做渲染,在保證輸出圖像和原始畫質完全相同的前提下節省了40%左右的Shader資源,以實現遊戲性能的顯著提升。

圖靈架構GTX顯卡:電競類遊戲的深度佈局

不同以往,NVIDIA將圖靈架構顯卡劃分了兩條產品線——RTX和GTX,二者顯著差異就是RTX是搭載RT Core和Tensor Core兩個硬件加速核心,而GTX沒有。

這遭到了很多網友的質疑,“既然光線追蹤這麼好,NVIDIA為什麼還要將RT Core和Tensor Core拿掉?”

顯然,這是NVIDIA的又一策略。市場調研數據顯示,目前PC端最火的五款遊戲分別為《英雄聯盟》、《CS:GO》、《堡壘之夜》、《絕地求生》、以及《守望先鋒》,這些遊戲大多都是電競類遊戲。

這些遊戲的共同特點是,沒有加入過多的新技術,但玩家數量又非常龐大,而且對遊戲硬件要求也不是很高,可能很老的平臺遊戲幀數也很高,NVIDIA希望通過技術上的改進讓這類遊戲玩家(電競選手)獲得更多利益。

NVIDIA“恶补”显卡这门课

NVIDIA顯卡產品經理表示,“對於所有電競選手來說,遊戲響應延遲是非常關鍵的,因為他們每一個操作都非常迅速,基本上每200毫秒就會有新操作(正常人大概是300毫秒),他們需要更低延遲的畫面。為此,電競選手需要兩大硬件支持,一是更快、延遲更低的顯卡,而是更高刷新率的顯示器。

舉個簡單的例子,《CS:GO》在英特爾核顯、和NVIDIA以前老顯卡GTX 750Ti都能夠流暢運行,但是相比目前圖靈架構的GTX顯卡,還是有很大延遲的,這會對玩家的遊戲成績造成影響。

同時,NVIDIA的調研報告顯示,隨著時間的積累,電競遊戲玩家在更好的硬件支持下能夠更快的提升遊戲成績,硬件越好,遊戲成績提升的幅度也越大。不過,每個人的情況都有所不同,但總體趨勢是這樣。

NVIDIA表示,儘管GTX系列顯卡沒有加速核心,但是它依然屬於圖靈架構,依然可以獲得圖靈架構帶來的遊戲增益。

以《古墓麗影:暗影》為例,遊戲過程中每100個指令集裡大概有38個是做整數的,62個是做浮點的。如果用以前帕斯卡架構顯卡來做處理,它的整數和浮點是沒有辦法同步執行的,只能先做浮點,再做整數,在做浮點的時候,整數的那部分就要閒置,這無疑是浪費時間。在新的圖靈架構中,GTX 1660Ti只需要62個指令就可以把所有100個指令全部完成,實際執行效率提升38%,一定程度上提升了遊戲性能。

NVIDIA“恶补”显卡这门课

圖靈架構移動端GTX顯卡:性能全面提升的新遊戲平臺

2019年4月23日對於科技圈來說註定是一個不平凡的日子,NVIDIA圖靈架構GTX移動端顯卡與Intel第九代酷睿移動端處理器的同時解禁,令全球遊戲玩家能夠同時享受到新處理器和新顯卡帶來的全面遊戲性能提升,而遊戲本的基礎性能也將被帶入一個新的高度。

NVIDIA公佈的數據顯示,全新圖靈架構移動端顯卡GTX 1660Ti擁有媲美GTX 1070的性能,但是卻支持更多的新技術(包括DXR光線追蹤),並擁有更低的功耗。

對於《絕地求生》、《堡壘之夜》、《Apex》這類遊戲,GTX 1660Ti在遊戲本1080P分辨率高畫質下都能跑到100幀以上,能夠帶來非常良好的遊戲體驗,相比GTX 1060擁有30%左右的提升。

NVIDIA“恶补”显卡这门课

在與帕斯卡架構GTX 1060顯卡遊戲性能對比的數據中,移動端GTX 1660Ti顯卡在新遊戲上的性能表現會更出色,越是新發布的遊戲,圖靈架構領先的百分比越高。當然,2015年的老遊戲也有很多人玩,但是隨著時間的推移,遊戲玩家更多的都會去玩新遊戲,而圖靈架構會因此帶來更多的遊戲性能收益。

NVIDIA“恶补”显卡这门课

圖靈架構中,NVIDIA還更新了直播部分的一個編碼,該編碼可以在不影響CPU性能的前提下提供更優秀的直播畫質。實際體驗過程中,CPU佔用率只有2%,也不會額外佔用顯卡資源,而這完全仰仗於圖靈架構中的一個專門的Encoder(解碼器)。

OPTIMUS也是新一代圖靈架構筆記本中非常棒的技術加持,OPTIMUS技術可以幫助遊戲玩家在遊戲和視頻上網模式下自由切換獨顯和核顯,令日常上網等模式能夠自動關閉GEFORCE、獨顯,選擇核顯,進入省電模式,帶來更持久的續航時間。

此外,另一款入門級移動端顯卡GTX 1650相比GTX 950M擁有2倍的性能提升,相比臺式機GTX 1050擁有1.7倍的性能提升,主流遊戲都可以達到60幀,適合入門級玩家。

NVIDIA“恶补”显卡这门课

NVIDIA表示,搭載全新圖靈架構GTX 1660Ti顯卡的遊戲本是針對三到四年遊戲本更換週期推出的產品,相比之前的GTX 960M,GTX 1660Ti擁有大約4倍的性能提升,同時處理器、內存、硬盤、以及屏幕刷新率都有了大幅度提升,機身也更加輕薄。


分享到:


相關文章: