新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

NVIDIA繼先前GTX 700系列中階卡之後,直到近半年後的今天才發表Maxwell高階顯卡GTX 980與GTX 970。至於GTX 800系列目前將只有GTX 880M等筆電顯示晶片,桌上型則是跳過800系列直接進入900世代。

GeForce GTX 980與GTX 970

從定位來說GTX 980無疑將成為桌上型最頂級的顯卡,當然這是先排除兼作運算的GTX TITAN系列。規格上而言,GTX 980擁有當下最完整的Maxwell架構核心,共計有2048個CUDA Core,電晶體總數則是達到52億。至於第二高階的GTX 970則是有1664個CUDA Core,核心規模明顯低於GTX 980,電晶體則是亦為52億個,這是因為GTX 970是由GTX 980精簡而來,屏蔽了其中3組Streaming Multiprocessors,因而帳面電晶體數量相同。

嚴格來說,這次的GTX 980與GTX 970是先前MAxwell架構的延伸,雖新增部分新功能如MFAA、DSR,但在硬體架構上與先前GTX 750 Ti等十分相似。最重要的價格方面,GTX 980將為549美元,折合新台幣約16551元,GTX 970則是329美元,折合新台幣約9918美元。但此價格並非台灣實際通路的終端售價,有一說GTX 970市場售價約在14900元左右。同一時間,GTX 760將降價到219美元,折合新台幣約6602元,若有中階卡採購需求不妨等等。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

GTX 980將接替GTX 780 Ti成為桌上型最高階的遊戲顯示卡,搭載的核心為Maxwell架構。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

GTX 970規格僅次於GTX 980,兩者除時脈、核心規模外其餘幾乎完全相同。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

Maxwell完整架構圖,最高階的GTX 980共有16個SMM,GTX 970則只有13組SMM。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

每組SMM有32個CUDA Core,亦即有32個執行緒可同時運作。此設計與GTX 750 Ti使用的架構相同。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

記憶體壓縮技術也是這次的重點項目,共有二比一、八比一等壓縮方式,可減少Frame Buffer的需求容量,並增加傳輸時的傳遞效率,可減少記憶體頻寬的瓶頸。

增加流暢的MFAA多幀採樣反鋸齒

這次搭載的諸多功能中,MFAA僅適用於新一代Maxwell架構的GTX 980等顯卡,牽涉到核心架構的設計。據稱是新核心具備可編程多重像素點的能力,可改變採樣點的位置,官方表示無法透過驅動程式的處理下放到舊顯卡上。MFAA(Multiframe Sampled AA)中文譯為多幀採樣反鋸齒,理念上與MSAA(Multi Sampling AA,多重採樣反鋸齒)相近,兩者皆為透過增加採樣點的方式提升影像反鋸齒的能力。

在傳統的4倍MSAA中,每個Frame的每個像素有4個採樣點,而MFAA則會透過硬體運算的方式,在相鄰的2個Frame作整合運算,每Frame的像素只有2個採樣點。透過前後Frame的比對與運算,實際輸出的影像則會有近似4個採樣點的MSAA(意即4倍MSAA)的呈現效果,但由於每個像素只有2個採樣點,因而運算需求會低於MSAA。每個像素2個採樣點的MFAA稱為4倍MFAA,是因為其實際輸出的效果近似4倍MSAA,官方因而決定稱為4倍MFAA而非2倍MFAA。官方數據顯示MFAA約有MSAA近30%的效能提升。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

越多採樣點能讓影像更平滑,但相對地也更需要硬體運算資源。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

MFAA分別於前後Frame設置採樣點,輸出後的效果能接近單像素2倍採樣點數量的MSAA。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

4倍MSAA與4倍MFAA達到的效果十分接近,但MFAA每個Frame使用的採樣點較少,因而能減少運算資源的需求。

提升畫質的DSR動態超解析度

相較於提升流暢度的MFAA,DSR則是用於提升遊戲畫質,其中DSR是Dynamic Super Resolution的縮寫,中文譯為動態超解析度。聽起來似乎很複雜,但白話點來說可視為將4K解析度的影像放置於1080p解析度的螢幕上,藉此提升影像的繪製效果。實作上會在影像渲染時預先渲染較高的解析度,再透過高斯濾鏡的方式呈現,例如1080p影像預先渲染成4K。

其實早先亦有Supersampling採用類似的作法,但NVIDIA認為其DSR技術能再相容性與穩定度上表現更好。NVIDIA認為其DSR與過去Supersampling的作法相比,能夠真的看出影像上的差異而非理論。未來可透過驅動程式更新讓部分舊核心支援該功能,並可由GEForce Experience中進行設定。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

DSR就像是把高解析度的影像塞到低解析度的螢幕中,透過渲染與濾鏡處理後得到更好的呈現效果。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

傳統1080p模式下,可看到雜草的渲染斷斷續續。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

若開啟DSR,雜草的渲染會更加平順,主要差別在於前端渲染的精細度差異所致。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

這是1080p環境下雜草渲染的採樣圖,可看到中間因為採樣不精確的關係,導致雜草斷斷續續。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

右側為高解析度渲染所使用的採樣方式,因為採樣點增加而讓渲染的物體更加接近真實狀況。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

左為預設狀況,右為開啟DSR,左方雜草可看出斷斷續續的狀態。由於靜態圖片看不太出來差異,若遊戲的動態效果會更明顯。

VXGI模擬阿波羅11登月艇

第三個比較重要的功能則是VXGI(Voxel Global Illumination,暫譯體素全局照明),光線在3D模擬當中是水體、毛髮之外的重要課題之一。過去也有光線追蹤即Ray Tracing等模擬方式,事實上模擬出來的效果的確相當出色,但問題在於效率太低,需要龐大的運算資源。玩過類似模擬器的人應該都知道,光線追蹤的3D模組中,為了模擬光線的折射與反射需要花費大量資源,可能模擬好了想要轉個角度觀看,又要花個數秒去模擬,更不用說實際運作在遊戲上。

附帶一提,Pixel指的是2D的像素,而Voxel則是3D的體素,VXGI記錄了每個Voxel的光線資訊,藉此達到更好的光線呈現效果,預計今年晚些時候會看到遊戲引擎支援該技術,該技術會由開發者與NVIDIA共同合作開發。NVIDIA為此也特地做出阿波羅11登月艇的DEMO。

VXGI之所以能提升光線的呈現效果,其實NVIDIA偷偷取了捷徑。大家都知道光源可以想像成由無線多條光線組成,若要一一模擬就會變成Ray Tracing那樣複雜的運算量。VXGI搭配的是Cone Tracing技術,簡單來說就是把光源從線變成數個圓錐,藉此降低運算量並依照硬體效能調整圓錐大小(改變呈現真實度),雖然Cone Tracing無法如Ray Tracing逼真,但算是目前兼顧效能與效果的折衷方案。


新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

VXGI仍未實際運作於當下的遊戲,預計年底的UE4引擎將會採用該技術。

新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

Cone Tracing是模擬光線的技巧之一,透過調整圓錐的大小,可改變模擬的真實度。越大則越接近無限多的光線,但也越吃資源。




新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI



新一代Maxwell架構,NVIDIA GTX 980、GTX 970支援MFAA、DSR、VXGI

延伸閱讀