NVIDIA 技術行銷總監說明 GeForce GTX 1080 特色 導入嶄新技術大幅提升 VR 效能

NVIDIA 技術行銷資深總監尼克‧斯塔姆(Nick Stam),日前特別來台說明日前在美國發表、預定 5 月底上市的顯示卡新產品「GeForce GTX 1080」的特色與規格功能詳情,供玩家參考。

NVIDIA 技術行銷總監說明 GeForce GTX 1080 特色 導入嶄新技術大幅提升 VR 效能

NVIDIA 技術行銷總監說明 GeForce GTX 1080 特色 導入嶄新技術大幅提升 VR 效能

尼克‧斯塔姆介紹「GeForce GTX 1080」

GeForce GTX 1080 是採用 Pascal(帕斯卡)架構的 GeForce 10 系列首款產品,首度以 16 奈米 FinFET 製程製造,搭配 8GB GDDR5X 高速繪圖記憶體,可提供超越兩張 GeForce GTX 980 SLI 或單張 GeForce GTX TITAN X 的處理效能,是目前效能最高的 GeForce 系列顯示卡產品。

NVIDIA PC 事業部資深副總裁傑夫‧費雪(Jeff Fisher)表示:「PC 是全球用戶最喜愛的遊戲平台,而我們全新的 Pascal GPU 架構將 PC 推升至更高的境界。我們首款 Pascal 遊戲 GPU GeForce GTX 1080 不僅實現遊戲中極其逼真的場景與更身歷其境的沉浸式 VR 體驗,更顯著提升效能與能源效率。它不只是史上最強悍的遊戲 GPU,也是我們精心開發最優秀的作品之一。」

GeForce GTX 1080 採用的 Pascal 架構,搭載了以下的新技術:

新一代 GPU 架構:Pascal 針對每瓦效能表現進行優化,使 GeForce GTX 1080 的能源效率達到 Maxwell 架構的 3 倍以上

16 奈米 FinFET 製程:GeForce GTX 1080 是首款針對 16 奈米 FinFET 製程進行設計的遊戲 GPU,採用更小更快的電晶體,以更高的密度封裝至晶片內。GPU 內含 72 億個電晶體,能大幅提升效能表現與能源效率。

先進記憶體:Pascal 架構 GPU 率先採用美光公司 8GB GDDR5X 記憶體,搭配 256 位元記憶體介面,傳輸率高達 10Gbps,使記憶體頻寬效率較一般 GDDR5 高 1.7 倍。

極致工藝:頻寬與能源效率的提升讓 GeForce GTX 1080 的時脈提升至 1700MHz 以上,耗電僅有 180 瓦,只需要單一 8 Pin 額外電源供應即可運作。全新非同步運算模式增進能源效率與遊戲效能,全新 GPU Boost 3 技術則是支援更先進的超頻功能。

突破性遊戲技術:全新 NVIDIA VRWorks 軟體功能讓遊戲開發者得以將前所未有的臨場感帶入各種遊戲環境中。NVIDIA Ansel 技術讓遊戲玩家能以嶄新的方式分享自己的遊戲體驗以及探索遊戲世界。

尼克‧斯塔姆現場以 4 大主題來深入介紹 GeForce GTX 1080 的特色。

新藝術形式(New Art Form)

NVIDIA 伴隨 GTX 1080 同步發表了「NVIDIA Ansel」技術,該技術是以遊戲畫面擷取為訴求的工具,能輕鬆整合到遊戲中。透過 Ansel,玩家能突破以往只能擷取遊玩當下所見畫面的限制,自由從不同的視角來截取遊戲畫面,不論是拉近、拉遠、拉高、拉低、旋轉等,都能因應玩家喜好調整。而且擷取時不侷限於遊戲實際運行的解析度,而是能拉大到最高 32 倍的解析度輸出。此外還能擷取 360 度 3D 環景畫面,搭配 Google Cardboard 等 VR 裝置即可觀賞身歷其境的截圖。

自由攝影機

超高解析度

360 度環景截圖

Ansel 活用 GeForce GPU 提供的 CUDA 可程式化運算功能來處理遊戲畫面擷取的運算,可以快速處理高倍解析度擷取的合併,或者是替擷取的畫面加上諸如 LOMO 之類的濾鏡效果等。

Ansel 具備容易整合的特性,以目前導入 Ansel 支援的兩款遊戲為例,《The Witness》只需要加入 40 行程式碼即可,《巫師 3:狂獵》則只需要 150 行程式碼。操作部分則是透過 Ansel 提供的便利側欄介面來控制。尼克強調,是否要整合 Ansel 端看遊戲性質而定,如果是無法暫停的即時連線遊戲,就不適合使用 Ansel。另外因為截圖時玩家可以自由移動攝影機視角,因此可能會洩漏一些玩家不該看到的東西。能否加入 Ansel、要加上什麼限制,都可以由遊戲開發者自己決定。

透過遊戲截圖來進行攝影創作已經成為一個新興趨勢

全新音效表現(New Sound)

目前虛擬實境(VR)話題正熱,但多數都是集中在「影像」的呈現上。不過對於 VR 的沉浸體驗來說,「聲音」的表現同樣具有畫龍點睛的效果。良好的音效表現,對 VR 體驗的幫助不只是「加法」而是「乘法」。因此這次 NVIDIA 特別在 VR 軟體開發套件「VRWorks」中整合了嶄新的「VRWorks Audio」技術,運用先前收購的 NVIDIA OptiX 光跡追蹤引擎,即時追蹤環境中的多個聲音,讓使用者聽到的音效能完全反映出虛擬世界中物體的大小、形狀以及材質。目前該技術最多能同時模擬 16000 條聲波射線進行最多 12 次反射運算,來模擬真實世界中複雜的聲波傳遞。

此外,NVIDIA 還運用持續更新的「NVIDIA PhysX」技術來滿足 VR 體驗所需要的互動式觸碰與物理模擬,能偵測像是 HTC Vive 控制器之類的體感控制器與虛擬物體的互動,讓遊戲引擎提供符合物理法則的視覺與觸覺反應。此外還能建構使用者對虛擬世界周遭的物理行為模型,讓不論是爆炸、燃燒、水波、液體流動、布料與毛髮飄逸等互動,都能呈現宛如真實世界一般的樣貌。

為了讓玩家充分體驗 VRWorks 搭配 Pascal 顯示卡所能提供的豐富功能,NVIDIA 特別開發了一款名為《NVIDIA VR Funhouse》的 VR 技術展示遊戲,採用 Unreal Engine 4 打造,搭配 HTC Vive 遊玩。透過遊樂園的娛樂設施來體驗先進的 VR 效果。除了 VR 影像與聲音的呈現之外,還能感受諸如碰撞、液體、燃燒、毛髮等物理模擬特效。該展示預定近期內在 Steam VR 上推出。

新效能王者(New King)

GTX 1080 採用新一代 Pascal 架構搭配 16 奈米 FinFET 製程與 GDDR5X 高速記憶體,提供高達 9TFLOPS 的單精度浮點數運算效能,一舉超越前代霸主的 GTX TITAN X(約 6TFLOPS),成為 GeForce 家族中新一代的效能王者。

GeForce GTX 1080:9TFLOPS

GeForce GTX TITAN X:6.14TFLOPS

GeForce GTX 980Ti:5.63TFLOPS

尼克‧斯塔姆強調,其實不只是架構與製程的更新,NVIDIA 在 Pascal 上還投注了高度的工藝技術心血,讓該架構達到前所未有的效益。他透露,原本 Pascal 架構晶片在開發初期的增幅時脈只能達到 1325MHz,但是在整體電路布局最佳化的努力之下,最後達到 1733MHz,提升了 30% 之多。因此工藝技術的投入,是不亞於新架構與新製程的關鍵之一。

GTX 1080 採用代號「GP104」的圖型處理器核心,由 72 億電晶體構成,搭載 2560 個單精度浮點數 CUDA 核心,提供約 9TFLOPS 的單精度浮點數運算效能。由於是針對 3D 圖形處理應用,因此倍精度浮點數運算效能只有單精度的 1/32,比例比高效能運算用途的「Tesla P100」採用的 GP100 核心低很多(1/3),不過 GP100 的電晶體高達 153 億個,兩者的規模相差很大。

預定稍晚推出的 GTX 1070 同樣採用 GP104 核心,有效運算單元是 GTX 1080 的 3/4,搭載 1920 個 CUDA 核心,提供約 6.5TFLOPS 的單精度浮點數運算效能。記憶體則採用 GDDR5。

GTX 1080 具備 20 組 Streaming Multiprocessors(SMs),每組包含 128 個 CUDA 核心以及 1 組 PolyMorph Engine,其中搭載了新的Simultaneous Multi-Projection 處理單元(後述)。

在 DirectX 12 導入的「非同步運算(Asynchronous Cimpute)」支援部分,先前的 Maxwell 只支援「靜態負載分割(Static Load Patitioning)」,這次 Pascal 則是導入了新的「動態負載平衡(Dynamic Load Balancing )」,當並行處理的圖形處理與數值計算其中一方先處理完畢後,可以立刻將資源釋出供另一方運用,減少資源閒置、縮短處理時間。

在 Preemption(搶占式多工)的部分,Pascal 首度支援像素(Pixel)單位的多工切換,GPU 可以在繪製多邊形內部單一像素時暫停此一工作切換到其他工作,之後再切回來繼續處理。DX12 數值計算則能以執行緒單位切換,CUDA 運算則是能以更細微的指令為單位切換。切換的延遲低於 100 微秒(100µs,即萬分之一秒)。藉由高速多工切換的特性,Pascal 在 VR 應用下能更快速在圖形處理與非同步時間調整(Asynchronous Timewarp)兩個工作之間切換,減少效能閒置。

此外,GTX 1080 還支援新一代高速繪圖記憶體標準「GDDR5X」,傳輸速度從前代的 7Gbps 提升至 10Gbps,提升超過 40%,提供高達 320GBps 的記憶體頻寬來滿足運算效能提升的需求。

除了記憶體頻寬提升之外,Pascal 同時也提升了記憶體壓縮處理的效率,改良原本的 2:1 壓縮模式的處理,並新增 4:1 與 8:1 模式,增加了有效壓縮的範圍,提供約 1.2 倍於前代的壓縮效率。搭配 1.4 倍頻寬與 1.2 倍壓縮效率,讓 GTX 1080 能提供 GTX 980 1.7 倍的等效記憶體頻寬。

Maxwell 架構與 Pascal 架構畫面壓縮適用範圍的比較,桃紅色為有效壓縮範圍

新技術(New Tech)

同步多重投射

顯示器的技術進步與價格降低,讓現在的使用者不再侷限於單螢幕的設置,逐漸走向多螢幕、曲面螢幕乃至於 VR 頭戴顯示器,而這些應用都與以往的單畫面輸出有很大的差別。為了因應螢幕多樣化的趨勢,Pascal 導入了全新的「Simultaneous Multi-Projection(同步多重投射)」技術。

在 3D 繪圖中所謂的「Projection(投射)」,是指將完成幾何運算後所產生的 3D 多邊形物件投影到螢幕顯示的 2D 平面(Viewport)上的處理,這些投影到平面上的幾何資料接著會進行渲染(Render),以呈現在使用者眼前。以往的 GPU 同一時間只能處理 1 個投射面,因此在遇到多螢幕輸出時,只能將多螢幕視為同一平面來進行投射,無法在單一次處理中針對個別螢幕擺設的角度來修正投射的角度,或者必須透過多次繪製畫面的方式來達成,但如此會大幅提升處理負擔。

而 Pascal 導入的「Simultaneous Multi-Projection」技術,則是可以同時支援最多 16 個投射面的處理,讓單次計算好的幾何資料可以同時產生多組不同的投射面來進行渲染,不但能配合多螢幕設置修正畫面角度、讓多螢幕的寬廣視角能有更自然的呈現,還能提升 VR 圖形處理的效率。

VR 頭戴顯示器的畫面輸出需求比目前主流的寬螢幕遊戲畫面輸出要高上許多。傳統的寬螢幕畫面輸出只需要 1920 x 1080 最低 30fps(每秒 60Mpixels) 就能被多數玩家接受,但是 HTC Vive 的 VR 畫面則需要 2 組 1680 x 1512 的畫面,且更新率必須維持最低 90fps(每秒 450Mpixels),是 1080p 30fps 的 7 倍以上。因此如何節省 VR 畫面處理的負擔,已成為今後 GPU 的重點。

Pascal 導入了多種 Simultaneous Multi-Projection 技術的應用來達成節省 VR 畫面處理負擔的需求。首先是以「Single Pass Stereo Rendering(單次立體渲染)」同時產生 VR 裝置左右兩眼的 3D 畫面,節省一半的幾何運算負擔。接著則是進一步配合 VR 裝置藉由透鏡修正平面螢幕畫面來產生球狀包覆視野的特性,以「Lens Matched Shading(符合透鏡特性的著色處理)」將左右畫面分割成中間凹陷的 4 個相連投射面來處理,節省傳統處理方式浪費的無謂畫面範圍,讓所需處理的像素大幅減少。以 Oculus Rift 來說,單一畫面就能從原本的 2.1Mpixels 減少到 1.4Mpixels。

開啟「Single Pass Stereo Rendering」後,畫面更新率從 60fps 提升至 90fps

配合 VR 頭戴裝置透鏡特性的「Lens Matched Shading」(左圖)

藉由這些技術的搭配,Pascal 架構能提供 2 倍於 Maxwell 架構的幾何運算吞吐量、1.5 倍於 Maxwell 架構的像素運算吞吐量。因此 GTX 1080 在 VR 圖形處理的應用上,能獲得比帳面浮點數運算效能提升幅度更大的效能提升,達到前代霸主 GTX TITAN X 的 2 倍效能與 3 倍效益。

Pascal 架構在 VR 處理時能提供 Maxwell 架構 2 倍的幾何運算吞吐量、1.5 倍的像素運算吞吐量

GTX 1080 在 VR 處理的效能提升比起帳面的運算效能提升更顯著

HDR + 4K 輸出

GTX 1080 支援新一代的 HDR(高動態範圍)與 4K 解析度影像輸出標準,搭載 1 組 HDMI 2.0b 與 3 組 DisplayPort 1.4 Ready 端子,最高能輸出到 7K 解析度,最多可同時輸出 4 個畫面。GTX 1080 支援 10bit HEVC 影像編碼與 12bit HEVC 影像解碼,可搭配 Shield 進行 HDR 串流畫面輸出。支援 HDR 輸出的遊戲將於近期陸續登場,包括《典範》、《古墓奇兵崛起》等。

快速同步

「Fast Sync(快速同步)」是 NVIDIA 針對《CS:GO》等高畫面更新率需求的遊戲所提出的新功能,該功能不是 Pascal 專屬,只要安裝新版 GeForce Experence 驅動程式組即可開啟。

Fast Sync 是基於 V-Sync 加以改良的模式,改善了以往開啟 V-Sync 時,遊戲引擎必須配合畫面更新率運作所導致的高反應延遲,同時避免關閉 V-Sync 的畫面撕裂問題。Fast Sync 讓遊戲引擎保持最高速運作,不去等待螢幕的畫面更新,而是持續不斷繪製畫面,並將最後一張繪製好的畫面持續更新到固定的暫存區中,未能顯示的畫面就直接刷新捨棄。當遇到螢幕畫面更新時就直接輸出暫存區中的最後一張畫面。因此能兼具 V-Sync 開啟的完整畫面與 V-Sync 關閉的低延遲。

Fast Sync 透過改良 V-Sync 的機制,達成低延遲無撕裂的高更新率畫面輸出

強化 SLI 介面

GTX 1080 調整了 SLI 多顯示卡組態的參考規格,由於軟硬體環境的改變,使得 3-Way 以上的 SLI 效能提升有限、效益偏低,因此未來官方將只支援 2-Way SLI,不再支援更高的 SLI。而以往為了串連超過 2 張顯示卡所設的 2 組 SLI 接頭,在 GTX 1080 上會合併在一起,提供 2-Way SLI 更充裕的頻寬。官方同時推出新版的 SLI 高頻寬橋接器,能以更高時脈運作(650MHz)。雖然使用者還是可以使用既有的標準橋接器,只不過運作時脈(400MHz)會比新版的寬橋接器低。

GPU Boost 3.0

在狂熱玩家關注的 GPU 超頻部分,先前的 GPU Boost 功能,只提供一個保守的線性偏移量來做為運作電壓與運作時脈的設定值,但實際上 GPU 在不同電壓下能達到的運作時脈上限並不是一個線性變化的值,之間還有進一步提升的空間在。這次 Pascal 導入的 GPU Boost 3.0 則是採用更精確的設定,可以透過軟體掃描個別 GPU 在特定電壓下的極限,設定出一個最逼近上限的參數曲線,達成極致超頻的目標。

創始版

以往由 NVIDIA 官方推出的顯示卡,往往被消費者認為是規格最為基本的「公版」,缺乏品牌認同感。因此 NVIDIA 在這次的 GTX 1080 與 GTX 1070 採用了不同的做法,推出了精心打造的「創始版(Founders Edition)」,採用極具設計感的高檔外觀設計,配備高效率的散熱系統。

這款創始版將強制採用全球統一的設計,不論是任何板卡廠商推出的產品,只要冠上創始版的名號,就會具備相同的外觀與規格,以凝聚使用者對 GeForce 品牌的認同感。目前 NVIDIA 發表與展示的就是創始版,官方只會推出這一個版本,不會有低階的公版產品。板卡廠商還是可以推出自行設計的產品,只是這些產品就不能稱作創始版。


NVIDIA GeForce GTX 1080 預定 5 月 27 日上市,板卡廠商客製化版本參考零售價 599 美元(約新台幣 19550 元),創始版預估零售價 699 美元(約新台幣 22800 元)。

NVIDIA GeForce GTX 1070 預定 6 月 10 日上市,板卡廠商客製化版本參考零售價 379 美元(約新台幣 12360 元),創始版預估零售價 449 美元(約新台幣 14650 元)。

包括華碩、七彩虹、EVGA、耕宇、影馳、技嘉、Innovision 3D、微星、NVIDIA、同德、PNY、以及 Zotac 等廠商都將推出 GTX 1080 / GTX 1070 顯示卡。

我來說兩句...

匿名留言版: