NVIDIA 藉 CUDA 平行運算協助 Titan 奪下地表最快 HPC

NVIDIA 藉 CUDA 平行運算協助 Titan 奪下地表最快 HPC

 HPC 超級電腦對一般人好像是個遙遠的名詞,不過以國家與大型機構所擁有的 HPC 的效能,卻也變相意味著國力的強度。因為高效能的 HPC 可以運用在生命科學、石油探勘、新技術模擬、天災模擬甚至國防運用,對於民生也有相當大的幫助;近年平行運算崛起,透過平行運算技術的 HPC 也漸漸增加,尤其搭載 NVIDIA Tesla 運算處理器的 HPC 成長更是迅速。

NVIDIA 藉 CUDA 平行運算協助 Titan 奪下地表最快 HPC

過去的運算都是利用通用處理器 CPU 擔當, CPU 用於單工作的運算效能的確很高,不過相當多零碎的運算內容,像是蛋白質模擬、物理碰撞模擬、星系爆炸模擬等內容繁雜但各個模擬項目卻僅需要用到些許的運算效能,此類的運算情境下,核心數目不多的 CPU 卻非得一個一個項目接著運算。

然而原本用於遊戲與娛樂的多邊圖形、材質產生的 GPU ,雖然各個核心計算能力不敵 CPU ,不過藉著龐大的核心數量,讓原本就擅長運算零散而大量的內容的 GPU 在計算複雜模擬時比起純 CPU 更有利,也就促成利用 GPU 輔助運算大量而零散的資料內容。

NVIDIA 藉 CUDA 平行運算協助 Titan 奪下地表最快 HPC

平行運算結合 CPU 以及 GPU 兩者強項,比起使用純 CPU 運算效能更高,尤其這幾年能源議題高漲,平行運算可用更少的體積、更少的電力與發熱達到更強大的效能,尤其如大陸積極導入平行運算 HPC ,在 HPC TOP 500 世界排名積極攀升,平行運算帶來的強大功耗效能比也漸漸被正視。

在平行運算位於先驅地位的 NVIDIA ,其平行運算技術 CUDA 也進入第五世代,並且也針對 Mac OS 與 Linux 推出專用版本,一改先前僅能在 Windows 使用的情形。至於硬體也因為全新的 Kepler 架構的導入,包括 GPUDirect 直接溝通、 Dynamic Grid 分析圖動態切割等技術也強化了 CUDA 5 的效能。

NVIDIA 藉 CUDA 平行運算協助 Titan 奪下地表最快 HPC

全新世代的 K10 以及 K20 運算處理器在 Kepler 先進架構加持下,以 K10 為例,相較上一代架構的 M2029 單精度浮點運算效能提昇了三倍,相較 Sandy Bridge 架構下的 Xeon 處理器單精度浮點產生數提昇達 12 倍,記憶體頻寬提昇 6.4 倍。 至於針對雙精度浮點運算的 K20X ,在 DGEMM TFlops 效能也超越 M2090 達三倍。

到底導入平行運算後, HPC 效能產生多大變化? 以 AMBER 的JAC NVE Benchmark 為例,在 2009 年,96 個節點的純 CPU Server 也不過 46ns / 天,而 2011 年靠著 8 張上一代 Fermi 架構的 Tesla 卡 M2090 則有69ns / 天,但 2012 年靠著 2 張全新的 K10 Tesla 卡就已經具備 66ns / 天的驚人效能。

NVIDIA 藉 CUDA 平行運算協助 Titan 奪下地表最快 HPC

最近才正式發表的 K20 是針對雙精度浮點運算需求打造,分為僅有伺服器用的 K20X 以及同時推出伺服器與工作站雙版本的 K20 ,兩者基本上都是基於 Kepler 架構,主要差異在記憶體總數以及記憶體頻寬,當然記憶體數量與頻寬較高的 K20X 效能也相對較強。

NVIDIA 藉 CUDA 平行運算協助 Titan 奪下地表最快 HPC

而近期的成功案例就是美國 Oak Ridge National Laboratory 擁有的超級電腦 Jaguar 的後繼者 Titan , Jaguar 採用的是來自 Cray 的超級電腦架構,效能已經高達 2.3 Petaflops ,但以全速運算下高達 7,000 兆瓦,功耗卻直逼一個美國 7,000 人小鎮的用電量。

而新一代的 Titan 也是基於 Cray 超級電腦架構,也直接沿用 18,688 個 Jaguar 的 CrayXK7 刀鋒伺服器機櫃設計,從外觀看起來只有貼紙改換,但內部核心採更新為 AMD 16 核 Opteron 與 Tesla K20X 構成,在相同的體積下,效能高達 20 Petaflops 以上,且 90% 都是由 GPU 產生,功耗卻僅有 Jaguar 的五分之一。

NVIDIA 藉 CUDA 平行運算協助 Titan 奪下地表最快 HPC

由於導入平行運算技術, Titan 一舉奪下 HPC 運算效能之王的寶座,同時採用 Tesla K20X 的 BlueGene/Q 伺服器架構也在綠能 HPC 前 500 名列前茅,一舉拿下前十名,洗刷過去超級電腦效能越高、每瓦效能往往越不理想的刻版印象。

導入高效能 HPC 的應用相當廣泛,像是日本就利用 HPC 進行天災預測,能在最短時間內針對海嘯進行推演並且提前發布警告,而石油探勘產業也利用 HPC 進行地質模擬,更不用說去年大陸中科院針對 H1N1 流感進行分析,作為感冒病毒的預防;其它新興國家包括印度也積極投入 HPC ,美國總統也曾感慨過大陸 HPC 急起直追的情況...

不過台灣在 HPC 的積極度卻是顯得相當落後的,更不用說平行運算相關課程,多數大專院校相關科系仍著重在純 CPU 運算相關教學,而筆者個人一年前也曾接觸過某需要使用到超級電腦的公家機關,他們對平行運算相當抗拒,但理由並非不在乎效能,而是現有系統導入平行運算需要大幅修改,但公務員心態就是多一事不如少一事,結果可想而知。