科技議題

首頁> 科技議題 - 智慧科技> 何時我們才會有2的16次方浮點數運算等級的超級電腦?
何時我們才會有2的16次方浮點數運算等級的超級電腦? When Will We Have an Exascale Supercomputer?
Hsu, J.
2015
Spectrum, IEEE
Spectrum, IEEE
10.1109/MSPEC.2015.6995619
對開發運算能力更強大的超級電腦的競賽即將面臨一個新的里程碑:超級電腦之運算能力即將超過Exascale,意即每秒216個浮點數運算(FLOPS)。欲開發如此快速之電腦,需要對計算機之運算原理、資料傳輸方式、以及程式設計之方式進行全面之翻新。雖則要達到這樣的運算能力還需要幾年的時間,但相關技術的種子已在兩個近來的超級電腦中萌芽。
中國和日本似乎正進行Exascale超級電腦的開發,且預計於2020年前完成;然而根據專家表示,美國很可能不會在2023年前完成其第一台Exascale超級電腦的開發。Exascale超級電腦的開發主要著眼於三個技術重點:(1) 開發新的、可有效整合數以千計之中央處理器(CPU)或圖形處理器(GPU)的系統架構;(2) 處理在記憶體與大量處理器兼資料搬移所肇致之能耗;以及 (3) 設計能充分利用新架構的程式。
電腦科學家Peter Kogge曾於2011年1月於IEEE Spectrum表示,單單使用當前之超級電腦架構來建立Exascale之超級電腦將會造成幾近於核電廠功率的能耗,其能耗往往可達十億瓦的級別,造成每年需花費約十億美金在電力供應上。然而,根據勞倫斯-柏克萊國家實驗室(Lawrence Berkeley National Lab)的代理主任Horst Simon表示,美國政府的目標,是在21世紀20年代製造出功率僅約二千萬至三千萬瓦、且造價僅約二億美金的Exascale超級電腦,因此離目標尚有很長一段的距離。
美國能源部近來宣布其將投資約二億三千五百萬美金於Summit及Sierra這對超級電腦,以在2017年之前發布可提供運算能力約為0.1 Exascale之超級電腦,而開發工作將由IBM、Mellanox、以及NVidia等公司負責。這對超級電腦採用新型態的架構,將記憶體堆疊在NVidia GPUs及IBM CPUs附近,以降低超級電腦之能耗、並朝Exascale超級電腦之實現邁進了一大步。
Horst Simon解釋道,在實務上,Exascale超級電腦有必要進一步開發記憶體堆疊及更快速且節能之連接技術(Interconnect),以提升高密度超級電腦晶片之效能。此外,他也預測到,諸如矽光子學(Silicon photonics)等的技術也將會被應用在超級電腦中,以建立低能耗之資料通道(Data links)。
能耗和製造成本並不僅是製造超級電腦的唯一議題;隨著單一系統中硬體元件數量的大量增加,硬體失效(Hardware failure)所肇致之風險也隨之而增。加州的勞倫斯-利勒摩國家實驗室(Lawrence—Livermore National Lab)技術長Bronis de Supinski表示,其實驗室中一台名為Sequoia的IBM Blue Gene/Q超級電腦,其平均失效時間僅約3.5—7天;對Exascale的超級電腦而言,這樣的失效時間更將急遽縮短至僅30分鐘,而這時間幾乎不足以讓科學家得以完成任何複雜的模擬或計算工作。De Supinski表示,這是一個硬體的進步造成軟體設計挑戰的真實案例。
專家們也指出,針對數以十萬計的平行中央處理器設計軟體將會是一個新的挑戰,遑論針對包含圖形處理器的超級電腦架構設計軟體將會益形困難;這也是NVidia及其合作創造Sierra及Summit超級電腦的夥伴公司致力於教育大量相關軟體設計人才、推廣相關軟體設計技術的原因。
除了Sierra及Summit超級電腦外,美國能源部也投資了額外的一億美金在建立Exascale超級電腦上。然而,NVidia的Tesla高速運算部門的Sumit Gupta表示,這些投資並不僅利於那些能負擔的起Exascale超級電腦的實驗室;世界各地的用戶將能廣為利用相關之超級電腦架構來進行高速計算。Gupta說道,「讓我很感興趣的是,當我們擁有一台Exascale的超級電腦時,一台能提供1 Peta FLOPS(較Exascale小一千倍)運算能力的電腦可以做得多小?他能被放在我的背包裡或書桌上嗎?一個一般的研究所學生將能做到那些現在做不到的事呢?這對我來說是個更為有趣的問題。」
黃柏鈞
英文