蔡一郎的部落格

Yilang's Blogger

資訊科技的極致-SC13

Published by Yi-Lang Tsai under , on 12/06/2013 05:15:00 上午
每年舉辦的Super Computing年會,是世界上最重要的資訊科技盛會,包括了高速計算、網路技術、科學計算等領域都齊聚在一起,尤其各個國家主要的高速計算中心以及研究單位,每年都會參與並且建立彼此的研究合作關係,今年在Colorado(科羅拉多州)的Denver(丹佛)舉行,如同往年有多場的不同主題的研討以及各個參展單位的成果展覽,因應雲端時代的來臨,除了傳統的科學計算之外,今年有許多的議題皆與雲端服務有關,例如:雲端運算環境中的軟硬體架構、管理的機制、雲端上的應用服務等,在SC的年會上都能夠見識到資訊科技的極致,從應用、軟體或是硬體的設計,都是為了讓運算的能力更上層樓,也能夠解決以往無法在有效時間內解決的問題,這個也是科學進度的原動力。
SC會議希望串連全球各個主要的HPC運算中心,透過互相交流與技術合作,可以推動更多樣化的科學應用,包括解決人類所面臨到的問題,具有高速的計算能力,也可以用來代表國家對於科學研究發展的基礎建設是否足夠的指標。

每年的SC年會,除了美國的主要高速計算中心會參與之外,也有許多大學與研究單位,這些高速計算中心,大學與研究單位在應用的領域而言,是相當廣泛的,包括了流體力學、機械、結構、災防、大氣模擬、科學計算等,不同的領域都能夠將高速電腦應用得恰到好處,發展其具有的特性。

今年會議的主席是William Douglas Gropp,在致詞時也特別說明了高速計算的發展以及應用的趨勢,希望透過會議的舉行,凝聚全球的科學研究能量,應用於各領域的發展。

在高速計算領域需要解決與面對的問題,可以從今年的專題演講(Keynote Speak)Genevieve Bell所介紹的幾個面向來看,包括了Design, Logic, Control, Lies, Data, Control, Query, Knowledge等多個不同的角度,來探討高速計算在發展過程,需要解決的問題,以及這些問題背後所隱藏的意義,對於想要瞭解高速計算領域的人而言,可以更快的掌握當下最為急迫的關鍵問題為到,在研究過程可以利用已有的解決方案,縮短解決問題的時間,對於科學計算的發展,可以獲得正面的效益。

對於龐大的運算主機而言,如何掌握這些運算主機以及各個主要元件的運作狀況,屬於運算資源管理過程最要必要的,目前管理的方式除了傳統的資訊收集方式之外,視覺化的呈現介面對應到當下的運算資源,甚至是雲端運算資源的管理,都是相當重要的一件事,能夠讓系統管理人員一目瞭然當下系統的運算狀況,也可以直覺的掌握每一個執行程序、每一位使用者,以至於對於系統資源的使用情況,包括了CPU, GPU等運算資源的使用,記憶體、磁碟等儲存空間的使用情況等,這些對於高速運算主機或是設備而言,都是相當重要的,必須跳脫傳統管理系統的方式,系統管理人員對於本身的技術能量也需要跟上時代發展的腳步。

繪圖處理器(GPU)改變了傳統採用中央處理器(CPU)的運算方式,因應圖形處理以及多執行程序的需求,配合GPU可以加快傳統採用CPU運算的方式達數十倍以上,甚至可能達到百倍以上,因此對於大尺度問題的解決,在時間的節省上是最直接能夠反應採用GPU計算的價值所在,今年仍像往年一樣,許多採用GPU運算架構的硬體隨時可見,而且在架構的設計上更為緊密,甚至在一台機器內,可以使用到八張以上的GPU卡,以進行平行的運算,來縮短解出答案的時間。

日本的京電腦(K Computer)從有它之後,就一直是每年SC會議的重點,許多與會人員都想要一探其中的奧秘,當然我也不例外,在聽完相關的介紹以及深入的討論之後,對於K Computer在整個發展的過程,跟我們最大的不同,在於設計的理念,從最底層的精神就不一樣了,K Computer在設計之前,花了許多的時間進行科學應用的調查,經過嚴謹的需求分析之後,然後才有了K Computer的設計,當然其中有許多計畫彼此可能有些衝突,而無法完全的滿足所有的需求,這也是優先順序以及重要性的評估,也藉由這樣的評估程序,可以讓整個系統的設計,在規劃時就能夠確定可以符合未來在應用上的需求,其中亦有許多開創性以及前瞻性的應用,是以往可能沒有的,但是因為這樣的精神,在完成建置後,不怕找不到用戶,但反觀國內在規劃相關的設計時,都是以傳統的應用服務為主,怕失去原本的客戶而受限了,對於新的應用領域可能未經過完整的分析,當然建置後只有原本的用戶會轉移到新的主機上,對於其它的應用就無法符合對方的需求了,而國內的許多大專院校彼此競爭資源,爭相的建置計算主機,以突顯在位者的功績,而這些對於科學研究的發展,實在是沒有幫忙。

雲端的時代,當然在會場可以找到訴求雲端運算的設備,目前許多的雲端設備,包括了網路、運算主機、儲存設備以及監控管理系統,都能夠收容在一個機櫃以內,除了提供高速的計算環境之外,也提供了高達100Gbps的網路界面,可以極快速的與外界進行資料的交換,在雲端服務化的時代,在硬體技術的發展上,對於大多數的應用而言,都能夠滿足相關的需求。

今年SC會場的連外網路,仍然由SCinet負責,除了提供會場內的網路連線之外,在頻寬的擴增上,今年已達到了會場以100Gbps對外的連線頻寬,實際的網路流量也達到了近90Gbps,並且透過即時的網管平台,能夠有效的掌到各個攤位對於網路的使用情況,今年比較特殊的是,在會場也建置了帳號與密碼的監控平台,只是所使用的通訊協定是未加密的,或是不安全的,都可能遭到密碼的揭露。

高密度與集中化的設計方式,可以讓我們在輕簿短小的空間中,塞入更多且更大量的運算資源,所採用的高熱再透過節能、水冷或是熱傳導的方式,將設備所產生的熱量排出,以降低設備本身在運作時的溫度,以提供設備本身的穩定性。

目前是講求高頻寬以及巨量資料的時代,在高速計算的環境中,除了提供高速的運算能力之外,在資料的傳輸上為了提高效率,節省時間,也發展出單張網卡就具備多埠的網路界面,採用光纖網路進行資料的傳輸,將效能發揮到最高。

高速的計算伴隨而來的就是設備所產生的高熱,因此每年都可以看到一些針對降溫或是增加熱交換的解決方案,為了快速的將熱氣排出以解決溫度的問題,將設備能夠維持在穩定的溫度,避免影響運算的效能或是造成設備的當機。

小兵立大功,可用來形容以Raspberry Pi所造成的運算系統,雖然每一台的Raspberry Pi的運算能力不高,甚至談不上運算的能力或是速度,不過如果將多台的Raspberry Pi串連起來,成為一套平行運算的機器,因為建置成本相當低,因此對於一些基礎的科學運算而言,也許可以是相當好的應用環境。

每年的SC都有它的主軸,也都各具有自己的特色,從1988年到今年,已舉辦了相當多屆,因為工作的關係,個人參加了2004年、2012年以及2013年的會議,而個人所服務的中心,今年是第15年參加這個會議的展出,也是台灣唯一參加的高速計算中心,每年的展場以及議程,都與當下最新的科學研究發展趨勢有關,除了瞭解了資訊科技的進步之外,對於科學的研究,也能夠瞭解最新的突破,以及運用高速計算來解決的問題。


相關網站: