鐵之狂傲

 取回密碼
 註冊
搜尋

切換到指定樓層
1#
  按照NVIDIA的晶片編號習慣,目前GTX 680所使用的GK104其實只是一顆次頂級核心,將跟Fermi時代GF110與GF114的定位一樣。真正的Kepler旗艦應該是GK110,而GK104的出現只能說明NVIDIA已經將遊戲顯示卡與計算顯示卡徹底分開,GK104主要用於桌面市場,GK110才是計算加速卡的殺手鐧。
  之前的幾次會議上,NVIDIA已經公佈了GK110架構及Tesla K20的相關訊息,現在藉著SC 12會議的東風,NVIDIA正式發布了Tesla K20家族加速卡。Anandtech網站也對K20做了深入分析,我們來看一下這個71億晶體管打造的巨獸會有怎樣的實力。
k201.jpg
NVIDIA新一代Tesla K20加速卡詳細規格

amd01.jpg
AMD新一代S系列加速卡詳細規格

  先溫習一下之前傳言的規格,GK110有15組SMX單元,每組有192個針對雙精度運算而設計的CUDA核心,總計2880個CUDA核心,6組GDDR5記憶體控製器,位寬384bit,1.5MB L2快取,雙精度浮點性能達到了單精度浮點的1/3。
  目前Tesla K20有兩款型號,最高級的是K20X,擁有14組SMX單元,2688個CUDA核心,位寬384bit,搭配6GB GDDR5記憶體,等效頻率5.2GHz。核心頻率為732MHz,單精度浮點性能為3.95TFLOPS,雙精度則為1.31TFLOPS,TDP功耗235W,使用TSMC 28nm工藝製造,售價不會低於3199美元。
  K20X之下還有K20,規格有所降低,只有13組SMX單元,2496個CUDA核心,單/雙精度性能分別為3.52/1.17TFLOPS。記憶體頻率也是5.2GHz但是精簡掉一組記憶體控製器,位寬320bit,搭配5GB GDDR5記憶體,頻率也只有706MHz,TDP則為225W,看來K20的規格與之前泄漏的消息是一致的
  K20X與K20的關係與之前Fermi時代的M2090與M2075相似,前者主要用於高性能場合,同時功耗也會更高,後者性能略低,不過TDP也降低了。
  它們都可以使用被動散熱,因為大型電腦的散熱手段靠的主要是機房/機櫃的主動散熱,而K20還有可能作為針對工作站設計的下一代Maximus平台的Quadro顯示卡,因此也會有主動散熱的產品面世。
  K20X及K20最大的變化當屬性能方面,M2090的雙精度浮點性能只有655GFLOPS,而K20X達到了1.31TFLOPS,M2075的雙精度性能只有515GFLOPS,而準備取代它的K20也有1.17TFLOPS,新出的兩款產品相比前代都有了成倍的性能提升。
  不過在單精度和雙精度的比值卻有所下降,GK110的雙精度性能只有單精度的1/3,而Fermi架構的雙精度性能是單精度的1/2,K20X的單精度浮點性能為3.95TFLOPS。
  說到峰值FP32單精度性能,K20X依然不能取代4.5TFLOPS的Tesla K10,不過後者是基於兩個GK104核心的,缺少GK110架構的部分關鍵性能,比如片內ECC、HyperQ、Dynamic Parallelism動態並行等技術。因此目前已經使用K10的使用者沒必要升級到K20,只有那些對雙精度FP64性能有較高要求的使用者才有必要升級。
  Tesla K20發布之後將會面對許多競爭者,有新也有舊。宏觀層面來看,使用K20建設的HPC比如美國橡樹嶺國家實驗室的Titan超級電腦會面臨着IBM“藍色基因”等電腦的競爭,雖然Titan的性能早已大大超過後者。
DSC_8606sm.jpg
Titan超級電腦的一個節點由4個AMD Opteron處理器和4個Tesla K20加速卡組成

  K20也將會面臨AMD FirePro S1000、Intel Xeon Phi(正好也在SC 12會議上發布了)等產品的競爭,後兩者的雙精度浮點性能也達到了1TFLOPS以上,不過他們的不足在於理論性能跟實際性能並不對等,所以NVIDIA的Telsa K20還是會有很強的競爭力,至少有30%以上的性能優勢
  另外,在支援環境上NVIDIA也有優勢,Tesla K20依賴的環境是已經成熟的CUDA,而AMD FirePro依賴的是OpenCL,Xeon Phi則是X86,都還很需要時間考驗。

  價格方面,NVIDIA稍早公佈的K20報價是3199美元,但是這次出來兩個型號,最有可能的情況將是K20報價3199美元,而K20X報價在4000-5000美元之間。
  NVIDIA方面對出貨數量保持沉默,只表示初期可能有些供不應求,伺服器合作夥伴可以向NVIDIA先行預定。有趣的是NVIDIA在之前的財報中表示K20的產能非常好,因此NVIDIA的問題是如何滿足客戶需求而不在生產製造過程中。

  最後,Tesla K20的發布有望重塑NVIDIA。該公司推出的Fermi架構是NVIDIA第針對“現代”計算架構而設計的GPU,但是它最終沒能實現NVIDIA稍早宣稱的指數級增長。雖然現在也不能確定K20的未來如何成功,但是它已經用在是TOP500中排名第一的Titan電腦中,這已經是一個里程碑性質的大事件。
  Anadtech後兩頁是介紹GK110架構和Hypper Q、Dynamic Parallelism動態並行技術的,這部分內容我們稍早也做過解析,有興趣的讀者可以參考之前的文章。
GPU計算光榮使命,Tesla K10及K20技術規格詳解
 
轉播0 分享0 收藏0

回覆 使用道具 檢舉

你需要登入後才可以回覆 登入 | 註冊

存檔|手機版|聯絡我們|新聞提供|鐵之狂傲

GMT+8, 24-5-21 21:23 , Processed in 0.019746 second(s), 17 queries , Gzip On.

回頂部