鐵之狂傲

 取回密碼
 註冊
搜尋

切換到指定樓層
1#
  NVIDIA目前一代的顯示卡有GK104和GK110兩大分支,它們的側重點不同,但都是基於Kepler(開普勒,天文學家)架構的,下一代架構名為Maxwell(麥克斯韋爾,物理學家),根據之前的傳聞Maxwell最快將在明年Q1季問世,製程有可能繼續使用TSMC的28nm工藝。現在網上又流傳開Maxwell的架構設計了,旗艦GM100將有6144個CUDA核心,512bit位寬記憶體,記憶體容量達到了更誇張的8GB。
  據WCCFTech報導,Maxwell架構也會同時進入遊戲及計算兩大市場,NVIDIA計畫推出四款Maxwell架構GPU晶片——GM100、GM104、GM106和GM108。與Kepler架構相比,Maxwell將進一步增強SMX單元設計,最佳化雙精度邏輯單元。

  介紹Maxwell之前最好瞭解一下Kepler架構,相關介紹可以參閲之前的文章:3倍性能從哪裡來,GK110的SMX單元升級3.5代。目前Kepler架構中每組SMX單元有192個CUDA核心,Maxwell的SMX單元將進一步提升CUDA核心數到256個,不過DP雙精度浮點單元的比例會從目前的1:3降低到1:4,算起來DP單元總數是保持不變的。256個CUDA核心的SMX單元將大幅增加Maxwell的CUDA總數,而DP雙精度單元不用時是可以關閉的,這樣也能降低能耗。
  紋理單元方面,每組SMX單元會繼續維持16個TMU單元,跟Kepler是一樣的。
  Maxwell的快取設計也會進一步增強,每組SMX單元會額外增加2個寄存器,大量寄存器執行緒現在也可以並行運行了。L1快取從Kepler架構的64kb增加到了128kb,而且可以作為共享記憶體使用,並且可以32/96、64/64、96/32的比例分配成快取、共享記憶體。
  L1快取之外,每個GPC單元還會獨享768kb L2快取作為指令快取。
  實際的四款Maxwell晶片的詳細架構如下所示:
GM110核心
  目前的GK104核心有4組GPC單元,GK110是5組GPC單元,而GM110擁有8組GPC單元,每個GPC單元有三組SMX單元,每組SMX單元又有256個CUDA核心,這樣總計有6144個CUDA核心,384個紋理單元,8MB L3快取,64個ROP單元,512bit記憶體位寬,記憶體容量則達到誇張的8GB。
  GM100無疑將取代GK110的旗艦地位,同時用於Tesla和GeForce高級產品綫,不過這兩個市場的GM100核心也有所不同:GeForce領域中的GM110核心頻率在930MHz左右,加速頻率1GHz左右,而Tesla中的GM110核心頻率約為850MHz,雙精度浮點性能達到了2.61TFLOPS。(作為對比的是GTX Titan目前的單精度性能是4.5FLOPS,雙精度是1.3TFLOPS)
GM104核心
  GM104核心將取代目前的GK104核心,後者的代表產品是GTX 680和GTX 770。
  GM104的GPC單元數量降低到5組,擁有3840個CUDA核心,240個TMU紋理單元,40個ROP光柵單元,記憶體位寬降低到320bit,記憶體容量3GB,也可能是跟Fermi一樣的2.5GB,不過記憶體位寬降低也使得頻率可以更高,記憶體頻率在7GHz左右,核心頻率1GHz左右。
GM106核心
  GM106核心將取代目前249美元以內的GK106核心的顯示卡,比如GTX 660、GTX 650 Ti、GTX 650 Ti Boost等。
  不過GM106相對來說提升也是非常大的,CUDA核心將從目前的960個暴增到2304個,4MB L3快取,144個紋理單元,24個ROP單元,記憶體位寬192bit,容量3GB,頻率也能達到7GHz。
GM108核心
  GM108之前其實還有GM107核心,目前後者的架構未知,不過驅動訊息中已經有GM107存在的暗示了。
  目前的ES樣品顯示GM108有576個CUDA核心,48個紋理單元,8個ROP單元,64bit記憶體位寬,核心面積跟GF117差不多。
丹佛計畫將從Maxwell升級版時代開始?
  在NVIDIA最神秘的計畫中,Preject Denver丹佛計畫最為引人注目,因為它將整合NVIDIA的GPU和ARM的CPU,有關這個處理器的進度一直沒有明確消息。最新泄露的消息顯示NIVIDIA在Maxwell升級版階(GM11x)段推出丹佛計畫,因為NVIDIA一直在等新的FinFET工藝成熟。這個說法跟NVIDIA在之前的GTC 2013大會上公佈的進度有些相符。

  丹佛處理器將整合64位ARM CPU核心,其中只有GM110會搭配8核丹佛處理器,GM110實際上應該被成為GM110 SoC處理器,已經不是單一的GPU或者CPU了。消費級的GM110將有4個CPU核心,整合的GPU則是GM114。整合GM116圖形核心的丹佛則只會搭配2個CPU核心。泄露的報告沒提到GM118核心整合什麼丹佛核心,因此它很可能並不會使用新的架構。
  丹佛處理器將有一致性匯流排(coherent link )用於連接CPU和GPU核心,並會在二者之間分配不同負載。爆料者稱NVIDIA認為丹佛計畫及對應的驅動最佳化會使他們的顯示卡比AMD為GCN架構最佳化的私有Mantle API更強。
  目前最重要但是還不能確認的就是這些晶片是否能在2014年上半年發布,因為TSMC預計在2014年2月份才能量產20nm工藝,而且AMD預計在未來兩個季內使用14nm FinFET工藝流片新處理器,不過真正發布要等到2014年底甚至2015年初。這意味着2014年上半年最可能發布的還是他們的移動晶片,AMD是Crystal系列,NVIDIA是GTX 800M系列,而桌面版有可能到2014年下半年才能發布了。

  2016年,NVIDIA會進入Vlota架構時代,根據之前在GTC 2013大會上公佈的官方消息,Volta架構的頻寬可達1TB/s。
 
轉播0 分享0 收藏0

回覆 使用道具 檢舉

全世界最先進的跳動筆
你需要登入後才可以回覆 登入 | 註冊

存檔|手機版|聯絡我們|新聞提供|鐵之狂傲

GMT+8, 24-5-4 06:01 , Processed in 0.023270 second(s), 17 queries , Gzip On.

回頂部