人工智能應用程序和現代處理器(例如GPU)的功能開始超過數據中心體系結構。儘管有充分的報導,雖然生成AI的強大功率和冷卻需求卻相對較少,但目前掛著AI性能的內存瓶頸。但這是由於內存創新而改變的。
AI需要內存。很多。然而,傳統的記憶體系結構可以充當AI性能的瓶頸。因此,Compute Express鏈接的引入是及時的。這款新服務器互連為要合併和共享的內存資源打開了大門。它可以幫助彌合位於低延遲內存和固態驅動器之間的性能差距。 CXL還可以降低內存成本,這是其中最昂貴的元素之一,同時消除了AI充分發揮其全部潛力的另一個障礙。
在此Techrepublic Premium功能中發現有關該主題的更多信息。
下載中的特色文字:
AI Gen揭露瓶頸
最新一代苛刻的工作負載(例如AI)的存在在其中殘酷地暴露了瓶頸。隨著大型語言模型變得更大,隨著處理器和圖形處理單元變得越來越強大,隨著機架密度飆升,傳統的IT設計難以跟上。
但是,最明顯的是記憶瓶頸。如果您將CPU核心繪製在時間上,然後在內存帶寬中進行因素,則趨勢線的差異是鮮明的。存儲器帶寬擴展與CPU核心擴展一段時間。但是它已經停滯了幾代,而核心計數越來越高。結果:CPU餓死了內存,以至於您無法從其他內核中完全受益。除延遲外,一旦主存儲已滿,苛刻的應用程序也可能會遇到諸如存儲器複製過多,被存儲,過度緩沖和設備外錯誤所消耗的問題。如果這些應用程序持續時間太長,則可能會崩潰。
另一個常見的內存問題未充分利用或滯留的內存資源。有些處理器可能迫切需要記憶,而另一些處理器則有足夠的供應。這歸結為系統設計和局限性。傳統上,DRAM位於CPU附近的雙線內存模塊中。有了這種設計,其他CPU只能訪問某些DIMM,而不能訪問其他DIMM。
通過我們深入的11頁PDF提高您的AI知識。這僅需$ 9即可下載。或者,與。
節省的時間:製作此內容需要22個小時的專門寫作,編輯,研究和設計。