NVIDIA 近期發布了采用 PCIe接口的80GB A100 加速卡。據了解,去年秋天NVIDIA首次推出基于 SXM 外形的A100加速卡,與Ampere GA100 原始型號相比,不僅擴大了總內存容量——從40GB翻倍至 80GB,而且還將內存時鐘頻率進一步提高了 33%。現在,經過 6 個多月的時間,NVIDIA 正在為需要獨立附加卡的客戶發布 PCIe 版本的加速卡。
80GB PCIe 加速卡旨在為NVIDIA 的傳統 PCIe 客戶提供第二個更高性能的加速卡選項,特別是對于那些需要超過 40GB GPU 內存的用戶。
從更高層面來看,PCIe A100 的80GB 升級與 NVIDIA 為 SXM 版本所做的幾乎相同。80GB 卡的 GPU 與 40GB 卡的 GPU 時鐘相同,因此吞吐量并沒有變化。
不過NVIDIA 為該卡配備了更新的HBM2E 內存。HBM2E 是 HBM2 內存標準最新更新的非正式名稱,該標準在今年 2 月將新的最大內存速度定義為 3.2Gbps/pin;再加上頻率的提升,制造上的改進使得內存制造商能夠將內存容量翻倍,從1GB/die 增加到 2GB/die;最終可以讓 HBM2E 提供更大的容量和帶寬,NVIDIA 也正是利用了這兩點優勢。
最新的 PCIe A100 擁有 5 個 16GB 的活動堆棧,8-Hi 內存,總共為 80GB 的內存。以 3.0Gbps/pin 的速度運行,內存帶寬略低于 1.9TB/秒,比 40GB 版本增加了 25%。這意味著 80GB 加速卡不僅提供了更多的本地存儲,而且還提供了一些額外的內存帶寬。這意味著在內存帶寬受限的工作負載中,即使不使用額外的內存容量,80GB 版本也應該比 40GB 版本更快。
然而,這種額外的內存確實是有代價的——功耗。對于 80GB A100,NVIDIA 需要將功率提高到 300W,以適應更密集、更高頻率的HBM2E堆棧。這是 TDP 的一個非常顯著的變化,因為 NVIDIA 長期以來一直將其 PCIe 計算加速卡的功率保持在 250W,這被廣泛認為是 PCIe 散熱的極限。所以一張 300W 的卡不僅與 NVIDIA 過去的卡有所不同,還意味著系統集成商需要找到一種方法來為每張卡提供另外50W 的散熱。估計這不會成為太多設計的障礙,但如果某些集成商因此只提供40GB 卡,我們也不會為此感到詫異。
即便如此,80GB PCIe A100 的性能似乎也有點回退。3.0Gbps內存時鐘比80GB SXM A100 的3.2Gbps 內存時鐘低 7%。
關于整體性能預期,新的 80GB PCIe 卡應該以與 40GB 型號類似的方式落后于 SXM 卡。由于NVIDIA 最新的 A100 數據表沒有包含相對性能指標,因此我們沒有關于 PCIe 卡與 SXM 卡進行比較的任何官方數據。但是考慮到TDP 差異(300W 與 400W+),預計 80GB PCIe 卡的實際性能接近 40GB PCIe 卡的 90%。這再次印證GPU 的時鐘速度并不是一切,尤其是在這個 TDP 受限硬件的時代。
無論如何,80GB PCIe A100 旨在吸引與該卡的 SXM 版本相同的廣泛用例,大致歸結為 AI 數據集大小,并支持更大的多實例 GPU (MIG) 實例。在人工智能的情況下,有許多工作負載可以通過使用更大的數據集,縮短訓練時間或提高準確性,而整體 GPU 內存容量一直是該領域的瓶頸,因為總有人可以使用更多內存。同時,NVIDIA 在 A100 上引入的 MIG 技術允許為每個實例分配更多內存;在 7 個實例上運行,每個實例現在最多可以擁有 10GB 的專用內存。
總體而言,雖然NVIDIA還沒有公布具體的定價或可用性信息,客戶應該很快就會看到 80GB PCIe A100 卡。