gpu服務器有哪些分類呢?GPU擅長處理大規模深度合作學習能力訓練方法以及其他部分典型HPC任務。經常有朋友在咨詢公司如何有效配置可以用于深度學習或計算加速的GPU服務器,今天我們就來看看吧!
GPU服務器分類:
首先介紹下常見的GPU和GPU服務器。以NVIDIA Tesla系列GPU為例,按總線數據接口不同類型企業可以發展分為NV-Link接口技術以及國內傳統PCI-e總線進行兩種。
1、Nv-link接口類型的gpu:典型的代表是NVIDIA V100,使用SXM2接口,DGX-2的接口SXM3。
2、NV-Link總線技術標準的GPU服務器
DGX是由NVIDIA設計的超級計算機的典型代表。DGX超級計算機不僅提供硬件,以及相關的軟件和服務。
3、傳統PCI-e總線數據接口的GPU
NVIDIA特斯拉GPU加速對主流專業計算主要是:P4/P40(P指的是前一代PASCAL架構的開頭),P100,V100和圖靈架構特斯拉T4那些段落。且其中只有薄薄槽P4和T4,常用推理,現在有成熟的識別模型和推理。
4、傳統的pci-e總線gpu服務器分為兩類:
(1)OEM服務器:通過NVIDIA官方的測試和制造商的認證。比如,廣泛的技術不僅NVIDIA的合作伙伴,已成為公司加快NVIDIA潛在的AI計劃成員;
(2)非OEM服務器,也包括企業很多不同種類
選擇的基本原則:選擇GPU服務器時首先要進行考慮企業業務發展需求來選擇一個適合的GPU型號。在HPC高性能數據計算中還需我們要根據不同精度來選擇,比如他們有的高性能計算方法需要雙精度,這時如果可以使用P40或者P4就不合適,只能通過使用V100或者P100,同時也會對顯存容量有要求,比如石油或石化勘探類的計算技術應用對顯存要求比較高,還有些對總線控制標準有要求,因此本文選擇GPU型號要先看業務市場需求。
GPU服務器人工智能領域應用也較多。GPU虛擬化在場景中要求更高。根據數量,需要將GPU服務器虛擬出30或60個虛擬GPU,因此批量培訓需要GPU,通常使用V100進行GPU培訓。模型訓練需要推理,所以推理一般采用P4或T4,少數情況為V100。