11月14日消息,首次實測NVIDIA Blackwell GPU相當強悍,跑分大家都知道,提升但到底有多強呢?多達
除了官方宣傳數(shù)據(jù),現(xiàn)在終于第一次看到了實測數(shù)據(jù),首次實測來自MLCommons MLPerf v4.1,跑分考察AI訓練推理性能的提升最佳平臺。
對比對象是多達兩代服務器HGX B200、HGX H200,首次實測前者包含多達八顆Blackwell GPU B200,跑分單顆功耗高達1000W。提升
GPT-3預訓練項目中,多達Blackwell的首次實測性能相比上代Hopper翻了一番。
Llama 2 700億參數(shù)微調(diào)項目中,跑分Blackwell的提升性能更是提升了多達2.2倍。
值得一提的是,Blackwell平臺具備ConnectX-7 SuperNICs網(wǎng)卡、Quantum-2 InfiniBand交換機,再加上第五代NVLink互連總線,可以充分保障節(jié)點間的通信,可以平衡分配AI訓練負載,整體效率更高。
比如同樣的GPT-3 1750億參數(shù)性能,Hopper需要多達256顆GPU,Blackwell就只需要64顆。