AMD官宣下代頂級(jí)GPU:3nm全新架構(gòu) 288GB海量?jī)?nèi)存!
近日AMD正式發(fā)布升級(jí)版的宣下Instinct MI325X GPU加速卡,還宣布了全新的代頂下一代Instinct MI350系列的首款產(chǎn)品“Instinct MI355X”,并披露了部分規(guī)格、架構(gòu)性能數(shù)據(jù)。全新
MI355X將在2025年下半年上市,海量也就是內(nèi)存還有差不多一年時(shí)間。
MI350系列將首次升級(jí)為臺(tái)積電3nm工藝,代頂首次采用CDNA 4架構(gòu),架構(gòu)首次引入FP6、全新FP4浮點(diǎn)數(shù)據(jù)類型,海量搭配內(nèi)存還是內(nèi)存HBM3E但是容量高達(dá)288GB。
具體功耗沒(méi)有披露,宣下但是代頂MI325X已經(jīng)最高達(dá)1000W,AMD也透露MI355X會(huì)順應(yīng)行業(yè)趨勢(shì)(NVIDIA B200 1000W、架構(gòu)GB200 1700W),因此必然會(huì)顯著超過(guò)1000W。
FP6、FP4都屬于浮點(diǎn)數(shù)據(jù)格式,分別代表6位、4位精度,也就是只需6位、4位就能表達(dá)一個(gè)數(shù)字,相比于FP16、F8精度大大降低,但是數(shù)據(jù)處理量也大大減少,適合大模型的量化,特別是大語(yǔ)言模型和混合專家模型。
如果你不需要太高的精度,更想要速度,F(xiàn)P6、FP4就非常適合。
MI355X上的FP6、FP4浮點(diǎn)性能都是9.2 PFlops(每秒9200萬(wàn)億次運(yùn)算),同時(shí)還將FP16、FP8性能都提升了80%,分別達(dá)到2.3 PFlops、4.6 PFlops。
NVIDIA Blackwell GPU同樣引入了FP6、FP4精度,但是性能更高,分別達(dá)20 PFlops、40 PFlops。
單卡多達(dá)288GB HBM3E內(nèi)存確實(shí)是無(wú)可匹敵,同時(shí)帶寬高達(dá)8TB/s。
對(duì)比MI325X分別多出1/8、1/3,而相比目前已上市的MI300X都增加了足足50%。
對(duì)比競(jìng)品,Blackwell B200也只有192GB HBM3E,但帶寬同樣做到了8TB/s。
MI355X同樣支持單平臺(tái)八卡,這樣就有總計(jì)2.3TB HBME內(nèi)存、64TB/s帶寬,性能更是高達(dá)FP16 18.5 PFlops、FP8 37 PFlops、FP6/FP4 74 PFlops。
它也將在明年下半年供貨。
Instinct系列的性能進(jìn)步幅度無(wú)疑是飛躍性的,一代一個(gè)新模樣,跨代對(duì)比更是驚人。
MI355X對(duì)比MI300X,F(xiàn)P16性能達(dá)到了7.4倍之多,HBM容量也有1.5倍,所能處理的模型參數(shù)規(guī)模,也從7140億增加到4.2萬(wàn)億,足足6倍之多。
展望未來(lái),2026年將推出再下一代的Instinct MI400系列,基于再下一代的CDNA架構(gòu)(CDNA 5?),規(guī)格和性能必將再次邁上一個(gè)大大的臺(tái)階。
相關(guān)推薦
- (鄉(xiāng)村行·看振興)“慢生意”拼出大市場(chǎng) 河南尉氏小鎮(zhèn)琢玉、制香遠(yuǎn)名揚(yáng)
- 瑞典媒體:姆巴佩接受瑞典警方“合理懷疑”調(diào)查,屬低級(jí)別調(diào)查
- [流言板]長(zhǎng)驅(qū)直入!布朗尼一條龍突破殺入內(nèi)線,助攻科洛科完成扣籃
- 希勒:亞當(dāng)斯是最難纏的對(duì)手,曾被干到嘴唇縫了7針&鼻子骨折
- 亞馬爾本賽季西甲首發(fā)12場(chǎng)巴薩全勝,未首發(fā)4場(chǎng)巴薩0勝
- [流言板]把把C!鮑威爾全場(chǎng)23中10得到31分12板,連續(xù)8場(chǎng)砍下20+得分
- 邁尼昂:比利時(shí)是來(lái)復(fù)仇的會(huì)給我們制造麻煩,這是一場(chǎng)偉大的勝利
- 未來(lái)看你們的!一青訓(xùn)球員:我們這代人能讓中國(guó)足球越來(lái)越好