欧美乱妇狂野欧美在线视频,人妻无码第一区二区三区 ,日本国产一区二区三区在线观看

華為自研HBM內(nèi)存正式公布

日期： 2025-09-18

來源：快科技

關(guān)鍵詞： 華為昇騰 HBM

9月18日消息，今日舉辦的華為全聯(lián)接大會(huì)2025上，華為輪值董事長徐直軍首次公布了昇騰芯片演進(jìn)和目標(biāo)。

他表示，未來三年，華為已經(jīng)規(guī)劃了昇騰多款芯片，包括昇騰950PR、950DT以及昇騰960、970。其中昇騰950PR 2026年第一季度對(duì)外推出，該芯片采用了華為自研HBM。

根據(jù)現(xiàn)場公布的信息，昇騰950PR芯片架構(gòu)新增支持低精度數(shù)據(jù)格式，其中FP8/MXFP8/HIF8: 1 PFLOPS，MXFP4: 2 PFLOPS，重點(diǎn)提升向量算力，提升互聯(lián)寬帶2.5倍，支持華為自研HBM高帶寬內(nèi)存，分為HiBL 1.0和HiZQ 2.0兩個(gè)版本。

規(guī)格方面，HiBL 1.0容量128GB，帶寬1.6TB/s；HiZQ 2.0容量144GB，帶寬4TB/s。

其中，昇騰950PR芯片采用950核心+HiBL 1.0內(nèi)存，可提升推理Prefill（預(yù)填充）性能，提升推薦業(yè)務(wù)性能。

昇騰950DT采用HiZQ 2.0內(nèi)存，可提升推理Decode（解碼）性能，提升訓(xùn)練性能，提升內(nèi)存容量和帶寬。

延伸閱讀：

在大模型推理中，Prefill階段負(fù)責(zé)接收完整輸入數(shù)據(jù)（如文本或圖像），并計(jì)算緩存。這一過程需要強(qiáng)大的算力支持，通常由高性能芯片完成。該階段強(qiáng)調(diào)算力而非內(nèi)存帶寬，因此更適合在HBM（高帶寬內(nèi)存）芯片上運(yùn)行。相比之下，后續(xù)的Decode階段更依賴高速內(nèi)存?zhèn)鬏敽突ヂ?lián)方案。

HBM（High Bandwidth Memory，高帶寬內(nèi)存）是一種基于3D堆疊技術(shù)的先進(jìn)DRAM解決方案，多層DRAM芯片垂直集成，顯著提升數(shù)據(jù)傳輸效率。具有超高帶寬與低延遲、高容量密度、高能效比等優(yōu)勢，能協(xié)助快速處理數(shù)據(jù)密集型的AI任務(wù)。

美國國際戰(zhàn)略研究中心（CSIS）AI專家艾倫（Gregory Allen）解釋，HBM對(duì)于制造先進(jìn)AI芯片至關(guān)重要，價(jià)值約占整體芯片的一半。

AI推理需頻繁調(diào)用海量模型參數(shù)（如千億級(jí)權(quán)重）和實(shí)時(shí)輸入數(shù)據(jù)。HBM的高帶寬和大容量允許GPU直接訪問完整模型，可避免傳統(tǒng)DDR內(nèi)存因帶寬不足導(dǎo)致的算力閑置。對(duì)于千億參數(shù)以上的大模型，HBM可顯著提升響應(yīng)速度。

當(dāng)下，HBM已成為高端AI芯片的標(biāo)配，訓(xùn)練側(cè)滲透率接近100%，推理側(cè)隨模型復(fù)雜化加速普及。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

華為自研HBM內(nèi)存正式公布

日期： 2025-09-18

來源：快科技

相關(guān)內(nèi)容