11月14日 硅谷正在向AI數(shù)據(jù)中心投入數(shù)萬億美元,在巨額資本的刺激下,芯片制造商加速創(chuàng)新,其中網(wǎng)絡(luò)連接技術(shù)成為創(chuàng)新重點(diǎn),該技術(shù)用來連接芯片與芯片、服務(wù)器機(jī)架與服務(wù)器機(jī)架。
自計算機(jī)誕生以來,網(wǎng)絡(luò)技術(shù)一直都是IT產(chǎn)業(yè)的核心,它至關(guān)重要,連接大型主機(jī),實(shí)現(xiàn)數(shù)據(jù)共享。在半導(dǎo)體領(lǐng)域,網(wǎng)絡(luò)技術(shù)幾乎滲透到技術(shù)棧的各個層面——從芯片內(nèi)部晶體管互連到芯片盒和機(jī)架之間的外部連接,全都有網(wǎng)絡(luò)技術(shù)的身影。
在網(wǎng)絡(luò)領(lǐng)域,華為、英偉達(dá)、博通、邁威(Marvell)擁有扎實(shí)技術(shù)?,F(xiàn)在AI時代來臨,企業(yè)開始推出新的網(wǎng)絡(luò)解決方案,目標(biāo)是加快數(shù)據(jù)傳輸速度。所以最近幾年,我們看到Lightmatter、Celestial AI、PsiQuantum等新銳公司開始占據(jù)一席之地,它們借助光學(xué)技術(shù)提高計算效率。
光學(xué)技術(shù)(又稱光子學(xué))已經(jīng)走到了發(fā)展的關(guān)鍵節(jié)點(diǎn)。PsiQuantum聯(lián)合創(chuàng)始人兼首席科學(xué)官皮特·沙德博爾特(Pete Shadbolt)表示,25年來,人們一直認(rèn)為光學(xué)技術(shù)枯燥乏味、昂貴、缺少實(shí)際用途,但AI照亮了光子學(xué)的前進(jìn)道路。
一些風(fēng)險投資家認(rèn)為,傳統(tǒng)電子互連技術(shù)無法滿足AI高帶寬要求,所以他們積極尋找可以提高數(shù)據(jù)吞吐量的創(chuàng)新方案。
英偉達(dá)提前布局,初創(chuàng)企業(yè)各展所長
Creative Strategies首席執(zhí)行官本·巴賈林(Ben Bajarin)表示:“回顧歷史,網(wǎng)絡(luò)領(lǐng)域的報道一直非??菰?,因?yàn)樗暮诵木褪菙?shù)據(jù)包交換;受到AI的驅(qū)動,網(wǎng)絡(luò)需要承載相當(dāng)龐大的工作負(fù)載,這也是最近速度相關(guān)創(chuàng)新層出不窮的原因。”
巴賈林認(rèn)為,英偉達(dá)有先見之明,多年前它就完成了兩筆關(guān)鍵收購,開始布局網(wǎng)絡(luò)領(lǐng)域。
2020年,英偉達(dá)以70億美元收購以色列邁絡(luò)思科技(Mellanox Technologies),該公司專為服務(wù)器、數(shù)據(jù)中心提供高速網(wǎng)絡(luò)解決方案。不久之后,英偉達(dá)又收購Cumulus Networks,該公司為Linux計算機(jī)網(wǎng)絡(luò)軟件系統(tǒng)提供支持。當(dāng)時英偉達(dá)已經(jīng)感知到,當(dāng)GPU憑借其并行計算能力與其他GPU結(jié)合,部署于數(shù)據(jù)中心,它的性能會更上層樓。

Lightmatter致力于研究光子芯片技術(shù),公司首席執(zhí)行官尼克·哈里斯(Nick Harris)指出,AI需要的算力每三個月翻一番,計算機(jī)芯片尺寸在不斷擴(kuò)大,當(dāng)芯片發(fā)展到一定程度,如果想繼續(xù)提升性能,必然依賴芯片之間的連接技術(shù)。
硅光子學(xué)技術(shù)是一條可行路徑,Lightmatter宣稱自己打造了全球最快的AI芯片光子引擎,從本質(zhì)上講,就是通過光互聯(lián)技術(shù)連接的3D硅堆疊結(jié)構(gòu)。目前Lightmatter已經(jīng)獲得5億美元投資,估值達(dá)44億美元。
哈里斯(Nick Harris)認(rèn)為:“計算的未來確實(shí)與光息息相關(guān),電子技術(shù)肯定會繼續(xù)存在,軟件也是不可或缺的關(guān)鍵部分,但在當(dāng)前的計算規(guī)模下,我們需要新思路,光技術(shù)正是計算機(jī)新前沿的重要組成部分?!?/p>
初創(chuàng)公司Celestial AI主攻光學(xué)互聯(lián)技術(shù),它于今年早些時候融資2.5億美元;光量子計算機(jī)開發(fā)商PsiQuantum今年9月融資10億美元,估值達(dá)70億美元。
目前光學(xué)網(wǎng)絡(luò)技術(shù)仍面臨挑戰(zhàn),比如成本過高,需要高度專業(yè)的設(shè)備,而且產(chǎn)業(yè)還要求它必須兼容電子系統(tǒng)。
不論未來是電子技術(shù)取勝,還是光子技術(shù)占據(jù)上風(fēng),或者二者兼而有之,網(wǎng)絡(luò)都會是核心。
中外企業(yè)競逐網(wǎng)絡(luò)技術(shù)創(chuàng)新
在AI發(fā)展過程中,英偉達(dá)成為GPU技術(shù)垂直整合商,博通則提供定制芯片、加速器及高速網(wǎng)絡(luò)技術(shù)。博通目前的市值高達(dá)1.7萬億美元,與谷歌、Meta、OpenAI都有合作,它向合作伙伴提供數(shù)據(jù)中心芯片。
在光子學(xué)領(lǐng)域,博通也處于前沿位置。上個月,有報道稱博通準(zhǔn)備推出名為Thor Ultra的新型網(wǎng)絡(luò)芯片,它可以讓AI系統(tǒng)與數(shù)據(jù)中心其他部分實(shí)現(xiàn)高速連接。
還有很多企業(yè)也在向網(wǎng)絡(luò)技術(shù)下注。例如,安謀(ARM)以2.65億美元收購網(wǎng)絡(luò)公司DreamBig。在財報會議上,安謀首席執(zhí)行官勒內(nèi)·哈斯(Rene Haas)宣稱DreamBig對橫向擴(kuò)展和縱向擴(kuò)展網(wǎng)絡(luò)至關(guān)重要,也就是說它的技術(shù)可以讓單個芯片集群在內(nèi)部實(shí)現(xiàn)連接、高速傳輸數(shù)據(jù),這與芯片機(jī)架之間的連接有所不同。
在國內(nèi),華為推出的大規(guī)模超節(jié)點(diǎn)互聯(lián)技術(shù)走的也是相同路徑。當(dāng)AI集群規(guī)模達(dá)到數(shù)萬乃至數(shù)十萬張卡時,節(jié)點(diǎn)間的通信效率會急劇下降,華為“超節(jié)點(diǎn)”技術(shù)可以解決這一問題。

諾基亞前數(shù)據(jù)中心副總裁邁克·布什翁(Mike Bushong)認(rèn)為:“更強(qiáng)大、更先進(jìn)的AI離不開計算能力,而且是海量的計算能力。如今,每部署1兆瓦數(shù)據(jù)中心容量,網(wǎng)絡(luò)相關(guān)支出的成本排在第二位,僅次于AI系統(tǒng)本身?!?/p>
生成式AI模型依賴跨節(jié)點(diǎn)、跨機(jī)架的實(shí)時信息共享,如果說GPU是腦細(xì)胞,網(wǎng)絡(luò)就是神經(jīng)系統(tǒng),它通過信號傳遞將所有腦細(xì)胞連接起來。
存儲即服務(wù)提供商Zadara的首席執(zhí)行官約拉姆·諾維克(Yoram Novick)警告稱:“如果不能確保擁有充足的互連帶寬,僅僅簡單增強(qiáng)GPU性能,可能會導(dǎo)致收益遞減。”
目前的AI網(wǎng)絡(luò)主要圍繞以太網(wǎng)(Ethernet)、無限帶寬技術(shù)(InfiniBand)、NVLink和超加速器鏈路(UALink)展開。以太網(wǎng)和無限帶寬技術(shù)用于連接多臺服務(wù)器,后者因?yàn)閾碛谐脱舆t和更高帶寬,是AI訓(xùn)練場景的首選方案。但在不久的將來,預(yù)計以太網(wǎng)技術(shù)將成為主導(dǎo)。
彭博情報(Bloomberg Intelligence)分析師稱,目前訓(xùn)練環(huán)節(jié)約占數(shù)據(jù)中心支出的60%,預(yù)計到2032年更多資源將向推理傾斜,訓(xùn)練環(huán)節(jié)占比將降至20%。隨著推理需求增長,工作負(fù)載將更多實(shí)現(xiàn)跨數(shù)據(jù)中心部署,屆時高速網(wǎng)絡(luò)將會變得更為重要。
總之,AI基礎(chǔ)設(shè)施新時代已經(jīng)到來,效率不僅由計算速度定義,網(wǎng)絡(luò)性能同樣關(guān)鍵,這是必然的發(fā)展趨勢,大家須引起注意。

