《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 高通發(fā)布兩款A(yù)I芯片挑戰(zhàn)英偉達(dá)

高通發(fā)布兩款A(yù)I芯片挑戰(zhàn)英偉達(dá)

股價(jià)漲超20%
2025-10-28
來(lái)源:IT之家

10 月 27 日消息,高通公司今日發(fā)布其新一代數(shù)據(jù)中心 AI 推理優(yōu)化解決方案:基于高通 AI200 和 AI250 芯片的加速卡和機(jī)架。

format,f_avif.avif.jpg

高通 AI200 推出一款專(zhuān)為機(jī)架級(jí) AI 推理設(shè)計(jì)的解決方案,旨在提供低擁有總成本(TCO)和優(yōu)化的性能,用于大型語(yǔ)言和多模態(tài)模型(LLM、LMM)推理和其他 AI 工作負(fù)載。每張卡支持 768GB 的 LPDDR 內(nèi)存,以實(shí)現(xiàn)更高的內(nèi)存容量和更低的成本。

高通 AI250 解決方案將采用基于近內(nèi)存計(jì)算(near-memory computing)的創(chuàng)新內(nèi)存架構(gòu),通過(guò)提供超過(guò) 10 倍的內(nèi)存帶寬提升和降低功耗,為 AI 推理工作負(fù)載帶來(lái)更高的效率與性能。

這兩種機(jī)架解決方案均采用直接液冷技術(shù)以提高散熱效率,支持 PCIe 擴(kuò)展、以太網(wǎng)擴(kuò)展、機(jī)密計(jì)算以保障 AI 工作負(fù)載安全,以及 160 kW 的機(jī)架級(jí)功耗。

format,f_avif.avif (1).jpg

高通的超大規(guī)模 AI 軟件棧,從應(yīng)用層到系統(tǒng)軟件層覆蓋端到端,專(zhuān)為 AI 推理進(jìn)行了優(yōu)化。該棧支持領(lǐng)先的機(jī)器學(xué)習(xí)(ML)框架、推理引擎、生成式 AI 框架,以及 LLM / LMM 推理優(yōu)化技術(shù)(如解耦合服務(wù))。開(kāi)發(fā)者可借助高通技術(shù)的 Efficient Transformers Library 和高通 AI 推理套件,實(shí)現(xiàn)模型的平滑上載和 Hugging Face 模型的一鍵部署。高通的軟件提供即用型 AI 應(yīng)用和代理、全面的工具、庫(kù)、API 和服務(wù),用于 AI 的運(yùn)營(yíng)。

高通 AI200 和 AI250 預(yù)計(jì)分別于 2026 年和 2027 年商用。

截至發(fā)文,高通公司股價(jià)大漲 20%。

format,f_avif.avif (2).jpg


subscribe.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。