-->
英偉達(dá)“三相之力”,加速構(gòu)建AI帝國(guó)
顯卡無(wú)疑已經(jīng)是當(dāng)下IT圈子最熱門(mén)的話(huà)題,但對(duì)于NVIDIA而言,關(guān)于圖形、視覺(jué)乃至大規(guī)模并行運(yùn)算的征程,已經(jīng)開(kāi)啟了新的起點(diǎn)。NVIDIA在不久前舉行的GTC大會(huì)上連發(fā)三款基于Arm IP打造的處理器,包括全球首款專(zhuān)為T(mén)B級(jí)加速計(jì)算而設(shè)計(jì)的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業(yè)界首款1000TOPS算力的自動(dòng)駕駛汽車(chē)SoC等?!叭?lèi)芯片,逐年飛躍,一個(gè)架構(gòu)?!盢
2021-05-21 09:48:43
來(lái)源:中國(guó)電子報(bào)、電子信息產(chǎn)業(yè)網(wǎng) 李秧??

顯卡無(wú)疑已經(jīng)是當(dāng)下IT圈子最熱門(mén)的話(huà)題,但對(duì)于NVIDIA而言,關(guān)于圖形、視覺(jué)乃至大規(guī)模并行運(yùn)算的征程,已經(jīng)開(kāi)啟了新的起點(diǎn)。NVIDIA在不久前舉行的GTC大會(huì)上連發(fā)三款基于Arm IP打造的處理器,包括全球首款專(zhuān)為T(mén)B級(jí)加速計(jì)算而設(shè)計(jì)的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業(yè)界首款1000TOPS算力的自動(dòng)駕駛汽車(chē)SoC等。

“三類(lèi)芯片,逐年飛躍,一個(gè)架構(gòu)?!盢VIDIA數(shù)據(jù)中心路線(xiàn)圖中包括CPU、GPU和DPU這三類(lèi)芯片,集齊“未來(lái)計(jì)算的三大支柱”,這也標(biāo)志著NVIDIA異構(gòu)計(jì)算布局趨于完善,成為全棧計(jì)算平臺(tái)。

專(zhuān)用AI計(jì)算CPU:NVIDIA GRACE

NVIDIA發(fā)布的首款中央處理器Grace成為本次GTC的焦點(diǎn),其面向超大型AI模型的和高性能計(jì)算?;贕race的系統(tǒng)與NVIDIA GPU緊密結(jié)合,性能將比目前最先進(jìn)的NVIDIA DGX系統(tǒng)(在x86 CPU上運(yùn)行)高出10倍。

GRACE的重大創(chuàng)新包括:內(nèi)置下一代Arm Neoverse內(nèi)核,單CPU在SPECrate2017_int_base基準(zhǔn)測(cè)試超300分;采用第四代NVIDIA NVLink,從CPU到GPU連接速度超過(guò)900GB/s,達(dá)到相當(dāng)于目前服務(wù)器14倍的帶寬,從CPU到CPU的速度超過(guò)600GB/s;擁有最高的內(nèi)存帶寬,采用的新內(nèi)存LPDDR5x技術(shù),帶寬是LPDDR4的兩倍,能提供更多算力。

數(shù)據(jù)中心處理器DPU:NVIDIA BlueField-3

為了獲得更好的數(shù)據(jù)中心軟件定義網(wǎng)絡(luò)、存儲(chǔ)、網(wǎng)絡(luò)安全加速,NVIDIA還推出了首款為AI加速度BlueField-3 DPU。DPU針對(duì)多用戶(hù)、云原生環(huán)境優(yōu)化,提供數(shù)據(jù)中心軟件定義和硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全、管理內(nèi)容。

NVIDIA BlueField-3 DPU包含220億個(gè)晶體管,采用16個(gè)Arm A78 CPU核心、18M IOPs彈性塊存儲(chǔ),加密速度是上一代的4倍,并完全向下兼容BlueField-2。該產(chǎn)品預(yù)計(jì)將于2022年第一季度發(fā)布樣品。

BlueField-3 DPU的重大創(chuàng)新包括:是首款支持第五代PCIe總線(xiàn)并提供數(shù)據(jù)中心時(shí)間同步加速的DPU;BlueField-3能夠卸載相當(dāng)于300個(gè)CPU核的工作負(fù)載,以400Gbps的速率對(duì)網(wǎng)絡(luò)流量進(jìn)行保護(hù)、卸載和加速;通過(guò)全新發(fā)布的NVIDIA DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開(kāi)發(fā)包為開(kāi)發(fā)者提供一個(gè)完整、開(kāi)放的軟件平臺(tái),開(kāi)發(fā)在BlueField DPU上開(kāi)發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全和管理等應(yīng)用。

GPU賦能推動(dòng)ARM生態(tài)

NVIDIA Ampere架構(gòu)GPUA100于2020 GTC發(fā)布,今年大會(huì)則主要發(fā)布基于新架構(gòu)GPU的產(chǎn)品,并致力于借助GPU賦能推動(dòng)ARM生態(tài)。

NVIDIA升級(jí)并打造了“便攜式AI數(shù)據(jù)中心”——NVIDIA DGX Station,以及NVIDIA專(zhuān)為密集型AI研發(fā)打造的AI數(shù)據(jù)中心產(chǎn)品——NVIDIA DGX SuperPOD。NVIDIA DGX Station 320G連接4個(gè)NVIDIA A100 GPU并達(dá)8TB/s的帶寬,性?xún)r(jià)比獲得很大提升;NVIDIA DGX SuperPOD目前是世界上首臺(tái)原生超級(jí)計(jì)算機(jī),使用全新80GB NVIDIA A100,將其HBM2e 內(nèi)存提升至90TB,實(shí)現(xiàn)2.2EB/s的總帶寬。

NVIDIA發(fā)布了用于訓(xùn)練Transformers的超大語(yǔ)言模型的NVIDIA Megatron Triton推理服務(wù)器。Transformers已幫助開(kāi)發(fā)者在自然語(yǔ)言處理領(lǐng)域取得了突破性進(jìn)展,能夠生成文檔摘要、將電子郵件中的短語(yǔ)補(bǔ)充完整、甚至讓AI根據(jù)用戶(hù)的期望自己編寫(xiě)代碼。通過(guò)分布式計(jì)算,原本雙CPU服務(wù)器1分鐘只能響應(yīng)1項(xiàng)查詢(xún),使用Megatron Triton的DGX能在1秒內(nèi)實(shí)現(xiàn)16項(xiàng)查詢(xún)。

NVIDIA還發(fā)布了新一代AI自動(dòng)駕駛汽車(chē)處理器DRIVE Atlan,算力將達(dá)到1000TOPS,約是上一代Orin處理器的4倍,超過(guò)了大多數(shù)L5無(wú)人駕駛出租車(chē)的總計(jì)算能力。采用下一代GPU的體系結(jié)構(gòu)、新型Arm CPU內(nèi)核、新深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器,內(nèi)置為先進(jìn)的網(wǎng)絡(luò)、存儲(chǔ)和安全服務(wù)的BlueField DPU,網(wǎng)絡(luò)速度可達(dá)400Gbps。

此外,NVIDIA還與亞馬遜云科學(xué)(AWS)、Marvell、聯(lián)發(fā)科、富士通等加強(qiáng)了合作,推動(dòng)云服務(wù)、科學(xué)及AI應(yīng)用開(kāi)發(fā)、打造GPU驅(qū)動(dòng)的新型PC,共同致力于擴(kuò)展Arm生態(tài)系統(tǒng)。

目標(biāo)構(gòu)建AI帝國(guó)

NVIDIA基于GPU、CPU、DPU“三項(xiàng)之力”的硬件基礎(chǔ),還在持續(xù)打造介于硬件和軟件之間的底層技術(shù)、計(jì)算機(jī)工具乃至實(shí)用的應(yīng)用框架。

針對(duì)專(zhuān)業(yè)領(lǐng)域的云原生平臺(tái)NVIDIA Omniverse平臺(tái)能夠在虛擬世界中匯聚全球各地的工程師、科學(xué)家,在多個(gè)GPU的共同協(xié)助下實(shí)現(xiàn)高物理精度,并充分運(yùn)用RTX實(shí)時(shí)光線(xiàn)追蹤、DLSS技術(shù),利用NVIDIA MDL模擬材料、NVIDIA PhysX模擬物理,NVIDIA AI完成人工智能推算的線(xiàn)上平臺(tái)。擁有了更強(qiáng)的普適性,已適用于建筑、娛樂(lè)、游戲、廣告等行業(yè)。

先進(jìn)的對(duì)話(huà)式AI平臺(tái)NVIDIA Jarvis可達(dá)到90%的識(shí)別精度,并支持5種語(yǔ)言:英語(yǔ)、日語(yǔ)、西班牙語(yǔ)、德語(yǔ)、法語(yǔ)和俄語(yǔ),未來(lái)將會(huì)有更多語(yǔ)言加入其中,這使得國(guó)際會(huì)議將會(huì)變得更輕松;可糾正目光接觸的會(huì)議軟件NVIDIA Maxine會(huì)自動(dòng)糾正視頻會(huì)議中與會(huì)人的注視位置;NVIDIA自動(dòng)駕駛汽車(chē)計(jì)算系統(tǒng)級(jí)芯片NVIDIA DRIVE Orin將與2022年投產(chǎn),可處理集群、信息娛樂(lè)、乘客交互AI及非常重要的信息視圖或感知世界模型,將實(shí)際感知構(gòu)建成一個(gè)3D環(huán)繞模型。

NVIDIA已經(jīng)創(chuàng)建了Tensor Core GPU、NVLINK、DGX、cuDNN、RAPIDS、NCCL、GPU Dirext、DOCA等眾多技術(shù),所有的這些底層技術(shù),統(tǒng)稱(chēng)為NVIDIA AI。NVIDIA AI已集成到所有業(yè)內(nèi)流行的工具和工作流程中,并且可在搭載NVIDIA GPU的任何系統(tǒng)上運(yùn)行,包括PC、筆記本電腦、工作站、超級(jí)計(jì)算機(jī)、云平臺(tái)等。現(xiàn)在缺少的是5G技術(shù)的連接,日常所使用的消費(fèi)級(jí)5G技術(shù)只是錦上添花,而未來(lái)專(zhuān)用5G技術(shù)將為AI技術(shù)帶來(lái)革命性的變化。

注:作者為賽迪顧問(wèn)集成電路產(chǎn)業(yè)研究中心高級(jí)分析師

原創(chuàng)文章
最新文章
1
破解“能凍不能解”世紀(jì)難題!美菱M鮮生Ultra501S冰箱重塑家庭保鮮新標(biāo)準(zhǔn)
2
快手快聘年度紀(jì)實(shí)片:藍(lán)領(lǐng)工作《職得》被看見(jiàn)
3
突破行業(yè)困局 “超激鼓”技術(shù)為激光打印機(jī)行業(yè)良性發(fā)展提供新方案
4
蘋(píng)果首款智能眼鏡或2026年發(fā)布 依賴(lài)iPhone聯(lián)動(dòng)
5
預(yù)計(jì)2025年家用投影市場(chǎng)出貨量為521.9萬(wàn)臺(tái),同比下滑16.1%
6
26年新規(guī)上線(xiàn),冰箱、熱水器行業(yè)將迎來(lái)“大換血”
7
受蘋(píng)果首款折疊屏iPhone影響 預(yù)計(jì)2026年折疊屏手機(jī)出貨量暴漲近30%
8
全球2025Q3真無(wú)線(xiàn)耳機(jī)TOP5出爐:蘋(píng)果第一、小米第二
9
小米、格力、美的等家電廠(chǎng)商簽署自律公約:推進(jìn)空調(diào)“鋁代銅”
10
蘋(píng)果iOS 26.2正式版下周發(fā)布:動(dòng)效絲滑流暢!8大新功能
11
每個(gè)設(shè)備都智能,為何生活更麻煩?
12
從滾筒活水洗地機(jī)市場(chǎng)“碾壓式領(lǐng)先”,看科沃斯的“開(kāi)辟式創(chuàng)新”
13
聚焦“AI向?qū)崱保?025 TCL全球技術(shù)創(chuàng)新大會(huì)舉辦
14
5萬(wàn)頁(yè)硒鼓+1200dpi!漢印“超激鼓”激光打印機(jī)上手體驗(yàn)
15
徠芬也做洗地機(jī),“攪局者”還是“長(zhǎng)跑者”?
16
多維“引擎”拉動(dòng),我國(guó)航天新質(zhì)生產(chǎn)力加速形成
17
Pro Max不再獨(dú)屬蘋(píng)果:安卓多家廠(chǎng)商將齊上陣
18
潛望長(zhǎng)焦終回歸!真我16 Pro+影像配置補(bǔ)全
19
激增141%,預(yù)計(jì)2025年全球Mini LED電視出貨將突破1300萬(wàn)臺(tái)
20
跨界算力遇阻?億田智能出售相關(guān)資產(chǎn)
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512