Dec 18, 2020

GTC20干貨縱覽|取代摩爾定律，黃氏法則成AI性能最新標(biāo)準(zhǔn)！

12月15日上午10點，NVIDIA召開GTC20中國線上大會，今日的主題演講嘉賓由NVIDIA CEO黃仁勛換成了首席科學(xué)家Bill Dally，分享關(guān)于AI、計算機圖形學(xué)、高性能計算、邊緣計算、機器人等領(lǐng)域最前沿的創(chuàng)新以及AI推理、GPU集群加速等最新的研究成果。

黃氏定律：AI性能實現(xiàn)逐年翻倍

NVIDIA的研究人員致力于打造速度更快的AI芯片，并將其用于具有更高帶寬的系統(tǒng)，從而簡化編程。

下面這張圖表展示了從2012年的Kepler，一直到今年5月份的Ampere A100，單芯片推理性能提高了317倍。

這就是「黃氏法則」——推理性能每年翻一倍。Bill Dally稱：“在‘摩爾定律’失效的當(dāng)下，如果我們真想提高計算機性能，‘黃氏定律’就是一項重要指標(biāo)，且在可預(yù)見的未來都將一直適用?！?/p>

接著在談到如何成功實現(xiàn)“黃氏定律 (Huang’s Law)”時，Bill Dally著重分享了自己200人研究團隊在AI、高速互聯(lián)領(lǐng)域的相關(guān)研究。

1.超高能效加速器

NVIDIA 研究人員專門開發(fā)了一種名為MAGNet的工具，其生成的AI推理加速器在模擬測試中，能夠達(dá)到每瓦100 teraops的推理能力，比目前的商用芯片高出一個數(shù)量級。

MAGNet采用了一系列新技術(shù)來協(xié)調(diào)并控制通過設(shè)備的信息流，最大限度地減少數(shù)據(jù)傳輸，而數(shù)據(jù)傳輸正是當(dāng)今芯片中最耗能的環(huán)節(jié)。這一研究原型以模組化實現(xiàn)，因此能夠靈活擴展。

2.發(fā)揮所有光子的潛能

研究團隊還開展了一項研究，旨在以更快速的光鏈路取代現(xiàn)有系統(tǒng)內(nèi)的電氣鏈路。通過一條光纖來傳輸數(shù)十路信號，有望在僅一毫米大小的芯片上實現(xiàn)Tb/s級數(shù)據(jù)的傳輸，是如今互連密度的十倍以上。

除了更大的吞吐量，光鏈路也有助于打造更為密集型的系統(tǒng)。Dally舉例展示了一個未來將搭載160多個GPU的NVIDIA DGX系統(tǒng)模型（上圖）。

3.立足網(wǎng)絡(luò)領(lǐng)域

Dally還牽頭開展了一項合作，構(gòu)建了NVLink和NVSwitch最初的原型。NVLink和NVSwitch如今用于全球最大型的超級計算機中，實現(xiàn)了其內(nèi)部GPU的互連。

在11月舉行的超算TOP500榜單中，采用NVIDIA技術(shù)的超算在前10名中占了8位，Selene超算在TOP500和Green500中都排名第五。

NVIDIA芯片深融中國創(chuàng)新土壤

NVIDIA A100，不僅是世界最大的7nm芯片，具有540億個晶體管，而且與之前的AI推理方案Turing T4相比，在所有基準(zhǔn)測試中，A100的速度都提高了6到8倍。

最讓Dally興奮的是，Ampere破解了如何利用神經(jīng)網(wǎng)絡(luò)的稀疏性來獲得更好的性能。如果需要縮減它的計算能力，MIG（多實例GPU）還可以將一個A100分解為7個獨立的GPU，以便每個GPU都能運行各自的任務(wù)。

在中國，眾多CSP客戶已采用NVIDIA A100 Tensor Core GPU和NVIDIA技術(shù)，用于提速各類AI應(yīng)用，如推薦、廣告、搜索、直播、視頻等等。

淘寶使用NVIDIA GPU 計算平臺，為直播和基于AI的推薦系統(tǒng)提供加速，從而為觀眾帶來個性化體驗。

快手針對低分辨率短視頻，利用 GPU 做超分辨率處理，提高視頻分辨率到720p或1080p。

Bigo Live使用 GPU 提升視頻內(nèi)容創(chuàng)作和內(nèi)容理解能力。

虎牙通過開發(fā)AI數(shù)字人業(yè)務(wù)，為內(nèi)容創(chuàng)建者創(chuàng)造獨特的用戶體驗，其中GPU在AI和渲染技術(shù)方面發(fā)揮了關(guān)鍵作用。

JDL京東物流和NVIDIA將共同致力于把江蘇常熟打造成全球首座“智能配送城”，以解放快遞員雙手、緩解快遞員短缺的情況，并有助于降低人力成本。

通過搭載NVIDIA Jetson AGX Xavier，并配備高分辨率攝像頭以及激光雷達(dá)，JDL京東物流智能快遞車可實時識別行人、車輛和交通信號燈等物體，并根據(jù)所處環(huán)境規(guī)劃駕駛路線，確保交通安全。

NVIDIA Jetson AGX Xavier可提供32TOPS的AI性能，該模塊尺寸為100x87mm，僅為大型工作站的十分之一，卻提供了與大型工作站相當(dāng)?shù)膬?yōu)越性能。因尺寸小巧，該模塊十分適合搭載于配送和物流機器人、工廠系統(tǒng)和大型工業(yè)UAV等自主機器。

寬泛科技—NVIDIA AI加速計劃成員

8卡A100服務(wù)器、全系Jetson定制提供

Dally回顧AI發(fā)展的歷程時，他說到：“當(dāng)前的AI革命其實就是由GPU創(chuàng)造的，以深度神經(jīng)網(wǎng)絡(luò)為例，有3個關(guān)鍵組成部分在發(fā)揮作用，算法，即深度神經(jīng)網(wǎng)絡(luò)本身，訓(xùn)練數(shù)據(jù)，以及運行所需的硬件?！?/p>

寬泛科技作為英特爾、英偉達(dá)等芯片及品牌廠商的堅實合作伙伴，NVIDIA潛力AI公司加速計劃成員，攜手專注為人工智能提供硬件解決方案及相關(guān)服務(wù)，已成為國內(nèi)過萬家企業(yè)、院校及研究機構(gòu)的信息化解決方案供應(yīng)商。

8卡A100 GPU服務(wù)器

NVIDIA A100的Tensor Core借助Tensor浮點運算 (TF32) 精度，可提供比上一代Volta高20倍之多的性能，并且無需更改代碼；若使用自動混合精度和FP16，性能可進一步提升2倍。它代表了強大的數(shù)據(jù)中心端到端AI和HPC平臺，在超大模型和龐大數(shù)據(jù)集下，實現(xiàn)出色加速，有效助力全球高性能彈性數(shù)據(jù)中心。

Cloudhin云軒8卡A100 GPU服務(wù)器最高可集成8塊NVIDIA TESLA A100，單機多卡高密度集成，專為世界上最嚴(yán)苛、最復(fù)雜的工作負(fù)載運算提供卓越性能而設(shè)計，幫助企業(yè)、高校及研究人員輕松應(yīng)對AI、數(shù)據(jù)科學(xué)、科研計算等多個領(lǐng)域的大型深度學(xué)習(xí)模型訓(xùn)練和大量數(shù)據(jù)的推理。

Jetson邊緣計算平臺

無論對于大型企業(yè)、中小型企業(yè)還是研究機構(gòu)而言，Jetson系列模塊都可以提供滿足特定性能和預(yù)算需求的解決方案。無人機、自動化工控、智能安防和智慧影像分析等行業(yè)專業(yè)應(yīng)用，歡迎聯(lián)系我們進行配套定制。

專業(yè)勤修，銳意進取，Cloudhin云軒技術(shù)工程師畢業(yè)于NVIDIA深度學(xué)習(xí)研究所，豐富經(jīng)驗，值得信賴。更多行業(yè)定制方案請聯(lián)系客服，我們將實時響應(yīng)您的定制需求。

聯(lián)系我們

如果您有合作需求或?qū)氋F建議，歡迎來信。

郵箱：hezuo@kuanfans.com

合作熱線：021-5415 5559

返回列表

.精品久久久麻豆国产精品,а√天堂网www在线中文,国产成人欧美一区二区三区,疯狂的欧美乱大交另类,99热都是精品久久久久久

GTC20干貨縱覽|取代摩爾定律，黃氏法則成AI性能最新標(biāo)準(zhǔn)！

核心業(yè)務(wù)

合作伙伴

客戶案例

新聞資訊

行研報告

關(guān)于我們

加入我們

會員中心

.精品久久久麻豆国产精品,а√天堂网www在线中文,国产成人欧美一区二区三区,疯狂的欧美乱大交另类,99热都是精品久久久久久

GTC20干貨縱覽|取代摩爾定律，黃氏法則成AI性能最新標(biāo)準(zhǔn)！

推薦新聞

WAIC2025倒計時！寬泛云6U八卡AI服務(wù)器：以硬核算力重構(gòu)智能未來

未來已來，復(fù)興相見！寬泛科技閃耀2025楊浦全球推介大會

核心業(yè)務(wù)

合作伙伴

客戶案例

新聞資訊

行研報告

關(guān)于我們

加入我們

會員中心

GTC20干貨縱覽|取代摩爾定律，黃氏法則成AI性能最新標(biāo)準(zhǔn)！

WAIC2025倒計時！寬泛云6U八卡AI服務(wù)器：以硬核算力重構(gòu)智能未來

未來已來，復(fù)興相見！寬泛科技閃耀2025楊浦全球推介大會