“身外身法“還有一個我們都熟悉的名字,那就是“分身術”。

乍看之下,分身術屬于《西游記》當中比較初級的法術,不少有個名號的小妖都能比劃兩下。但在另一方面,能夠像孫悟空一樣運用到嘆為觀止的地步,那可就不多嘍。

正因如此,把“達芬奇架構”排在華為十大嚇人技術之首。簡單來說,達芬奇架構確實稱得上是超強分身術,屬于華為AI芯片的“秘密武器”。

這個面向AI的全新計算架構,具備高算力、高能效、靈活可裁剪的特性。它集成了向量、標量、硬件加速器等多種計算單元。同時支持多種精度計算,支撐訓練和推理兩種場景的數(shù)據(jù)精度要求,實現(xiàn)AI的全場景需求覆蓋。

基于自研的達芬奇架構,華為推出了目前單芯片計算密度最大的芯片昇騰910以及主打高效計算低功耗AI芯片昇騰310,和Atlas人工智能計算平臺,系列產(chǎn)品可用于公共安全、運營商、金融等行業(yè)。比如,Atlas 200 AI加速模塊可以用于攝像頭、無人機等終端,半張信用卡大小就可以支持16路高清視頻實時分析。

實際上,之所以要自研達芬奇架構,是因為華為預測2025年全球智能終端將會達到400億臺,智能助理的普及率將達到90%。舉個最簡單的例子:在那個時代,憑借強大的AI與先進的無人檢測設備輔助,“求醫(yī)問藥”的形態(tài)將會完全改變——

“專家一號難求”的掛號擠破頭乃至猖獗的黃牛號販子將不復存在,取而代之的是通過個人終端完成的自助式體檢,以及快捷高效的對癥下藥。

既無需為頭痛腦熱而遠赴醫(yī)院問診,看似無關痛癢的小病小災背后潛藏的病灶也能被及時揪出來,效率與準確度皆有極大提升。

除了醫(yī)療行業(yè)外,自動駕駛、人臉識別等多種AI細分場景都對算力有著極高的要求,而達芬奇架構正能提供強勁算力。據(jù)說,華為內(nèi)部用“算力無窮無盡”來描述,無窮無盡,可不就像孫大圣拔一把毫毛,吹出數(shù)不盡的“大圣”嘛!

七十二變——A-Tune智能調(diào)優(yōu)技術

要說孫悟空最廣為人知的技能,那不用多說,肯定就是七十二般變化了:大可變做平地而起的高山,小可變身桌上水果盤的一粒葡萄,不管是看上去多難纏的妖孽,有了七十二變撐腰,孫行者總能化險為夷,找到破解的訣竅。

傳統(tǒng)的操作系統(tǒng),為上層應用提供通用機制來管理硬件資源并進行資源調(diào)度,但在現(xiàn)實世界中,豐富的應用千差萬別,對于資源的需求也各不相同,每個具體應用往往需要依賴程序員的個人經(jīng)驗進行手工調(diào)優(yōu),效果難以保證。

而開發(fā)者擁有A-Tune智能調(diào)優(yōu)技術,就像是有了滿足上層應用自動進行資源調(diào)優(yōu)的法門,換句話說,A-Tune智能調(diào)優(yōu)技術能夠針對具體的業(yè)務場景進行定制,讓操作系統(tǒng)更“懂”業(yè)務場景,給出最合適的資源模型,著實千變?nèi)f化,滿足從初學者到高階開發(fā)者的各種各樣的需求,最終達到應用性能加速的目標。

換言之,A-Tune技術能完全滿足入門到專業(yè)級開發(fā)者的不同需求:

1).對于初學者來說,盡可能屏蔽華為鯤鵬硬件和OS的底層細節(jié),降低開發(fā)者的準入門檻;

2).對于高階開發(fā)者來說,可以針對具體的業(yè)務場景進行定制,比如豐富經(jīng)驗庫,訓練自己的模型,實現(xiàn)更細粒度的調(diào)優(yōu)。

總的來說,A-Tune技術能把應用&系統(tǒng)性能做到最優(yōu),從而總體上降低成本,比如以前你可能需要購買10臺服務器才能實現(xiàn)的工作,現(xiàn)在可能需要7-8臺服務器就夠?qū)崿F(xiàn)工作了。這對于人力資源有限的中小型企業(yè)的開發(fā)者來說意味著什么,應該已經(jīng)無需過多強調(diào)了吧?

基于A-Tune技術構建的華為自研操作系統(tǒng)openEuler,就體現(xiàn)出了高安全性、高可擴展性、高性能等優(yōu)勢特點。

定心真言——S2S自動微分

老母道:“東邊不遠,就是我家,想必往我家去了。我那里還有一篇咒兒,喚做定心真言,又名做緊箍兒咒。你可暗暗念熟,牢記心頭,再莫泄漏一人知道。我去趕上他,叫他還來跟你,你卻將此衣帽與他穿戴。他若不服你使喚,你就默念此咒,他再不敢行兇,也再不敢去了。”三藏聞言,低頭拜謝。

——《西游記》第十四回,“心猿歸正 六賊無蹤”

“定心真言”,也就是我們都不陌生的“緊箍咒”。

“緊箍咒”雖然簡單,卻有無窮威力,縱使孫悟空那樣的潑猴,也被唐僧的幾句咒語制得服服帖帖。而在華為的一眾嚇人技術中,最符合這個法術調(diào)性的無疑便是S2S自動微分了。

了解編程的同學都知道,業(yè)界框架實現(xiàn)的自動微分根據(jù)實現(xiàn)原理不同,自動微分可以分為3種:

以Google的TensorFlow為代表的圖方法,Facebook的PyTorch為代表的運算符重載,和華為自研的MindSpore為代表的源碼轉(zhuǎn)化方法(Source To Source,S2S)。

在華為自研的全場景AI計算框架MindSpore中的自動微分就采用S2S形式,憑借可編程性強(原生python表達+IR級可微分)、優(yōu)化效率高(豐富的編譯優(yōu)化手段+反向算子自動調(diào)優(yōu))以及豐富調(diào)試手段(可視化+動態(tài)執(zhí)行)這三大特點備受開發(fā)者的喜愛,值得一提的是,在MindSpore中開發(fā)者能夠用原生Python實現(xiàn)AI算法,另外還可使用可視化接口觀察程序運行狀態(tài),可謂是讓開發(fā)者輕松上手AI開發(fā)。

尤其對像唐僧那樣的小白、入門級開發(fā)者來說,如何更高效地完成AI算子開發(fā),應該不用我更多解釋了吧?

筋斗云——分布式深度學習技術

喜歡看孫悟空拜訪菩提祖師學技能的小伙伴們應該還記得,從最開始的稍離地面,到能飛在山谷中,再到可以連續(xù)幾個筋斗直沖天庭,雖經(jīng)歷了較長一段時間的學習,但功夫不負有心人,最終達成的效果也是有目共睹。

而在互聯(lián)網(wǎng)通信技術不斷發(fā)展的今天,我們無時無刻都能感受到信息傳遞速度帶來的影響:

從撥號通話都要祈禱模擬信號連接穩(wěn)定不會串號的1G,到從模擬進入數(shù)字時代可以發(fā)送短信的2G,到正式接入互聯(lián)網(wǎng)可以看圖的3G,再到視頻流媒體徹底改變移動互聯(lián)定義的4G,乃至潛力無窮無盡難以想象應用極限的5G,隨著每一代移動互聯(lián)網(wǎng)技術的發(fā)展進化,每一輪網(wǎng)絡傳輸效率的提升,都對我們的生活產(chǎn)生了翻天覆地的影響。

在我們感受到的這些表象背后,實際發(fā)生的動作,是在深度學習訓練過程涉及大規(guī)模的參數(shù)的網(wǎng)絡間傳遞。TensorFlow 使用中心化的網(wǎng)絡參數(shù)服務器(Parameter Server)來承擔梯度的收集、平均和分發(fā)工作,對 server 節(jié)點的訪問會成為瓶頸,帶寬利用率低。

為此,面向開發(fā)者的一站式AI開發(fā)平臺ModelArts 的團隊使用 AllReduce 算法來進行梯度聚合來優(yōu)化帶寬,同時對傳輸?shù)奶荻冗M行融合,對小于閾值大小的梯度多次傳輸合并為一次,提升帶寬利用率。

另外,在通信底層采用 nVIDIA 的 NvLink、P2P 等技術來提升節(jié)點內(nèi)和節(jié)點間通信帶寬,降低通信時延。它除了實現(xiàn)了加速比>0.85,性能的明顯提升外,基于此項技術的華為云ModelArts也憑借最快的訓練速度榮登斯坦福DAWN Benchmark榜單。

順帶一提,如果大家對這項技術的應用有興趣的話,可以留意一下ModelArts這個關鍵詞,后文有更多的應用范例。

火眼金睛——圖神經(jīng)網(wǎng)絡

倘若大鬧天宮落敗的孫悟空沒有被關進太上老君的煉丹爐里,他的一雙火眼金睛必然也不會成型;沒有火眼金睛,日后的取經(jīng)路上降妖除魔斷顯然要更添幾分難度。而在華為面對開發(fā)者的發(fā)明創(chuàng)新中,順利化用了“火眼金睛“之名的技術,無疑就是圖神經(jīng)網(wǎng)絡技術(GNN,Graph Neural Network)。

為何將二者進行對應,源于二者都是針對具體的圖像、畫面來進行分析,從而進行分析,給出結果。從技術角度來說,圖神經(jīng)網(wǎng)絡是在圖數(shù)據(jù)(非歐數(shù)據(jù))上的高階學習方法。

例如,在電子商務領域,一個基于圖的學習系統(tǒng)能夠利用用戶和產(chǎn)品之間的交互以實現(xiàn)高度精準的推薦。在化學領域,分子被建模為圖,新藥研發(fā)需要測定其生物活性。在論文引用網(wǎng)絡中,論文之間通過引用關系互相連接,需要將它們分成不同的類別。

華為在ModelArts中的高效神經(jīng)網(wǎng)絡訓練算子的基礎上,結合GES既有的高性能圖計算框架平臺能力,充分利用圖引擎高并發(fā)、低延時的特點,將GNN的訓練過程高度并行化;使用統(tǒng)一架構實現(xiàn)了非監(jiān)督的大規(guī)模圖嵌入和半監(jiān)督的圖卷積等多類GNN算法,降低了系統(tǒng)的維護成本。

這項高超技術不負眾望,榮獲了2019年人工智能峰會(CAIS)最高獎項紫金龍蟠獎。但一般的AI開發(fā)者目前對GNN算法和技術的觀念不足,想要快速迭代和優(yōu)化此項技術,需要開發(fā)者們轉(zhuǎn)變以往的觀念,多多進入GNN這個“煉丹爐”,嘗試使用GNN算法。也希望每個開發(fā)者都能擁有這項“火眼金睛”的技術,再復雜、無規(guī)則的圖數(shù)據(jù)也不是問題。

順帶一提,提到實際應用,這里正好有一個鮮活的例子:

今年7月開始,華為云聯(lián)同上海交通大學、西安交通大學、江蘇大學、南京郵電大學等超過30所大學舉辦了一場華為云人工智能大賽 · 無人車挑戰(zhàn)杯,運用華為云AI開發(fā)平臺ModelArts以及端云協(xié)同解決方案HiLens,組織大學生自研編程和訓練模型,根據(jù)預置考點進行障礙競速比賽。

號稱“更懂開發(fā)者的視覺AI應用開發(fā)平臺”的華為云HiLens可在無人車上路前,通過攝像頭采集照片開始訓練,免除采集、整合數(shù)據(jù)和設定算法的煩惱。而華為云ModelArts則提供開源數(shù)據(jù)集和自動學習、訓練模型,在 ModelArts上進行分布式訓練,可以縮短訓練時長,加快訓練速度,還具備創(chuàng)新的可視化全流程管理,讓實驗過程追蹤、結果復制不再難。

選手完成訓練作業(yè)后,ModelArts開發(fā)的模型就能直接部署到HiLens攝像頭,實現(xiàn)端云協(xié)同,一鍵部署。(如果大家對這場賽事有興趣的話,請務必一定要看到最后,有驚喜!)

瞬間移動——輕量級的云化集成開發(fā)環(huán)境

它結合代碼編輯器的輕量極速、快速文件和目錄訪問操作,多語言高亮顯示等特性,以及IDE的代碼調(diào)試和代碼理解的能力,將用戶的集成開發(fā)環(huán)境部署在云端。尤其是AI輔助編碼能力,更是把傳統(tǒng)IDE的智能聯(lián)想功能提升了一個新高度,能對代碼上下文的語義分析和理解,讓開發(fā)者基于AI可以整行補全代碼,在理想狀態(tài)下可以為開發(fā)者節(jié)省90%的編碼工作。

不得不說,云上IDE無疑好處多多。比如,程序員們可以隨時隨地進行編程,即便他們在國外度假、異地出差,只要有一個能夠訪問瀏覽的終端,即可隨時隨地解決線上生產(chǎn)環(huán)境緊急故障,以及其他開發(fā)或運維等情況,避免臨時取消假期回去“救火”的情況發(fā)生。

玄光術——可視化全流程AI開發(fā)工程化技術

全流程AI開發(fā)工程化技術不但是可控的、可視化的、更是可追溯的,這一點和神仙透過鏡子使用玄光術追蹤的道理相似。

簡單來說,基于可視化全流程AI開發(fā)工程化技術,華為云ModelArts可實現(xiàn)在 AI 開發(fā)全生命周期中,從原始數(shù)據(jù)、標注數(shù)據(jù)、訓練作業(yè)、算法、模型、推理服務等,提供全流程可視化管理;同時無需人工干預,自動生成溯源圖,選擇任一模型,都可以找到對應的數(shù)據(jù)集、參數(shù)、模型部署在哪里;可以說是華為“把復雜要留給自己,把簡單留給客戶和合作伙伴”理念的直接例證。

三頭六臂——多模分布式數(shù)據(jù)庫

支持多個數(shù)據(jù)模型,兼容兼MySQL, 文檔類型、寬表類型(如Cassandra)、內(nèi)存等多協(xié)議接口,融合的存儲計算分離的分布式架構,實現(xiàn)分鐘級節(jié)點擴容,秒級存儲擴容,支持跨3AZ和異地多活,軟硬件深度全棧垂直整合,可實現(xiàn)Serverless按需彈性伸縮按需使用。

在數(shù)據(jù)庫讀寫性能、靈敏性、可靠性等方面深度優(yōu)化,提供可視化實例管理平臺對實例創(chuàng)建、刪除、備份等需求實現(xiàn)一鍵式便捷操作。為開發(fā)者提供以100%兼容開源接口、多模型一致運維為核心的高性能、低成本、高可靠、高安全、易管理的新型分布式數(shù)據(jù)庫。

喚神術——智能化的軟件開發(fā)技術

這項技術通過機器學習,對華為幾十年軟件開發(fā)所積累的大量相關數(shù)據(jù)進行挖掘清洗,結合各種分析技術將其中包含的開發(fā)知識進行復用,有效降低開發(fā)過程中低價值的、重復性的活動,例如自動檢測代碼中包含的缺陷、沖突等,并盡可能地提供修復建議。

縮小術——Huawei LiteOS IoT Stack技術

這項技術具備輕量級、低功耗、端云協(xié)同、即插即用、組件豐富、快速開發(fā)等關鍵能力,基于物聯(lián)網(wǎng)領域業(yè)務特征打造領域性技術棧,為開發(fā)者提供“一站式”完整軟件平臺,有效降低開發(fā)成本和難度、縮短開發(fā)周期。

以上,就是《西游記》愛好者快爺出品的華為面向開發(fā)者的“十大嚇人技術”新解。這些年來,華為一直不持續(xù)加大研發(fā)投入,大家有目共睹,為的就是尋求技術上的自主創(chuàng)新,打造更多更好的產(chǎn)品與服務,為廣大開發(fā)者提供技術支撐,助力構建萬物互聯(lián)的智能世界。

無論你是開發(fā)者還是普通消費者,如果你對快爺出品的這本“西游法術新解”感興趣,不妨關注一下即將于9月18~20日,在上海世博中心開幕的華為年度旗艦級大會——2019華為全聯(lián)接大會(HUAWEI CONNECT 2019)。

9月20日,更有以開發(fā)者為主角的Keynote演講及百場Session,上述提到的華為面向開發(fā)者的“十大嚇人技術”,都可以在百場Session中找到,屆時將會有來自技術大咖更全方位的解讀。前往現(xiàn)場,便可與頂級開發(fā)大神面對面,了解更多關于華為嚇人技術的最新理論與實踐!

——順帶一提,上文提到的華為云人工智能大賽·無人車挑戰(zhàn)杯,將在9月19日的全聯(lián)接大會現(xiàn)場決出冠軍!

東土華為仰至仁,創(chuàng)新萬物皆為善。

欲知云端新生態(tài),點擊鏈接來相見。 https://www.huawei.com/cn/press-events/events/huaweiconnect2019?ic_medium=hwdc&ic_source=corp_event2_hc2019

分享到

songjy

相關推薦