在全世界的關(guān)注之下,人工智能的發(fā)展速度似乎也在加速,機器學習模型越來越大,能做的事情也越來越多,最近刷屏的AI繪畫Dall·E2讓人激動不已,又一次提高了人們對AI的期望。
然而,中國人工智能人才相對還是要少很多,據(jù)領(lǐng)英發(fā)布的《全球AI領(lǐng)域人才報告》顯示,截止到2017年一季度,全球人工智能人才超190萬,其中,美國有85萬,而中國只有5萬。
這一數(shù)據(jù)可能有點老,但大致顯示了中國人工智能領(lǐng)域人才偏少的事實。過去幾年,在各種政策和措施引導下局面會有所改善,相信實際進入機器學習領(lǐng)域的人數(shù)會有非常大幅的增長。
而我,作為機器學習領(lǐng)域略知一二的觀察者,給希望進入或已經(jīng)在人工智能領(lǐng)域的朋友一點建議:
工欲善其事、必先利其器,建議關(guān)注和了解云上的機器學習開發(fā)平臺,比如我最熟悉的亞馬遜云科技的Amazon SageMaker。
Gartner在2022年五月份公布了一個魔力象限報告,是關(guān)于面向云上AI開發(fā)者的服務(CAIDS)的,報告中,亞馬遜云科技(AWS)與微軟、谷歌以及IBM處于領(lǐng)導者的位置。
這份報告大概是從2020年開始發(fā)布的,同年發(fā)布的還有“數(shù)據(jù)科學和機器學習平臺魔力象限圖”,隨后兩年Gartner好像只是更新了CAIDS報告,“數(shù)據(jù)科學和機器學習平臺魔力象限圖”沒有再更新,可以理解為:Gartner更推薦你在云上進行AI開發(fā)工作。
為什么說是看好呢?
Gartner對CAIDS的定義指的是,那些能讓開發(fā)者團隊或者業(yè)務人員,在無需數(shù)據(jù)科學專業(yè)知識就能進行AI開發(fā)的服務,可以是云托管的或者容器化服務,通過API或者SDK或者應用來使用。
Gartner的調(diào)查顯示,超過75%的IT負責人表示,其組織的軟件工程師中只有不到25%接受過機器學習培訓,而云上AI開發(fā)者服務,是填補這一差距的關(guān)鍵。
到2025年,組織內(nèi)部開發(fā)的新應用中,有70%將采用AI技術(shù),而云AI開發(fā)者服務(CAIDS)為開發(fā)者提供了所需的機器學習開發(fā)能力。
Gartner報告里這么長一大段都在講云上AI開發(fā)的重要性
所以,我也非常推薦希望進入或已經(jīng)在人工智能領(lǐng)域的朋友關(guān)注CAIDS,以我最熟悉的亞馬遜云科技的云AI開發(fā)者服務(CAIDS)為例來介紹。
在最底層,亞馬遜云科技有自研的機器學習訓練芯片Amazon Trainium和機器學習推理芯片Amazon Inferentia,自研芯片的好處是降低成本,專用芯片的好處是提高效率,當自研專有芯片放到公有云上之后,能利用云上大規(guī)模擴展的優(yōu)勢,以最大的可能提高訓練速度。
在中間層,就是全托管的機器學習服務Amazon SageMaker,它提供了全球首個面向機器學習的集成開發(fā)環(huán)境SageMaker Studio,消除了機器學習過程中的繁重工作,也降低了機器學習的入門門檻,我曾在沒有任何人指導下完成過一個機器學習模型的開發(fā)過程。
在頂層,亞馬遜云科技提供了20多種訓練好的AI服務,涵蓋計算機覺、語音文字轉(zhuǎn)換、機器對話、文本處理、個性化推薦、時間序列預測、客服、企業(yè)內(nèi)信息搜索、開發(fā)與運維、工業(yè)AI等方面,用戶可以直接調(diào)用。
我個人感受最深的就是Amazon SageMaker。
Amazon SageMaker的功能除了能提供基本的資源以外,還有各種功能能提供很大便利,我試著用Amazon SageMaker運行了幾個Demo,過程進行的很順利,我甚至用Amazon SageMaker Studio的Autopilot自動生成了一個機器學習模型,差不多就是做到了有手就行。
對于初入門的人來說,Amazon SageMaker能降低門檻,省去一定要自己購買硬件,配置開發(fā)環(huán)境的麻煩,還能幫你很快熟悉開發(fā)的流程。它能幫初學者快速度過一開始的冷啟動時間,如果對于機器學習比較熟悉之后,也可以考慮不用Amazon SageMaker,自己DIY一套開發(fā)環(huán)境。
另外一部分,對于機器學習或者數(shù)據(jù)科學家,則推薦深入用Amazon SageMaker,它能加快開發(fā)的流程,開發(fā)的速度。與其苦苦加班996,不如找個順手的工具提高開發(fā)效率。
Amazon SageMaker還有很實用功能,我知道的比如有,能識別和調(diào)整數(shù)據(jù)偏見,當用于訓練的數(shù)據(jù)不夠的時候,還能用機器學習能力自動生成用于訓練的數(shù)據(jù),還有一些可視化的工具,還有一些我看不太明白的工具。
既有很多我能想到的,還有很多我想不到的工具??傊瑏嗰R遜云科技有一堆比較前沿的工具,還有一套比較流暢的機器學習流程,值得體驗和了解。
如果是囊中羞澀的學生黨,也想用云上的機器學習服務,那也可以先嘗試一下免費版的Amazon SageMaker,地址在這里,想先了解的可以看看這篇文章?!?a rel="nofollow" >做畢設用不起GPU?亞馬遜云SageMaker免費給你用》,它跟谷歌家的Colab類似,但國內(nèi)用戶上起來的門檻略高。
目前,全球數(shù)以十萬計客戶選擇亞馬遜云科技運行其機器學習工作負載,包括網(wǎng)易有道旗下少兒的有道樂讀、上海欣兆陽Convertlab、西門子工業(yè)自動化產(chǎn)品成都生產(chǎn)及研發(fā)基地、樂普醫(yī)療等。
此前筆者采訪過的,Joyme、覓??萍肌dTiming、FunPlus、FreeWheel等等都或多或少的在用Amazon Sagemaker,如果感興趣,你不妨也試試吧。