從1886年的卡爾·弗里德里?!け敬陌l(fā)明出汽車開始,拓寬了人們的出行半徑,加速了人流與物流的流動速度。到1939年,第一款配備自動變速器的汽車問世,解放了駕駛員的右手(左舵駕駛,右舵駕駛則解放左手),再到世紀交替時,ACC自適應巡航解放了駕駛員的雙腳。而現在的智能駕駛技術問世,科幻電影中的自動駕駛離我們的距離正在快速接近。

前段時間,百度、高德、文遠知行、AutoX、滴滴等代表企業(yè)在RoboTaxi(自動駕駛出租車)領域爭相傳來好消息??梢哉f通過RoboTaxi的落地,人類揭開了自動駕駛落地新的一頁。

但是,新的篇章有新的難題。

在自動駕駛的過程中,汽車需要通過感知、策劃、決策、控制等一系列的過程,實現“人工智能”。簡單來說,自動駕駛系統(tǒng)根據從感知融合模塊得到的環(huán)境信息,如其他車輛、紅綠燈、行人等數據反饋,才可做出具體行為決策,如變道、超車、停車等等。

在具體商業(yè)化落地中,難就難在“感知-決策”這一過程。諸如高速公路、礦山等道路環(huán)境簡單的場景,自動駕駛的實現相對簡單。而在道路環(huán)境復雜的城市道路上,不可控的車輛、行人、寵物等各方因素,給“感知-決策”的過程帶來了極大的難度。

我們在新聞上看到的自動駕駛事故現場,也大都是因為“感知-決策”這一環(huán)節(jié)出現了問題。

圖源:億歐

智能駕駛時代的關鍵——背后的高質量數據

對于自動駕駛汽車來說,想要在瞬息萬變的復雜真實駕駛場景中發(fā)揮感知作用,背后就需要有海量真實道路場景的數據通過專業(yè)人員進行標注和驗證,從而轉化為算法訓練的數據支撐。

AI數據是整個人工智能行業(yè)的燃料,它在智能駕駛領域的重要性毋庸置疑。但現實情況是缺乏獲得大量且高質量道路環(huán)境數據的渠道。

一方面數據標注本質上是要獲得更準確,更精細化的數據結果,而場景化的道路數據缺失、數據標注質量良莠不齊,以及數據隱私安全問題成為自動駕駛面臨的三大痛點。幸運的是,云測數據作為AI數據服務領域的頭部企業(yè),一直致力于為智能駕駛領域提供高質量的場景化AI數據,通過對視頻、圖像、音頻、文本、LiDAR和傳感器數據進行結構化處理,為機器學習模型提供高質量的場景化訓練數據。

圖源:云測數據

據公開資料顯示,云測數據為了滿足智能駕駛領域不同場景的特殊需求,業(yè)內首創(chuàng)了“數據場景實驗室”模式,通過還原多種智能駕駛細分場景,以解決特定場景下的數據缺失、質量良莠不齊等行業(yè)問題。一方面,在場景下的定制化數據采集更加精準、數據質量更高,另一方面,定制化的場景數據也與智能駕駛需求端的匹配度更高,從而最大化將數據轉化為生產力。

大量的2D/3D道路環(huán)境數據可通過云測數據的標注過程被賦予“標簽化”意義,例如,識別樹木、障礙物、道路標識、聽取動作或語音命令以及一些長尾場景諸如闖紅燈車輛、橫穿馬路的行人等等。這些標注后的精準數據將會被反饋到汽車的算法模型中,使汽車具備“看”、“聽”、“理解”、“交談”的能力,為汽車決策提供數據感知支撐,從而實現決策過程。

同樣,在智慧駕駛-智能駕艙中,隨著語音識別技術和情緒識別等技術的發(fā)展,為了讓汽車能夠識別說話者的情緒和話語,云測數據通過對NLP數據進行對話意圖、領域、槽位等進行判斷和標注和多角度的泛化如重組或擴充句式、標簽等過程,給AI算法提供詳盡高質的“教材”,幫助算法進行決策,實現卓越的人車互動。

可落地應用的道路場景數據更受關注

有專家指出,目前的自動駕駛技術還沒有準備好應對復雜路況的挑戰(zhàn)。在真實環(huán)境下,系統(tǒng)存在的風險性還會被放大,這也是為什么在現在自動駕駛的車輛上依舊要放一個安全司機的原因。

可以說,自動駕駛真正商業(yè)化落地的關鍵之一,就是要通過人工智能算法處理更多更復雜的場景。

從宏觀角度來看,現有算法、算力無法準確處理復雜交通環(huán)境下無限可能的長尾場景,這時候高質量AI數據的覆蓋就顯得更加重要;具象到自動駕駛落地需求來看,高質量的場景數據也已成為各方業(yè)務領先競爭的關鍵。

作為人工智能領域內最值得期待的場景,自動駕駛產業(yè)落地的大門已開啟。場景化、定制化的高質量AI數據已成為自動駕駛領域最需要的基礎動力之一。而AI數據也將在不斷深入的產業(yè)落地中,為實現自動駕駛的全面落地提供突破性幫助。

分享到

songjy

相關推薦