社區(qū)生鮮重力柜
重力感應(yīng)解決方案在每個(gè)貨道上均裝有重力感應(yīng)器,核心原理即通過感知貨道上的重力變化來判斷消費(fèi)者實(shí)際拿取的商品?;诘讓釉?,該方案擁有以下應(yīng)用特性:
?。?)不涉及人工智能算法模型搭建,無需對商品進(jìn)行學(xué)習(xí),便于商品上新
(2)可自動稱重售賣散裝生鮮產(chǎn)品,非常適用于社區(qū)生鮮零售場景;
?。?)支持多品類SKU售賣,商品可堆疊擺放以充分利用柜體空間。
同時(shí),該方案中,商品重量成為唯一識別標(biāo)準(zhǔn),這也造成了諸多弊端:
?。?)無法識別重量相同的SKU;
(2)置換商品位置后會出現(xiàn)識別誤差;
?。?)長期放置后,脹氣、濕度等影響因素將使商品重量發(fā)生變化,同時(shí)重力感應(yīng)器長久發(fā)生形變后難以感知小幅度重力變化,識別精度無法保證;
?。?)只感知單次消費(fèi)重力變量,不涉及庫存盤點(diǎn),給實(shí)際運(yùn)營管理造成困難。
2.2 動態(tài)視覺識別
動態(tài)視覺柜購物視頻截圖
動態(tài)視覺識別方案通常是在柜體頂端或兩側(cè)安裝1-4個(gè)攝像頭,對消費(fèi)者開門后拿取商品的過程進(jìn)行錄制,視頻上傳至后臺系統(tǒng)后,通過對購物視頻進(jìn)行識別從而確定消費(fèi)者拿取的商品信息。基于此,筆者總結(jié)了動態(tài)視覺柜的應(yīng)用特性:
?。?)對商品陳列無任何要求,商品可堆疊擺放,能夠提高空間利用率,適用于倉儲運(yùn)營場景;
(2)商品的學(xué)習(xí)成本比較低,支持多品類SKU售賣。
動態(tài)視覺方案僅依據(jù)消費(fèi)者開門后拿取商品的視頻來進(jìn)行識別,非常容易受到外界干擾,如果遇到消費(fèi)者故意遮擋商品信息、快速拿取商品導(dǎo)致畫面模糊、有意遮擋攝像頭無法正常拍攝等情況,便無法正確識別商品。因此目前市場上已投放運(yùn)營的動態(tài)視覺智能柜均為100%人工識別,通過人工審查視頻來完成消費(fèi)結(jié)算,在運(yùn)營中存在諸多局限性:
?。?)視頻上傳流量費(fèi)用高,帶寬成本遠(yuǎn)高于其他方案;
?。?)依賴于人工,使得消費(fèi)結(jié)算時(shí)間非常不穩(wěn)定,短則幾秒鐘,長則一天,嚴(yán)重影響購物體驗(yàn);
(3)識別準(zhǔn)確率較低。以上圖為例,視頻定格畫面十分模糊,難以準(zhǔn)確判斷商品信息;
?。?)僅針對消費(fèi)過程進(jìn)行變量記錄,無法對柜內(nèi)貨品進(jìn)行精確盤存,貨損率比較高。
2.3 靜態(tài)視覺識別
該方案同樣是基于計(jì)算機(jī)視覺算法,但實(shí)現(xiàn)原理與動態(tài)方案有著本質(zhì)的區(qū)別。靜態(tài)視覺柜每層貨架的頂端都安裝有攝像頭,在消費(fèi)者開門前、后,攝像頭均會對柜內(nèi)物體進(jìn)行拍照并上傳系統(tǒng),系統(tǒng)后臺的算法模型會對所有圖片進(jìn)行檢測識別,并生成開門前、后柜內(nèi)商品的庫存明細(xì),通過計(jì)算商品庫存量差值來判斷消費(fèi)者實(shí)際拿取的商品。
經(jīng)過大量的實(shí)例驗(yàn)證,靜態(tài)視覺方案有諸多優(yōu)勢:
?。?)以人工智能算法完全取代人力審核,結(jié)算速度快,識別穩(wěn)定;
?。?)識別準(zhǔn)確率高,同時(shí)也可通過實(shí)際運(yùn)營中采集的數(shù)據(jù)持續(xù)優(yōu)化算法,現(xiàn)識別準(zhǔn)確率基本可達(dá)到99%-99.9%;
(3)可實(shí)現(xiàn)實(shí)時(shí)遠(yuǎn)程庫存管理,商品貨損率極低;
?。?)更適合大密度投放,獲得規(guī)模運(yùn)營效益。
同樣,相比其他的技術(shù)方案,靜態(tài)視覺方案也存在局限性:
?。?)空間利用率低,柜內(nèi)商品不能疊放,否則會在鏡頭前形成遮擋,影響識別準(zhǔn)確率;
?。?)需要對商品進(jìn)行學(xué)習(xí),數(shù)據(jù)采集及數(shù)據(jù)標(biāo)注等流程較為繁瑣,通常至少需要3-7天的時(shí)間完成。
2.4 重力+動態(tài)視覺
為進(jìn)一步提高識別準(zhǔn)確率,市場上還出現(xiàn)了重力感應(yīng)+動態(tài)視覺的組合方案。經(jīng)筆者調(diào)研了解到,該方案在實(shí)際的運(yùn)營過程中,依舊以重力感應(yīng)技術(shù)為主,視頻監(jiān)控僅在大單消費(fèi)等極特殊情況下才會啟用,本文將不再做詳細(xì)介紹。
三、圖像識別原理
目前應(yīng)用比較廣泛的智能柜大多以視覺識別方案為主。在上文分析過,視覺識別技術(shù)方案尤其是靜態(tài)視覺方案已非常成熟,可以基于人工智能算法實(shí)現(xiàn)閉環(huán)式無人零售。下面筆者將繼續(xù)剖析圖像識別的實(shí)現(xiàn)原理。
3.1 圖像識別原理
圖像識別主要由兩個(gè)步驟組成,首先是目標(biāo)檢測,其次是商品識別。
目標(biāo)檢測就是在照片中確定商品的位置,找到每個(gè)商品的像素區(qū)域。簡單來講,就是確定每個(gè)商品的邊緣輪廓并進(jìn)行標(biāo)注,如圖中所示,在每個(gè)商品的邊緣畫上白框即目標(biāo)檢測過程。
商品識別通過基于深度學(xué)習(xí)的算法來實(shí)現(xiàn)。深度學(xué)習(xí)就是采用卷積神經(jīng)網(wǎng)絡(luò)提取目標(biāo)特征,再根據(jù)相同商品表現(xiàn)出來的共性總結(jié)出一定的識別經(jīng)驗(yàn)值。將上圖每個(gè)白框標(biāo)注出來的待檢測目標(biāo)放入算法模型中,提取并比對商品特征點(diǎn)后,即可確定商品名稱。
3.2 目標(biāo)檢測實(shí)現(xiàn)難點(diǎn)
理解了圖像識別原理,筆者再以實(shí)例講解技術(shù)應(yīng)用難點(diǎn)。由于商品外形包裝千變?nèi)f化,消費(fèi)者行為又難以控制,諸多因素都給技術(shù)落地造成了不小的障礙:
商品密集擺放
上圖是靜態(tài)視覺智能柜拍攝到的真實(shí)畫面,魚眼攝像頭會造成圖像畸變,尤其是當(dāng)商品密集擺放或商品位于邊緣區(qū)域時(shí),將給目標(biāo)檢測、特征提取等造成障礙。
軟包裝商品難以精確檢測商品邊緣
與瓶裝、盒裝商品不同的是,軟包裝商品外形沒有那么規(guī)則,很難清晰地區(qū)分單個(gè)商品的邊緣輪廓,尤其是遇到上圖所示的透明包裝商品,在豎立擺放的情況下,很容易造成目標(biāo)檢測不準(zhǔn)確,從而導(dǎo)致識別出錯(cuò)。
以上是幾個(gè)較為直觀的案例,可見單靠圖像識別算法很難解決這類實(shí)際運(yùn)營難題,此外還需要其他技術(shù)輔助,以一個(gè)更加全局觀的視角分析并解決問題,方可提升智能貨柜的穩(wěn)定性。
四、智能柜產(chǎn)品測評
筆者走遍上海,對支付寶、深蘭科技、海深科技、智購貓、嗨便利這五家智能貨柜進(jìn)行了實(shí)地調(diào)研,從結(jié)算時(shí)間、復(fù)雜場景識別穩(wěn)定性等多個(gè)維度對智能貨柜進(jìn)行評估,結(jié)果如下:
沒有100%完美的技術(shù)方案,但針對不同的運(yùn)營場景,必然有最具比較優(yōu)勢的解決方案。本文從智能柜實(shí)際運(yùn)營的角度出發(fā),分析了不同技術(shù)方案的應(yīng)用特性,希望能幫助智能柜運(yùn)營團(tuán)隊(duì)做出最適合自己的選擇,為無人零售行業(yè)的智能化升級貢獻(xiàn)一份力量。
感興趣者可參考下方具體的產(chǎn)品測評視頻:
https://www.bilibili.com/video/BV1Bz4y1D77u?from=search&seid=2895542164485255315
https://v.qq.com/x/page/e3113xwfgz7.html
或者在騰訊視頻、嗶哩嗶哩搜索“智能貨柜超全測評”關(guān)鍵詞,獲取更多詳細(xì)信息!