定位技術(shù)是機(jī)器人實(shí)現(xiàn)自主定位導(dǎo)航的最基本環(huán)節(jié),是機(jī)器人在二維工作環(huán)境中相對于全局坐標(biāo)的位置及其本身的姿態(tài)。目前SLAM (Simultaneous Localization and Mapping即時(shí)定位與地圖構(gòu)建)是業(yè)內(nèi)主流的定位技術(shù),有激光SLAM和視覺SLAM之分。
什么是激光SLAM?
激光SLAM脫胎于早期的基于測距的定位方法(如超聲和紅外單點(diǎn)測距)。激光雷達(dá)(Light Detection And Ranging)的出現(xiàn)和普及使得測量更快更準(zhǔn),信息更豐富。激光雷達(dá)采集到的物體信息呈現(xiàn)出一系列分散的、具有準(zhǔn)確角度和距離信息的點(diǎn),被稱為點(diǎn)云。通常,激光SLAM系統(tǒng)通過對不同時(shí)刻兩片點(diǎn)云的匹配與比對,計(jì)算激光雷達(dá)相對運(yùn)動(dòng)的距離和姿態(tài)的改變,也就完成了對機(jī)器人自身的定位。
激光雷達(dá)距離測量比較準(zhǔn)確,誤差模型簡單,在強(qiáng)光直射以外的環(huán)境中運(yùn)行穩(wěn)定,點(diǎn)云的處理也比較容易。同時(shí),點(diǎn)云信息本身包含直接的幾何關(guān)系,使得機(jī)器人的路徑規(guī)劃和導(dǎo)航變得直觀。激光SLAM理論研究也相對成熟,落地產(chǎn)品更豐富。
什么是視覺SLAM?
眼睛是人類獲取外界信息的主要來源,視覺SLAM也具有類似特點(diǎn),它可以從環(huán)境中獲取海量的、富于冗余的紋理信息,擁有超強(qiáng)的場景辨識能力。早期的視覺SLAM基于濾波理論,其非線性的誤差模型和巨大的計(jì)算量成為了它實(shí)用落地的障礙。近年來,隨著具有稀疏性的非線性優(yōu)化理論(Bundle Adjustment)以及相機(jī)技術(shù)、計(jì)算性能的進(jìn)步,實(shí)時(shí)運(yùn)行的視覺SLAM已經(jīng)不再是夢想。
通常,一個(gè)視覺SLAM系統(tǒng)由前端和后端組成。前端負(fù)責(zé)通過視覺增量式計(jì)算機(jī)器人的位姿,速度較快。后端,主要負(fù)責(zé)兩個(gè)功能:
一是在出現(xiàn)回環(huán)(即判定機(jī)器人回到了之前訪問過的地點(diǎn)附近)時(shí),發(fā)現(xiàn)回環(huán)并修正兩次訪問中間各處的位置與姿態(tài);
二是當(dāng)前端跟蹤丟失時(shí),根據(jù)視覺的紋理信息對機(jī)器人進(jìn)行重新定位。簡單說,前端負(fù)責(zé)快速定位,后端負(fù)責(zé)較慢的地圖維護(hù)。
視覺SLAM的優(yōu)點(diǎn)是它所利用的豐富紋理信息。例如兩塊尺寸相同內(nèi)容卻不同的廣告牌,基于點(diǎn)云的激光SLAM算法無法區(qū)別他們,而視覺則可以輕易分辨。這帶來了重定位、場景分類上無可比擬的巨大優(yōu)勢。同時(shí),視覺信息可以較為容易的被用來跟蹤和預(yù)測場景中的動(dòng)態(tài)目標(biāo),如行人、車輛等,對于在復(fù)雜動(dòng)態(tài)場景中的應(yīng)用這是至關(guān)重要的。第三,視覺的投影模型理論上可以讓無限遠(yuǎn)處的物體都進(jìn)入視覺畫面中,在合理的配置下(如長基線的雙目相機(jī))可以進(jìn)行很大尺度場景的定位與地圖構(gòu)建。
一直以來,業(yè)內(nèi)對激光SLAM與視覺SLAM到底誰更勝一籌,誰是未來主流趨勢都有自己的看法,以下將簡單從幾個(gè)方面進(jìn)行對比。
應(yīng)用場景
從應(yīng)用場景來說,視覺SLAM 的應(yīng)用場景要豐富很多。視覺SLAM 在室內(nèi)外環(huán)境下均能開展工作,但是對光的依賴程度高,在暗處或者一些無紋理區(qū)域是無法進(jìn)行工作的。而激光 SLAM 目前主要被應(yīng)用在室內(nèi),用來進(jìn)行地圖構(gòu)建和導(dǎo)航工作。
定位和地圖構(gòu)建精度
在靜態(tài)且簡單的環(huán)境中,激光SLAM定位總體來講優(yōu)于視覺SLAM,但在較大尺度且動(dòng)態(tài)的環(huán)境中,視覺SLAM因?yàn)槠渚哂械募y理信息,表現(xiàn)出更好的效果。在地圖構(gòu)建上,激光 SLAM精度較高,國內(nèi)思嵐科技的 RPLIDAR 系列構(gòu)建的地圖精度可達(dá)到 2cm 左右。而視覺SLAM,比如大家常見的,也用的非常多的深度攝像機(jī) Kinect,(測距范圍在 3-12m 之間),地圖構(gòu)建精度約 3cm;所以激光 SLAM 構(gòu)建的地圖精度一般來說比 視覺SLAM 高,且能直接用于定位導(dǎo)航。
易用性
激光 SLAM和基于深度相機(jī)的 視覺SLAM 均是通過直接獲取環(huán)境中的點(diǎn)云數(shù)據(jù),根據(jù)生成的點(diǎn)云數(shù)據(jù),測算哪里有障礙物以及障礙物的距離。但是基于單目、雙目、魚眼攝像機(jī)的 視覺SLAM 方案,則不能直接獲得環(huán)境中的點(diǎn)云,而是形成灰色或彩色圖像,需要通過不斷移動(dòng)自身的位置,通過提取、匹配特征點(diǎn),利用三角測距的方法測算出障礙物的距離。
除了上面幾點(diǎn)之外,在探測范圍、運(yùn)算強(qiáng)度、實(shí)時(shí)數(shù)據(jù)生成、地圖累計(jì)誤差等方面,激光 SLAM 和視覺 SLAM 也會存在一定的差距。
注:左為 Lidar SLAM,右為 視覺SLAM,數(shù)據(jù)來源:KITTI
可以明顯看出,對于同一個(gè)場景,視覺SLAM 在后半程中出現(xiàn)了偏差,這是因?yàn)槔鄯e誤差所引起的,所以 視覺SLAM 要進(jìn)行回環(huán)檢驗(yàn)。
總體來說,激光 SLAM 是目前比較成熟的機(jī)器人定位導(dǎo)航技術(shù),而視覺 SLAM是未來研究的主流方向。未來,多傳感器的融合是一種必然的趨勢。取長補(bǔ)短,優(yōu)勢結(jié)合,為市場打造出真正好用的、易用的 SLAM 方案。
關(guān)鍵字:机器人定位技术,机器人主流定位技术