蘋果將在新一代產(chǎn)品iPhone 8上使用前置3D深度攝像頭的消息,讓3D深度攝像頭的概念進(jìn)入了普通大眾的視野。實際上,未來眾多前沿領(lǐng)域的應(yīng)用將越來越依賴深度攝像頭,比如VR、機(jī)器人、安防、自動駕駛等,這也是為什么國際巨頭都在布局于此的原因。前段時間本站報道了,華為在北京發(fā)布榮耀V9,是業(yè)內(nèi)首款3D建模手機(jī),用戶可以通過激光對焦獲得人臉數(shù)據(jù),通過算法構(gòu)建人像3D模型,進(jìn)而通過預(yù)裝的APP鏈接3D打印平臺的各類消費需求。
目前,3D深度攝像頭已經(jīng)渡過技術(shù)基礎(chǔ)期,方向明確,將進(jìn)入3-5年的成長期,未來將掀起3D傳感器的浪潮。在這項技術(shù)引發(fā)革命前,我們先來簡要了解一下。
什么是3D深度攝像頭?
3D深度攝像頭與普通攝像頭的區(qū)別在于,除了能夠獲取平面圖像,還可以獲得拍攝對象的深度信息,也就是三維的位置和尺寸信息,于是整個計算系統(tǒng)就獲得了環(huán)境和對象的三維立體數(shù)據(jù),這些信息可以用在人體跟蹤、三維重建、人機(jī)交互、SLAM等領(lǐng)域。
深度攝像頭具備以下優(yōu)點:
1)相對二維圖像,可通過距離信息獲取物體之間更加豐富的位置關(guān)系,即區(qū)分前景與后景;
2)深度信息依舊可以完成對目標(biāo)圖像的分割、標(biāo)記、識別、跟蹤等傳統(tǒng)應(yīng)用;
3)經(jīng)過進(jìn)一步深化處理,可以完成三維建模等應(yīng)用;
4)能夠快速完成對目標(biāo)的識別與追蹤;
5)主要配件成本相對低廉,包括CCD和普通 LED 等,對今后的普及化生產(chǎn)及使用有利;
6)借助 CMOS 的特性,可獲取大量數(shù)據(jù)及信息,對復(fù)雜物體的姿態(tài)判斷極為有效,無需掃描設(shè)備輔助工作。
3D深度攝像頭采用的主流視覺技術(shù)
根據(jù)硬件實現(xiàn)方式的不同,目前行業(yè)內(nèi)所采用的主流3D視覺技術(shù)有三種:結(jié)構(gòu)光技術(shù)、飛行時間法(ToF)、雙目多角立體成像。
1)結(jié)構(gòu)光(Structure Light)
通過激光的折射以及算法計算出物體的位置和深度信息,進(jìn)而復(fù)原整個三維空間。結(jié)構(gòu)光的代表產(chǎn)品有微軟的Kinect一代。通過發(fā)射特定圖形的散斑或者點陣的激光紅外圖案,當(dāng)被測物體反射這些圖案,通過攝像頭捕捉到這些反射回來的圖案,計算上面散斑或者點的大小,跟原始散斑或者點的尺寸做對比,從而測算出被測物體到攝像頭之間的距離。
目前是業(yè)界比較成熟的深度檢測方案,很多的激光雷達(dá)和3D掃描技術(shù)都是采用的結(jié)構(gòu)光方案。不過由于以折射光的落點位移來計算位置,這種技術(shù)不能計算出精確的深度信息,對識別的距離也有嚴(yán)格的要求。而且容易受到環(huán)境光線的干擾,強光下不適合,響應(yīng)也比較慢。
典型的結(jié)構(gòu)光方案包括:PrimeSense(微軟Kinect1代)、英特爾RealSense(前置方案)。
2)飛行時間法(TIme of Flight)
TOF系統(tǒng)是一種光雷達(dá) (LIDAR) 系統(tǒng),可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖,接收器則可通過計算光脈沖從發(fā)射器到對象,再以像素格式返回到接收器的運行時間來確定被測量對象的距離。TOF系統(tǒng)可同時獲得整個場景,確定3D范圍影像。利用測量得到的對象坐標(biāo)可創(chuàng)建3D影像,并可用于機(jī)器人、制造、醫(yī)療技術(shù)以及數(shù)碼攝影等領(lǐng)域的設(shè)備控制。
TOF方案的優(yōu)點在于響應(yīng)速度快,深度信息精度高,不容易受環(huán)境光線干擾,這些優(yōu)點使其成為移動端手勢識別最被看好的方案。代表廠商有微軟(Kinect2代)、意法半導(dǎo)體、英飛凌、德州儀器等。
3)雙目多角立體成像(MulTI-camera)
現(xiàn)在手勢識別領(lǐng)域的佼佼者Leap MoTion使用的就是這種技術(shù)。它使用兩個或者兩個以上的攝像頭同時采集圖像,通過比對這些不同攝像頭在同一時刻獲得的圖像的差別,使用算法來計算深度信息,從而多角三維成像。
Leap MoTion方案使用2個攝像機(jī)獲得左右立體影像,該影像有些輕微偏移,與人眼同序。計算機(jī)通過比較這兩個影像,就可獲得對應(yīng)于影像中物體位移的不同影像。該不同影像或地圖可以是彩色的,也可以為灰階,具體取決于特定系統(tǒng)的需求。
雙目多角立體成像方案的優(yōu)點在于不容易受到環(huán)境光線的干擾,適合室外環(huán)境,滿足7*24小時的長時間工作要求,不易損壞。缺點是昏暗環(huán)境、特征不明顯時不適合,目前應(yīng)用在智能安防監(jiān)控、機(jī)器人視覺、物流檢測等領(lǐng)域。
哪種技術(shù)最適合移動端?
綜上,在主流的三種技術(shù)方案中,TOF方案響應(yīng)速度快,深度信息精度高,識別距離范圍大,不易受環(huán)境光線干擾,因此是移動端3D視覺比較可行也最被看好的方案;結(jié)構(gòu)光方案由于技術(shù)較為成熟,工業(yè)化產(chǎn)品較多,也被部分廠商所采用;雙目立體成像是比較新的技術(shù),參與的廠商較少,更適合室外強光條件和高分辨率應(yīng)用,目前主要應(yīng)用在機(jī)器人視覺、自動駕駛等方面。
如文章開頭所示,作為我們最為關(guān)注的移動端硬件——手機(jī),尤其是蘋果的功能提升,總會引發(fā)一場行業(yè)革命。蘋果公司在iPhone7中使用了基于TOF原理的前置距離傳感器(proximity sensor)。而在此之前,蘋果的iPhone5和iPhone6s采用的都是LED+光探測器的方案。從LED+光探測器到TOF,表明移動端TOF方案在技術(shù)方面已經(jīng)獲得了巨大的進(jìn)步。
相比其他兩種技術(shù),TOF時間光更加適合應(yīng)用到智能手機(jī)上,采用TOF原理來實現(xiàn)動作追蹤和深度感知已經(jīng)出現(xiàn)在谷歌的Project Tango方案中,主要用于空間三維數(shù)據(jù)的采集,與應(yīng)用于手勢/臉部識別是非常接近的。
3D深度視覺技術(shù)已經(jīng)出現(xiàn)在微軟Kinect、英特爾RealSense等消費級產(chǎn)品中,隨著硬件端技術(shù)的不斷進(jìn)步,算法與軟件層面的不斷優(yōu)化,3D深度視覺的精度和實用性還將得到大幅提升,尤其是TOF方案與VCSEL的快速成熟,使得“深度相機(jī)+手勢/人臉識別”具備了大規(guī)模進(jìn)入移動智能終端的基礎(chǔ)。這必將進(jìn)一步解放雙手,打開新的智能人機(jī)交互空間。全文分析:http://3dprint.ofweek.com/2017-03/ART-132107-8420-30119492.html