攝像頭技術(shù)

簡析3D深度攝像頭技術(shù)方案

12月22日

分類：攝像頭技術(shù)

　　蘋果將在新一代產(chǎn)品iPhone 8上使用前置3D深度攝像頭的消息，讓3D深度攝像頭的概念進(jìn)入了普通大眾的視野。實際上，未來眾多前沿領(lǐng)域的應(yīng)用將越來越依賴深度攝像頭，比如VR、機(jī)器人、安防、自動駕駛等，這也是為什么國際巨頭都在布局于此的原因。前段時間本站報道了，華為在北京發(fā)布榮耀V9，是業(yè)內(nèi)首款3D建模手機(jī)，用戶可以通過激光對焦獲得人臉數(shù)據(jù)，通過算法構(gòu)建人像3D模型，進(jìn)而通過預(yù)裝的APP鏈接3D打印平臺的各類消費需求。

　　目前，3D深度攝像頭已經(jīng)渡過技術(shù)基礎(chǔ)期，方向明確，將進(jìn)入3－5年的成長期，未來將掀起3D傳感器的浪潮。在這項技術(shù)引發(fā)革命前，我們先來簡要了解一下。

　　什么是3D深度攝像頭？

　　3D深度攝像頭與普通攝像頭的區(qū)別在于，除了能夠獲取平面圖像，還可以獲得拍攝對象的深度信息，也就是三維的位置和尺寸信息，于是整個計算系統(tǒng)就獲得了環(huán)境和對象的三維立體數(shù)據(jù)，這些信息可以用在人體跟蹤、三維重建、人機(jī)交互、SLAM等領(lǐng)域。

　　深度攝像頭具備以下優(yōu)點：

　　1）相對二維圖像，可通過距離信息獲取物體之間更加豐富的位置關(guān)系，即區(qū)分前景與后景；

　　2）深度信息依舊可以完成對目標(biāo)圖像的分割、標(biāo)記、識別、跟蹤等傳統(tǒng)應(yīng)用；

　　3）經(jīng)過進(jìn)一步深化處理，可以完成三維建模等應(yīng)用；

　　4）能夠快速完成對目標(biāo)的識別與追蹤；

　　5）主要配件成本相對低廉，包括CCD和普通 LED 等，對今后的普及化生產(chǎn)及使用有利；

　　6）借助 CMOS 的特性，可獲取大量數(shù)據(jù)及信息，對復(fù)雜物體的姿態(tài)判斷極為有效，無需掃描設(shè)備輔助工作。

　　3D深度攝像頭采用的主流視覺技術(shù)

　　根據(jù)硬件實現(xiàn)方式的不同，目前行業(yè)內(nèi)所采用的主流3D視覺技術(shù)有三種：結(jié)構(gòu)光技術(shù)、飛行時間法（ToF）、雙目多角立體成像。

　　1）結(jié)構(gòu)光（Structure Light）

　　通過激光的折射以及算法計算出物體的位置和深度信息，進(jìn)而復(fù)原整個三維空間。結(jié)構(gòu)光的代表產(chǎn)品有微軟的Kinect一代。通過發(fā)射特定圖形的散斑或者點陣的激光紅外圖案，當(dāng)被測物體反射這些圖案，通過攝像頭捕捉到這些反射回來的圖案，計算上面散斑或者點的大小，跟原始散斑或者點的尺寸做對比，從而測算出被測物體到攝像頭之間的距離。

　　目前是業(yè)界比較成熟的深度檢測方案，很多的激光雷達(dá)和3D掃描技術(shù)都是采用的結(jié)構(gòu)光方案。不過由于以折射光的落點位移來計算位置，這種技術(shù)不能計算出精確的深度信息，對識別的距離也有嚴(yán)格的要求。而且容易受到環(huán)境光線的干擾，強光下不適合，響應(yīng)也比較慢。

　　典型的結(jié)構(gòu)光方案包括：PrimeSense（微軟Kinect1代）、英特爾RealSense（前置方案）。

　　2）飛行時間法（TIme of Flight）

　　TOF系統(tǒng)是一種光雷達(dá) （LIDAR）系統(tǒng)，可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖，接收器則可通過計算光脈沖從發(fā)射器到對象，再以像素格式返回到接收器的運行時間來確定被測量對象的距離。TOF系統(tǒng)可同時獲得整個場景，確定3D范圍影像。利用測量得到的對象坐標(biāo)可創(chuàng)建3D影像，并可用于機(jī)器人、制造、醫(yī)療技術(shù)以及數(shù)碼攝影等領(lǐng)域的設(shè)備控制。

　　TOF方案的優(yōu)點在于響應(yīng)速度快，深度信息精度高，不容易受環(huán)境光線干擾，這些優(yōu)點使其成為移動端手勢識別最被看好的方案。代表廠商有微軟（Kinect2代）、意法半導(dǎo)體、英飛凌、德州儀器等。

　　3）雙目多角立體成像（MulTI－camera）

　　現(xiàn)在手勢識別領(lǐng)域的佼佼者Leap MoTion使用的就是這種技術(shù)。它使用兩個或者兩個以上的攝像頭同時采集圖像，通過比對這些不同攝像頭在同一時刻獲得的圖像的差別，使用算法來計算深度信息，從而多角三維成像。

　　Leap MoTion方案使用2個攝像機(jī)獲得左右立體影像，該影像有些輕微偏移，與人眼同序。計算機(jī)通過比較這兩個影像，就可獲得對應(yīng)于影像中物體位移的不同影像。該不同影像或地圖可以是彩色的，也可以為灰階，具體取決于特定系統(tǒng)的需求。

　　雙目多角立體成像方案的優(yōu)點在于不容易受到環(huán)境光線的干擾，適合室外環(huán)境，滿足7＊24小時的長時間工作要求，不易損壞。缺點是昏暗環(huán)境、特征不明顯時不適合，目前應(yīng)用在智能安防監(jiān)控、機(jī)器人視覺、物流檢測等領(lǐng)域。

　　哪種技術(shù)最適合移動端？

　　綜上，在主流的三種技術(shù)方案中，TOF方案響應(yīng)速度快，深度信息精度高，識別距離范圍大，不易受環(huán)境光線干擾，因此是移動端3D視覺比較可行也最被看好的方案；結(jié)構(gòu)光方案由于技術(shù)較為成熟，工業(yè)化產(chǎn)品較多，也被部分廠商所采用；雙目立體成像是比較新的技術(shù)，參與的廠商較少，更適合室外強光條件和高分辨率應(yīng)用，目前主要應(yīng)用在機(jī)器人視覺、自動駕駛等方面。

　　如文章開頭所示，作為我們最為關(guān)注的移動端硬件——手機(jī)，尤其是蘋果的功能提升，總會引發(fā)一場行業(yè)革命。蘋果公司在iPhone7中使用了基于TOF原理的前置距離傳感器（proximity sensor）。而在此之前，蘋果的iPhone5和iPhone6s采用的都是LED＋光探測器的方案。從LED＋光探測器到TOF，表明移動端TOF方案在技術(shù)方面已經(jīng)獲得了巨大的進(jìn)步。

　　相比其他兩種技術(shù)，TOF時間光更加適合應(yīng)用到智能手機(jī)上，采用TOF原理來實現(xiàn)動作追蹤和深度感知已經(jīng)出現(xiàn)在谷歌的Project Tango方案中，主要用于空間三維數(shù)據(jù)的采集，與應(yīng)用于手勢／臉部識別是非常接近的。

　　3D深度視覺技術(shù)已經(jīng)出現(xiàn)在微軟Kinect、英特爾RealSense等消費級產(chǎn)品中，隨著硬件端技術(shù)的不斷進(jìn)步，算法與軟件層面的不斷優(yōu)化，3D深度視覺的精度和實用性還將得到大幅提升，尤其是TOF方案與VCSEL的快速成熟，使得“深度相機(jī)＋手勢／人臉識別”具備了大規(guī)模進(jìn)入移動智能終端的基礎(chǔ)。這必將進(jìn)一步解放雙手，打開新的智能人機(jī)交互空間。全文分析：http://3dprint.ofweek.com/2017-03/ART-132107-8420-30119492.html

相關(guān)文章