基本原理
視頻運動目標的檢測與跟蹤是機器視覺中研究熱點之一,是目標識別、行為分析等后續應用的基礎,在社會安全、航空航天等領域中有廣泛的應用前景。目標跟蹤在學術界經過了數十年的研究,發展出了許多算法,目前較為有效的算法是基于檢測的跟蹤算法。其基本思想是,在跟蹤開始時對目標建立一個初始模板,以記錄目標的外觀;為了確定目標在下一個時刻的位置,利用當前的目標模板,在前一時刻目標位置附近處搜索與目標模板相似的區域,選擇相似度最大的區域作為這一時刻目標的真實位置;跟蹤過程中,由于目標的外觀受到各種因素的影響(目標變形、姿態變化、光照、遮擋等)而發生變化,目標模板也進行相應的更新,使其能體現出目標當前的變化。
基于這種跟蹤框架的算法都面臨著以下幾個重要的問題。目標模板要有較強的表達能力,即目標外觀特征表示要強健;該特征應具有較高的判別能力以區分目標與背景的差別;同時該特征對于各種影響目標外觀的因素有較好的魯棒性,以解決目標在跟蹤過程中的外觀變化問題,保證跟蹤的穩定性。目標模板與候選區域的相似度計算要具有較高的準確性,在目標與背景較為相似的情況下,要能夠體現出真實目標與背景的差別,不能把相似的背景判定為目標。目標模板要能自適應地更新,當目標的外觀發生變化,模板也要進行更新,這種更新是自我學習的過程,要保留目標穩定、不變形的特征,去除姿態、光照、遮擋等帶來的干擾因素。針對這些問題,我們提出了基于受限自適應層次化稀疏表示的多目標跟蹤算法,該算法的框架圖如下:
圖 1:算法框架圖
該算法利用稀疏表示的能力,結合分層表達思想,將層次化和稀疏表示(特征)相結合,有效提高了目標的模板的表達能力。在建立模板時,不僅對目標建立模板,對背景也建立建模,在判斷候選區域是否為目標時,可以結合兩個相似度進行判定,分類結果更準確。在跟蹤過程中,不斷更新模板時,對目標和背景建立模板池,收集一段時間內的目標和背景特征分布,使得模板池的魯棒性更強。為了保證算法的實時性,有選擇性地對模板進行更新,對當前的新目標進行判斷,如果和模板池差別很小,則不更新模板;差別非常大說明跟蹤失敗,也不更新;只有在合適的時機才更新模板,即保持模板的穩定性,又能減少運算,達到實時性。為了更準確地度量目標和背景之間差異,采用自適應權重調整方法,將目標模板和背景之間不相似的特征賦予較大的權值,相似的特征賦予較小的權值,增強目標與背景之間的區分度。通過建立目標的時序特征模型,保證目標模板的時序連貫性與完整性。
算法的主要流程:算法對視頻中多目標的狀態采樣后,結合時間約束、空間約束對多層稀疏表示特征進行加權,并通過目標基、背景基的更新機制,在標準對沖跟蹤框架判斷后得到目標的狀態(包括大小、方向、位置等);在目標丟失后,結合稀疏分類器網格粗略檢出目標后再次判斷,從而實現復雜場景下實時的目標跟蹤。