- 相關(guān)推薦
雙目立體視覺(jué)技術(shù)的實(shí)現及其進(jìn)展
摘要:闡述了雙目立體視覺(jué)技術(shù)在國內外應用的最新動(dòng)態(tài)及其優(yōu)越性。指出雙目體視技術(shù)的實(shí)現分為國像獲取、攝像機標定、特片提取、立體匹配和三維重建幾個(gè)步驟,詳細分析了各個(gè)步驟的技術(shù)特點(diǎn)、存在的問(wèn)題和解決方案,并對雙目體視技術(shù)的發(fā)展做了展望。雙目立體視覺(jué)是計算機視覺(jué)的一個(gè)重要分支,即由不同位置的兩臺或者一臺攝像機(CCD)經(jīng)過(guò)移動(dòng)或旋轉拍攝同一幅場(chǎng)景,通過(guò)計算空間點(diǎn)在兩幅國像中的視差,獲得該點(diǎn)的三維坐標值。80年代美國麻省理工學(xué)院人工智能實(shí)驗室的Marr提出了一種視覺(jué)計算理論并應用在雙睛匹配上,使兩張有視差的平面圖產(chǎn)生在深度的立體圖形,奠定了雙目立體視覺(jué)發(fā)展理論基礎。相比其他類(lèi)的體視方法,如透鏡板三維成像、投影式三維顯示、全息照相術(shù)等,雙目本視直接模擬人類(lèi)雙眼處理景物的方式,可靠簡(jiǎn)便,在許多領(lǐng)域均極具應用價(jià)值,如微操作系統的位姿檢測與控制、機器人導航與航測、三維測量學(xué)及虛擬現實(shí)等。
1 雙目體視的技術(shù)特點(diǎn)
雙目標視技術(shù)的實(shí)現可分為以下步驟:圖像獲取、攝像機標定、特征提取、圖像匹配和三維重建,下面依次介紹各個(gè)步驟的實(shí)現方法和技術(shù)特點(diǎn)。
1.1 圖像獲取
雙目體視的圖像獲取是由不同位置的兩臺或者一臺攝像機(CCD)經(jīng)過(guò)移動(dòng)或旋轉拍攝同一幅場(chǎng)景,獲取立體圖像對。其針孔模型如圖1。假定攝像機C1與C2的角距和內部參數都相等,兩攝像機的光軸互相平行,二維成像平面X1O1Y1和X2O2Y2重合,P1與P2分別是空間點(diǎn)P在C1與C2上的成像點(diǎn)。但一般情況下,針孔模型兩個(gè)攝像機的內部參數不可能完成相同,攝像機安裝時(shí)無(wú)法看到光軸和成像平面,故實(shí)際中難以應用。
上海交大在理論上對會(huì )攝式雙目體視系統的測量精度與系統結構參數之間的關(guān)系作了詳盡分析,并通過(guò)試驗指出,對某一特定點(diǎn)進(jìn)行三角測量。該點(diǎn)測量誤差與兩CCD光軸夾角是一復雜的函數關(guān)系;若兩攝像頭光軸夾角一定,則被測坐標與攝像頭坐標系之間距離越大,測量得到點(diǎn)距離的誤差就越大。在滿(mǎn)足測量范圍的前提下,應選擇兩CCD之間夾角在50℃~80℃之間。
1.2 攝像機的標定
對雙目體視而言,CCD攝像機、數碼相機是利用計算機技術(shù)對物理世界進(jìn)行重建前的基本測量工具,對它們的標定是實(shí)現立體視覺(jué)基本而又關(guān)鍵的一步。通常先采用單攝像機的標定方法,分別得到兩個(gè)攝像機的內、外參數;再通過(guò)同一世界坐標中的一組定標點(diǎn)來(lái)建立兩個(gè)攝像機之間的位置關(guān)系。目前常用的單攝像機標定方法主要有:
(1)攝影測量學(xué)的傳統設備標定法。利用至少17個(gè)參數描述攝像機與三維物體空間的結束關(guān)系,計算量非常大。
(2)直接線(xiàn)性變換性。涉及的參數少、便于計算。
(3)透視變換短陣法。從透視變換的角度來(lái)建立攝像機的成像模型,無(wú)需初始值,可進(jìn)行實(shí)時(shí)計算。
(4)相機標定的兩步法。首先采用透視短陣變換的方法求解線(xiàn)性系統的攝像機參數,再以求得的參數為初始值,考慮畸變因素,利用最優(yōu)化方法求得非線(xiàn)性解,標定精度較高。
(5)雙平面標定法。
在雙攝像機標定中,需要精確的外部參數。由于結構配置很難準確,兩個(gè)攝像機的距離和視角受到限制,一般都需要至少6個(gè)以上(建議取10個(gè)以上)的已知世界坐標點(diǎn),才能得到比較滿(mǎn)意的參數矩陣,所以實(shí)際測量過(guò)程不但復雜,而且效果并不一定理想,大大地限制了其應用范圍。此外雙攝像機標定還需考慮鏡頭的非線(xiàn)性校正、測量范圍和精度的問(wèn)題,目前戶(hù)外的應用還有少。
上海大學(xué)通信與信息工程學(xué)院提出了基于神經(jīng)網(wǎng)絡(luò )的雙目立體視覺(jué)攝像機標定方法。首先對攝像機進(jìn)行線(xiàn)性標定,然后通過(guò)網(wǎng)絡(luò )訓練建立起三維空間點(diǎn)位置補償的多層前饋神經(jīng)網(wǎng)絡(luò )模型。此方法對雙目立體視覺(jué)攝像機的標定具有較好的通用性,但是精確測量控制點(diǎn)的世界坐標和圖像坐標是一項嚴格的工作。因此神經(jīng)網(wǎng)絡(luò )中訓練樣本集的獲得非常困難。
1.3 特征點(diǎn)提取
立體像對中需要撮的特征點(diǎn)應滿(mǎn)足以下要求:與傳感器類(lèi)型及抽取特征所用技術(shù)等相適應;具有足夠的魯棒性和一致性。需要說(shuō)明的是:在進(jìn)行特征點(diǎn)像的坐標提取前,需對獲取的圖像進(jìn)行預處理。因為在圖像獲取過(guò)程中,存在一系列的噪聲源,通過(guò)此處理可顯著(zhù)改進(jìn)圖像質(zhì)量,使圖像中特征點(diǎn)更加突出。
1.4 立體匹配
立體匹配是雙目體視中最關(guān)系、困難的一步。與普通的圖像配準不同,立體像對之間的差異是由攝像時(shí)觀(guān)察點(diǎn)的不同引起的,而不是由其它如景物本身的變化、運動(dòng)所引起的。根據匹配基元的不同,立體匹配可分為區域匹配、特征匹配和相位匹配三大類(lèi)。
區域匹配算法的實(shí)質(zhì)是利用局部窗口之間灰度信息的相關(guān)程度,它在變化平緩且細節豐富的地方可以達到較高的精度。但該算法的匹配窗大小難以選擇,通常借助于窗口形狀技術(shù)來(lái)改善視差不連續處的匹配;其次是計算量大、速度慢,采取由粗至精分級匹配策略能大大減少搜索空間的大小,與匹配窗大小無(wú)關(guān)的互相關(guān)運算能顯著(zhù)提高運算速度。
特片匹配不直接依賴(lài)于灰度,具有較強的抗干擾性,計算量小,速度快。但也同樣存一些不足:特征在圖像中的稀疏性決定特征匹配只能得到稀疏的視差場(chǎng);特征的撮和定位過(guò)程直接影響匹配結果的精確度。改善辦法是將特征匹配的魯棒性和區域匹配的致密性充分結合,利用對高頻噪聲不敏感的模型來(lái)提取和定位特征。
相位匹配是近二十年才發(fā)展起來(lái)的一類(lèi)匹配算法。相位作為匹配基元,本身反映信號的結構信息,對圖像的高頻噪聲有很好的抑制作用,適于并行處理,能獲得亞像素級精度的致密視差。但存在相位奇點(diǎn)和相位卷繞的問(wèn)題,需加入自適應濾波器解決。
1.5 三維重建
在得到空間任一點(diǎn)在兩個(gè)圖像中的對應坐標和兩攝像機參數矩陣的條件下,即可進(jìn)行空間點(diǎn)的重
【雙目立體視覺(jué)技術(shù)的實(shí)現及其進(jìn)展】相關(guān)文章:
基于雙目計算機視覺(jué)的自適應識別算法及其監控應用11-14
數字下變頻技術(shù)的研究及其FPGA實(shí)現03-07
醫學(xué)圖像配準技術(shù)及其研究進(jìn)展03-01
COM服務(wù)器的偽異步技術(shù)及其實(shí)現03-18
TMS320F206的中斷技術(shù)及其實(shí)現03-18
反義核酸技術(shù)及其在寄生蟲(chóng)學(xué)中的應用進(jìn)展03-18
V-BLAST的實(shí)現及其檢測03-07
肺隔離技術(shù)進(jìn)展03-08