前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇計(jì)算機(jī)視覺的基本技術(shù)范文,相信會(huì)為您的寫作帶來(lái)幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
【關(guān)鍵詞】計(jì)算機(jī) 視覺 圖像處理 技術(shù)
一、引言
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,在20世紀(jì)60年底產(chǎn)生了計(jì)算機(jī)視覺學(xué)這一學(xué)科。計(jì)算機(jī)視覺是借助計(jì)算機(jī)以及各種設(shè)備,進(jìn)行生物視覺模擬的一種技術(shù)。計(jì)算機(jī)視覺學(xué)的主要任務(wù),是借助已掌握的圖片、視頻等資料,進(jìn)行計(jì)算與處理,和人類及其他生物的視覺過(guò)程一樣,
得到相應(yīng)形式的三維數(shù)據(jù)信息。計(jì)算機(jī)視覺學(xué)的發(fā)展,在工業(yè)、農(nóng)業(yè)的生產(chǎn)中,地質(zhì)勘探、天文、醫(yī)學(xué)觀察等領(lǐng)域也有著重要的應(yīng)用價(jià)值。因此,視覺學(xué)的研究和應(yīng)用轉(zhuǎn)化受到了越來(lái)越多的重視。
二、計(jì)算機(jī)視覺學(xué)的圖像分割研究
(一)數(shù)據(jù)驅(qū)動(dòng)的分割研究
在計(jì)算機(jī)視覺學(xué)應(yīng)用過(guò)程中,經(jīng)常進(jìn)行的數(shù)據(jù)驅(qū)動(dòng)分割有下面幾項(xiàng)內(nèi)容:第一種是邊緣檢測(cè)的分割、第二種是區(qū)域分割、第三種是邊緣和區(qū)域相互結(jié)合的分割。第一種基于邊緣檢測(cè)的分割,這種分割的基本方法:首先對(duì)檢測(cè)圖像的邊緣點(diǎn)進(jìn)行檢測(cè),然后根據(jù)一定的法則進(jìn)行輪廓的連接,獲得分割的區(qū)域?;谶吘墮z測(cè)的分割其難點(diǎn)是邊緣檢測(cè)時(shí)如何處理好抗噪聲性能、檢測(cè)的精度之間的矛盾。所以,在研究的過(guò)程中,提出了多種多尺度邊緣檢測(cè)的方法,按照實(shí)際問(wèn)題進(jìn)行多尺度邊緣信息設(shè)計(jì)等方案,以獲得更為合適的抗噪性能和檢測(cè)的精度。第二種基于區(qū)域的分割,它的基本思想是按照?qǐng)D像數(shù)據(jù)的特點(diǎn),將整個(gè)圖像的空間劃分成為幾個(gè)不同的區(qū)域進(jìn)行圖像處理。
(二)計(jì)算機(jī)視覺學(xué)模型驅(qū)動(dòng)的分割
經(jīng)常使用的模型驅(qū)動(dòng)分割有下面三種,第一種模型是基于動(dòng)態(tài)輪廓的模型、第二種模型是組合優(yōu)化模型、第三種模型是目標(biāo)幾何與統(tǒng)計(jì)模型。第一種是基于動(dòng)態(tài)輪廓的模型用在進(jìn)行分割目標(biāo)的動(dòng)態(tài)輪廓,因?yàn)槠淠芰亢瘮?shù)使用的是積分運(yùn)算,有著很好的抗噪性能,對(duì)于目標(biāo)的局部模糊也不敏感,所以其適用性很廣。但這種分割方法容易收斂到局部最優(yōu),因此要求初始輪廓應(yīng)盡可能靠近真實(shí)輪廓。通過(guò)組合優(yōu)化的方法進(jìn)行分割問(wèn)題的處理,是使用一目標(biāo)函數(shù)綜合表示分割的相關(guān)要求以及約束,把分割變?yōu)槟繕?biāo)函數(shù)的優(yōu)化求解。因?yàn)槟繕?biāo)函數(shù)多數(shù)情況下作為多變量函數(shù)存在的,因此可以通過(guò)使用隨機(jī)優(yōu)化的方法來(lái)實(shí)現(xiàn)。
(三)計(jì)算機(jī)視覺學(xué)圖像分割的半自動(dòng)方法
通過(guò)對(duì)人工參與程度的分,我們可以得出圖像分割,主要有三種類型即:人工圖像分割、半自動(dòng)圖像分割、自動(dòng)圖像分割等。人工圖像分割指的是操作者使用鼠標(biāo),將分割區(qū)域的輪廓進(jìn)行勾畫的方法,人工圖像分割的缺點(diǎn)是費(fèi)時(shí)費(fèi)力,而且很容易就會(huì)受到一些主觀因素的影響,并且人工圖像分割的可重復(fù)性較差。自動(dòng)圖像分割不需要借助人機(jī)交互就能完成,但是也很難實(shí)現(xiàn)同一批圖像處理的滿意分割效果。半自動(dòng)分割這種形式指的是將人機(jī)交互同自動(dòng)分割結(jié)合在一起,半自動(dòng)分割可以實(shí)現(xiàn)對(duì)不同圖像與處理需求的適應(yīng),并且可以大大降低計(jì)算過(guò)程的復(fù)雜性。在計(jì)算機(jī)技術(shù)不斷發(fā)展的背景下,計(jì)算速度和容量有了大幅度的提升,計(jì)算機(jī)圖像處理及視覺應(yīng)用取得了豐碩的成果。
三、計(jì)算機(jī)視覺技術(shù)的分析
(一)以模型為研究對(duì)象的處理方法
在以模型世界作為研究對(duì)象的視覺學(xué)研究過(guò)程中,以Roberts的開創(chuàng)性工作作為一種標(biāo)志,在他的工作過(guò)程中,引進(jìn)了三維物體與二維物體成像的關(guān)系,使用較為簡(jiǎn)單的邊緣特征提取、組合線段等手段和方法。他對(duì)三維關(guān)系的分析只是按照簡(jiǎn)單的邊緣線段的約束關(guān)系,缺乏對(duì)人類或其他動(dòng)物視覺系統(tǒng)感知三維空間關(guān)系的充分考慮。但是早期的這些研究工作,對(duì)計(jì)算機(jī)視覺學(xué)的研究和發(fā)展發(fā)揮了良好的促進(jìn)意義,但是對(duì)于較為復(fù)雜的景物就不能夠奏效。
(二)以計(jì)算理論為主體的視覺模型
隨著計(jì)算機(jī)視覺研究的不斷深入,在二十世紀(jì)七十年代,計(jì)算機(jī)視覺技術(shù)的研究,開始向著更為理性的階段發(fā)展,主要表現(xiàn)在:不同本征特性的恢復(fù),恢復(fù)的內(nèi)容有三維形狀恢復(fù)、運(yùn)動(dòng)恢復(fù)、光源恢復(fù)等等。研究的出發(fā)點(diǎn)是光學(xué)、生理學(xué)以及射影幾何的視角出發(fā),對(duì)成像及其逆等問(wèn)題進(jìn)行研究。在這個(gè)過(guò)程中,一些學(xué)者提出了以表示作為核心、通過(guò)算法作為中間轉(zhuǎn)換過(guò)程的視覺處理模型,例如:著名的計(jì)算機(jī)視覺學(xué)研究者M(jìn)arr就提出了這些觀點(diǎn),在他的理論里面,對(duì)表示的重要意義進(jìn)行強(qiáng)調(diào),并且從不同層面上對(duì)信息處理問(wèn)題進(jìn)行了研究。
(三)計(jì)算機(jī)視覺的應(yīng)用研究
在現(xiàn)實(shí)生活和生產(chǎn)的過(guò)程中,計(jì)算機(jī)視覺主要應(yīng)用在照片資料、視頻資料處理上,例如:航空照片的處理、衛(wèi)星照片的編譯、醫(yī)學(xué)領(lǐng)域的輔診斷、移動(dòng)機(jī)器人視覺導(dǎo)航等等。其中,工業(yè)機(jī)器人手眼系統(tǒng)的研發(fā),成為計(jì)算機(jī)視覺應(yīng)用最具代表性的成果之一。因?yàn)楣I(yè)生產(chǎn)、施工等現(xiàn)場(chǎng)等因素具有一定的復(fù)雜性,這種環(huán)境下的光照、成像特點(diǎn)等等可以控制,這就使得計(jì)算機(jī)視覺的應(yīng)用更為簡(jiǎn)單,對(duì)于系統(tǒng)的實(shí)際構(gòu)成有著很好的作用。移動(dòng)機(jī)器人與工業(yè)機(jī)器人不同之處就是移動(dòng)機(jī)器人具有一定的行為能力,這就需要研究者解決機(jī)器人的行為規(guī)劃問(wèn)題。在移動(dòng)機(jī)器人種類、智能化水平不斷提升的背景下,對(duì)視覺能力的要求也越來(lái)越高,這也使得計(jì)算機(jī)視覺有了更為廣闊的應(yīng)用前景。
四、結(jié)語(yǔ)
綜上所述,計(jì)算機(jī)視覺學(xué)作為人類科技發(fā)展和社會(huì)進(jìn)步的一種學(xué)科體現(xiàn),在前進(jìn)和發(fā)展的過(guò)程中,通過(guò)研究者和應(yīng)用者的不斷總結(jié)和探究,取得了豐碩的成果。在未來(lái)視覺技術(shù)發(fā)展的道路上,仍然有大量的工作需要進(jìn)行研究。
參考文獻(xiàn):
[1]韓祥波, 劉戰(zhàn)麗. 計(jì)算機(jī)圖像處理技術(shù)在農(nóng)產(chǎn)品檢測(cè)分級(jí)中的應(yīng)用[J]. 安徽農(nóng)業(yè)科學(xué) , 2013,(34)
[2]趙萍, 李永奎, 林靜, 白雪衛(wèi). 數(shù)字圖像處理技術(shù)在農(nóng)產(chǎn)品方面的應(yīng)用[J]. 農(nóng)機(jī)化研究 , 2012,(11)
【關(guān)鍵詞】計(jì)算機(jī)視覺;構(gòu)件;表面特征;檢測(cè)
表面缺陷檢測(cè)以及特征提取,所涉及的范圍是非常廣泛的,包括了鐵軌表面缺陷、帶鋼表面缺陷以及織物表面缺陷等。因此加強(qiáng)對(duì)產(chǎn)品的表面缺陷提取以及質(zhì)量檢測(cè)顯得尤為重要,目前基于計(jì)算機(jī)視覺的構(gòu)件缺陷檢測(cè)系統(tǒng)已經(jīng)受到國(guó)內(nèi)外研究人員的重視,如何更好地將計(jì)算機(jī)視覺技術(shù)引入到產(chǎn)品表面質(zhì)量缺陷檢測(cè)中去是未來(lái)發(fā)展的重點(diǎn)。筆者將在下文中就此展開詳細(xì)的闡述。
1.計(jì)算機(jī)視覺的基本工作原理
1.1系統(tǒng)結(jié)構(gòu)
計(jì)算機(jī)視覺是一項(xiàng)涉及范圍廣泛的技術(shù),他通過(guò)圖像采集裝置將檢測(cè)目標(biāo)轉(zhuǎn)化為圖像信號(hào),再經(jīng)過(guò)專門性的額圖像處理系統(tǒng)最終生成具體的表面特征。具體來(lái)講在圖像處理環(huán)節(jié)米旭濤根據(jù)圖像的具體像素以及圖像分布和顏色、亮度、飽和度等進(jìn)行目標(biāo)提取,再比照系統(tǒng)預(yù)設(shè)的參照值得出最終的檢測(cè)結(jié)果,例如尺寸大小、顏色等師傅偶合格。計(jì)算機(jī)視覺處理系統(tǒng)包括了光源、鏡頭、計(jì)算機(jī)以及圖像采集裝置和處理系統(tǒng)等,這些系統(tǒng)綜合組成共同推動(dòng)了計(jì)算機(jī)視覺系統(tǒng)的正常穩(wěn)定運(yùn)行。
1.2計(jì)算機(jī)視覺硬件設(shè)計(jì)
計(jì)算機(jī)視覺系統(tǒng)的硬件平臺(tái)包括了照明系統(tǒng)、鏡頭相機(jī)以及圖像采集裝置和工控機(jī)四個(gè)部分,這四個(gè)部分缺一不可,共同組成了整個(gè)計(jì)算機(jī)視覺系統(tǒng)。
1.2.1照明系統(tǒng)
照明系統(tǒng)是整個(gè)計(jì)算機(jī)視覺系統(tǒng)的關(guān)鍵,尤其是在光源和照明方案的配合上更是直接影響了整個(gè)系統(tǒng)運(yùn)行的成敗。因此在照明方案的制定以及光源的選擇上應(yīng)該盡可能的突出物體特征參量,綜合考慮對(duì)比度以及亮度等因素,將計(jì)算機(jī)視覺系統(tǒng)的光源與照明方案相匹配,選擇需要的幾何形狀以及均勻度等,同時(shí)還需要結(jié)合被檢測(cè)物體的表面特征幾何形狀。針對(duì)構(gòu)件表面缺陷的照明方案,筆者認(rèn)為應(yīng)該選擇功率相對(duì)較大的LED光源,用低角度的方式進(jìn)行照明。
1.2.2相機(jī)鏡頭
相機(jī)系統(tǒng)是成像的關(guān)鍵,因此在相機(jī)鏡頭的選擇上應(yīng)該適用于具體的構(gòu)件。一般來(lái)說(shuō)相機(jī)鏡頭包括了兩方面內(nèi)容,一是線掃,二是面掃。通過(guò)二者的綜合運(yùn)用實(shí)現(xiàn)更好地成像效果。
1.2.3圖像采集卡
圖像采集卡主要是指在計(jì)算機(jī)視覺系統(tǒng)中位于圖像裁剪機(jī)設(shè)備和圖像處理設(shè)備之間的重要接口。是成像的中間環(huán)節(jié),發(fā)揮著不可或缺的作用。
2.基于計(jì)算機(jī)視覺的構(gòu)件表面缺陷特征提取
基于計(jì)算機(jī)視覺的構(gòu)件表面缺陷特征提取可以分為為三個(gè)重要部分,分別是圖像預(yù)處理部分:主要是指針對(duì)構(gòu)件進(jìn)行區(qū)域的定位,將非構(gòu)件的部分移出計(jì)算機(jī)視覺的缺陷提取技術(shù)中去,從而降低了后續(xù)工作的工作難度;其次是進(jìn)行缺陷定位,主要是指通過(guò)特定的技術(shù)和算法將缺陷從結(jié)果當(dāng)中直接分離出來(lái)。第三部分是缺陷特征的提取,也是系統(tǒng)處理的結(jié)果部分,是通過(guò)計(jì)算缺陷的程度以及缺陷大小,從而為后期的構(gòu)件維護(hù)提供參考依據(jù)。具體來(lái)說(shuō),這三個(gè)部分的操作主要體現(xiàn)在以下幾個(gè)方面:
2.1區(qū)域定位
區(qū)域定位是減少構(gòu)件處理和選擇時(shí)間的關(guān)鍵,能夠大大提高構(gòu)件缺陷提取的效率。構(gòu)件的表面的基本特征和大致集合框架提取是區(qū)域定位和的第一步,要將計(jì)算機(jī)區(qū)域定位和缺陷提取結(jié)合起來(lái),更好地實(shí)現(xiàn)缺陷分析。要做好構(gòu)件的區(qū)域定位首先需要明確構(gòu)件的基本種類和特征:一是根據(jù)構(gòu)件的重用方式來(lái)說(shuō),可以分為白匣子、灰匣子、黑匣子從構(gòu)件的使用范圍來(lái)看又可以分為通用構(gòu)件和專用構(gòu)件;根據(jù)構(gòu)件的粒度的大小可以分為小。中大三種不同粒度的構(gòu)件;再次是從構(gòu)件的功能上來(lái)看可以分為系統(tǒng)構(gòu)件、支撐構(gòu)件以及領(lǐng)域構(gòu)件三個(gè)部分。四是從構(gòu)件的基本結(jié)構(gòu)特征來(lái)看可以分為原子構(gòu)件以及組合構(gòu)件。最后從構(gòu)件的狀態(tài)來(lái)說(shuō),又可以分為動(dòng)態(tài)和靜態(tài)構(gòu)件。因此從不同種類的構(gòu)件進(jìn)行區(qū)域定位為視覺系統(tǒng)正常運(yùn)行創(chuàng)造了優(yōu)良的條件。
2.2缺陷提取
在進(jìn)行缺陷提取的過(guò)程中,難免會(huì)受到客觀的環(huán)境影響,比如噪聲、溫度以及濕度等對(duì)圖像處理的結(jié)果產(chǎn)生影響,因此需要對(duì)區(qū)域定位中產(chǎn)生的區(qū)域進(jìn)行濾波處理,然后再采用閾值分割的辦法進(jìn)行缺陷提取。具體操作步驟如下所示:
(1)計(jì)算出成像中的最小最大灰度值,并且設(shè)置初始閾值。
(2)根據(jù)閾值,結(jié)合圖像的分割目標(biāo),將圖像分割成為目標(biāo)和背景兩個(gè)部分,求導(dǎo)出平均灰度值。
(3)再根據(jù)新的平均灰度值計(jì)算出新的閾值。
(4)觀察閾值的初始值與新閾值之間的關(guān)系,如歌二者相等則整個(gè)計(jì)算過(guò)程就結(jié)束,如果不相等,則就需要進(jìn)一步計(jì)算。
通過(guò)閾值計(jì)算得出啊的最佳閾值分割效果圖,能夠進(jìn)行初步的缺陷預(yù)判,但是初步預(yù)判當(dāng)中還存在較多的不確定因素,主要包括兩類,一是在邊緣部分出現(xiàn)的細(xì)小毛刺,由于與缺陷的距離較近,因此在初步缺陷提取中容易形成誤判、再次是在構(gòu)件表面有一些非常細(xì)小的缺陷,這些缺陷的影響較小,不會(huì)對(duì)構(gòu)件的性能造成影響,因此在進(jìn)行缺陷提取的過(guò)程中需要將這兩個(gè)因素排除在外,具體主要是指采用圖像形態(tài)學(xué)中開運(yùn)算和閉運(yùn)算,從而達(dá)到對(duì)構(gòu)件中的明了細(xì)節(jié)和暗色細(xì)節(jié)的過(guò)濾。具體來(lái)說(shuō)缺陷的分割提取采用的是Sobel算子。主要是利用了圖像像素點(diǎn)的上下左右灰度加權(quán)算法,對(duì)構(gòu)件表面的缺陷進(jìn)行檢測(cè)。再采用二值圖像邊界跟蹤法,將缺陷從構(gòu)件圖像中分離出來(lái)。
2.3缺陷特征提取
缺陷特征提取,又可以稱之為缺陷的定量計(jì)算和定性過(guò)程,是將前期所得的數(shù)據(jù)結(jié)果以更加直觀的形式展現(xiàn)出來(lái),通過(guò)對(duì)比指標(biāo)參數(shù)判斷構(gòu)件的表面質(zhì)量是否合格,符合基本的生產(chǎn)標(biāo)準(zhǔn)。一般來(lái)說(shuō)常用的表示缺陷特征的標(biāo)準(zhǔn)有以下幾種:
(1)周長(zhǎng):周長(zhǎng)是對(duì)缺陷的邊界長(zhǎng)度的描述,在圖像特征上顯示則是指構(gòu)件成像上的缺陷區(qū)域的邊界像素?cái)?shù)量。
(2)面積:面積相對(duì)于周長(zhǎng)能夠更加直觀地反映整體缺陷的大小,它是缺陷區(qū)域中的像素的總數(shù),因此更高體現(xiàn)缺陷的影響規(guī)模。
(3)致密性:這是一個(gè)相對(duì)專業(yè)的缺陷指標(biāo)概念主要是指每平方面積上的平方周倉(cāng),是一個(gè)雙單位描述指標(biāo)。
(4)區(qū)域的質(zhì)心:區(qū)域質(zhì)心是描述缺陷的影響關(guān)鍵也就是缺陷區(qū)域內(nèi)的核心區(qū)域,是對(duì)整個(gè)區(qū)域的核心描述。
(5)最小外接矩形。
3.結(jié)語(yǔ)
綜上所述,構(gòu)件表面缺陷直接影響構(gòu)件的最終使用效果,構(gòu)件表面缺陷的檢測(cè)應(yīng)用領(lǐng)域也逐漸廣泛,而計(jì)算機(jī)視覺技術(shù)在檢測(cè)缺陷中的優(yōu)越性更體現(xiàn)了基于計(jì)算機(jī)視覺的構(gòu)件表面缺陷特征提取的研究?jī)r(jià)值。本文主要針對(duì)構(gòu)件表面缺陷的檢測(cè),綜合計(jì)算機(jī)視覺技術(shù)提出了具體的檢測(cè)方法和檢測(cè)工作原理,通過(guò)對(duì)表面缺陷的檢測(cè),力圖提高構(gòu)件的整體質(zhì)量。
【參考文獻(xiàn)】
[1]陳黎,黃心漢,王敏,何永輝,龔世強(qiáng).帶鋼缺陷圖像的自動(dòng)閾值分割研究[J].計(jì)算機(jī)工程與應(yīng)用,2002,(07).
[2]許豪,孔建益,湯勃,王興東,劉源泂.基于數(shù)學(xué)形態(tài)學(xué)的帶鋼表面缺陷邊緣提取[J].機(jī)械設(shè)計(jì)與制造,2012,(06).
關(guān)鍵詞:計(jì)算機(jī)視覺;地圖匹配;SLAM;機(jī)器人導(dǎo)航;路徑規(guī)劃
1概述
計(jì)算機(jī)視覺在人工智能學(xué)科占據(jù)重要地位,為自主移動(dòng)機(jī)器人視覺導(dǎo)航做了深厚的理論鋪墊。目前,機(jī)器人導(dǎo)航技術(shù)有很多種,傳感器導(dǎo)航技術(shù)如里程計(jì)、激光雷達(dá)、超聲波、紅外線、微波雷達(dá)、陀螺儀、指南針、速度、加速度計(jì)或觸覺等得到了普遍應(yīng)用,與上述非計(jì)算機(jī)視覺導(dǎo)航技術(shù)相比較,計(jì)算機(jī)視覺導(dǎo)航技術(shù)如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優(yōu)點(diǎn)。由于室內(nèi)相對(duì)室外空間比較狹小且內(nèi)部環(huán)境復(fù)雜,所以普通移動(dòng)機(jī)器人在作業(yè)過(guò)程中,完成躲避眼前障礙物、自主導(dǎo)航以及為自身找出一條可行路徑等一系列操作會(huì)相對(duì)比較困難。計(jì)算機(jī)視覺導(dǎo)航技術(shù)可利用本身的攝像頭獲得室內(nèi)周圍的環(huán)境信息,實(shí)時(shí)對(duì)其周身的場(chǎng)景進(jìn)行快速反饋,對(duì)視野前方障礙物進(jìn)行快速識(shí)別和檢測(cè),從而確定一條高效的可行的安全路徑。本文對(duì)計(jì)算機(jī)視覺導(dǎo)航技術(shù)進(jìn)行分類研究,主要分為3類:第一類是環(huán)境地圖事先已知,提前對(duì)外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲(chǔ)在機(jī)器人內(nèi)存數(shù)據(jù)庫(kù)中,在導(dǎo)航的時(shí)候?qū)崟r(shí)進(jìn)行地圖匹配;第二類是同時(shí)定位與地圖構(gòu)建,移動(dòng)機(jī)器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時(shí)逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實(shí)時(shí)定位和導(dǎo)航;第三類是不依賴環(huán)境地圖,自主移動(dòng)機(jī)器人不需要依賴任何的環(huán)境地圖,其在作業(yè)活動(dòng)時(shí)的可行區(qū)域主要取決于攝像頭實(shí)時(shí)識(shí)別和檢測(cè)的環(huán)境相對(duì)信息。
2環(huán)境地圖的表示方法
目前,計(jì)算機(jī)視覺導(dǎo)航技術(shù)多采用柵格地圖、幾何地圖、拓?fù)涞貓D和混合地圖構(gòu)建環(huán)境地圖信息。
2.1柵格地圖
柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個(gè)柵格單元賦予一個(gè)平均概率值,并利用傳感信息估計(jì)每個(gè)單元內(nèi)部?jī)?nèi)存障礙物的概率。構(gòu)建柵格地圖的優(yōu)點(diǎn)是其地圖表達(dá)形式直觀,創(chuàng)建和維護(hù)比較容易;但當(dāng)劃分的柵格單元數(shù)量不斷增多時(shí),實(shí)時(shí)性就會(huì)慢慢變差;當(dāng)劃分的柵格單元越大時(shí),環(huán)境地圖的分辨率越低。
2.2幾何地圖
幾何地圖利用幾何特征如點(diǎn)、直線、平面等來(lái)構(gòu)成環(huán)境主要框架,需要知道這些特征在環(huán)境中信息的具置,所以幾何地圖通常使用其對(duì)應(yīng)的三維空間坐標(biāo)來(lái)表示。幾何地圖構(gòu)建過(guò)程相對(duì)簡(jiǎn)單,保留了室內(nèi)環(huán)境的各種重要信息,是基于計(jì)算機(jī)視覺的定位與地圖構(gòu)建算法中最常用的一種表示方式。但是為了完成環(huán)境的建模需要標(biāo)記大量的特征,從而計(jì)算量也非常的大,降低了實(shí)時(shí)性,其重建的地圖也容易出現(xiàn)與全局不一致的情況。
2.3拓?fù)涞貓D
拓?fù)涞貓D用許多節(jié)點(diǎn)和連接這些節(jié)點(diǎn)的曲線來(lái)表示環(huán)境信息。其中,每個(gè)節(jié)點(diǎn)相對(duì)應(yīng)真實(shí)環(huán)境中的特征點(diǎn)(如門角、窗戶、椅子、桌子角及拐角等),而節(jié)點(diǎn)之間的曲線表示兩個(gè)節(jié)點(diǎn)對(duì)應(yīng)的地點(diǎn)是相聯(lián)通的。拓?fù)涞貓D把環(huán)境信息表上在一線圖上,不需要精確表示不同節(jié)點(diǎn)間的地理位置關(guān)系,圖像較為抽象,表示起來(lái)方便且簡(jiǎn)單。機(jī)器人首先識(shí)別這些節(jié)點(diǎn)進(jìn)而根據(jù)識(shí)別的節(jié)點(diǎn)選擇節(jié)點(diǎn)與節(jié)點(diǎn)間的曲線作為可作業(yè)的路徑。
2.4混合地圖
混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓?fù)涞貓D以及柵格一拓?fù)涞貓D。混合地圖采用多種地圖表示,可結(jié)合多種地圖的優(yōu)勢(shì),與單一的地圖表示相比更具有靈活性、準(zhǔn)確性和魯棒性,但其不同類別的地圖結(jié)合起來(lái)管理會(huì)比較復(fù)雜,難以協(xié)調(diào),增加了地圖構(gòu)建的難度。文獻(xiàn)針對(duì)室內(nèi)環(huán)境所建立的模型分為全局拓?fù)浜途植繋缀伪硎霾糠?,整體環(huán)境通過(guò)拓?fù)涔?jié)點(diǎn)串連起來(lái),維護(hù)了整體環(huán)境表述的全局一致性;而以每個(gè)拓?fù)涔?jié)點(diǎn)為核心所采用的幾何表述則可確保局部精確定位的實(shí)現(xiàn),這樣建立的幾何一拓?fù)浠旌檄h(huán)境模型可將二者的優(yōu)勢(shì)都表現(xiàn)出來(lái),使得移動(dòng)機(jī)器人定位和地圖構(gòu)建同時(shí)進(jìn)行,實(shí)現(xiàn)容易。
3基于計(jì)算機(jī)視覺的室內(nèi)導(dǎo)航
基于計(jì)算機(jī)視覺的室內(nèi)導(dǎo)航技術(shù)可利用攝像頭捕獲機(jī)器人周圍環(huán)境的全部信息,對(duì)其周身的場(chǎng)景進(jìn)行反饋,對(duì)障礙物進(jìn)行快速識(shí)別和檢測(cè),從而確定一條高效的可行的安全路徑。本文將計(jì)算機(jī)視覺室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是定位與地圖構(gòu)建同時(shí)進(jìn)行;第三類是不依賴環(huán)境地圖。
3.1環(huán)境地圖事先已知
提前對(duì)外界環(huán)境特征進(jìn)行提取和處理,建立全局地圖,并將地圖信息存儲(chǔ)在機(jī)器人內(nèi)存數(shù)據(jù)庫(kù)中,在導(dǎo)航的時(shí)候?qū)崟r(shí)進(jìn)行地圖匹配,即預(yù)存環(huán)境地圖。在環(huán)境地圖事先已知的導(dǎo)航中,路標(biāo)信息保存在計(jì)算機(jī)內(nèi)存的數(shù)據(jù)庫(kù)中,視覺系統(tǒng)中心利用圖像特征直接或間接向移動(dòng)機(jī)器人提供一系列路標(biāo)信息,一旦路標(biāo)被確定后,通過(guò)匹配觀察到的圖像和所期望圖像,機(jī)器人借助地圖實(shí)現(xiàn)自身精確定位和導(dǎo)航。該導(dǎo)航技術(shù)過(guò)程可分為以下步驟:
a)圖像獲?。簲z像頭獲取其周圍的視頻圖像;
b)路標(biāo)識(shí)別及檢測(cè):利用相關(guān)圖像處理算法對(duì)圖像進(jìn)行一系列預(yù)處理如進(jìn)行邊緣檢測(cè)和提取、平滑、濾波、區(qū)域分割;
c)路標(biāo)匹配標(biāo)志:在觀察到的圖像和所期望圖像之間進(jìn)行匹配,搜索現(xiàn)有的路標(biāo)數(shù)據(jù)庫(kù)進(jìn)行標(biāo)志路標(biāo);
d)位置計(jì)算:當(dāng)有特征點(diǎn)進(jìn)行匹配時(shí),視覺系統(tǒng)會(huì)根據(jù)數(shù)據(jù)庫(kù)中的路標(biāo)位置進(jìn)行自身精確定位和導(dǎo)航。
在基于計(jì)算機(jī)視覺的地圖匹配定位過(guò)程中,主要有2種地圖匹配較為典型。
①已知起點(diǎn),已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對(duì)定位的方法,如圖1所示為其位姿估計(jì)過(guò)程,這種情況目前導(dǎo)航技術(shù)研究得最多。
②不知起點(diǎn),已知地圖。這種條件下的定位稱為全局定位。當(dāng)機(jī)器人需要重置時(shí),通常使用這種定位方法來(lái)檢索機(jī)器人的當(dāng)前位置(即姿態(tài)初始化)。常用的輔助方法是在環(huán)境中添加一些人造信標(biāo),如無(wú)線收發(fā)器,幾何信標(biāo),條碼技術(shù),紅外或超聲波接收系統(tǒng)進(jìn)行位置識(shí)別,利用視覺系統(tǒng)識(shí)別自然標(biāo)志,自主定位。
3.2定位與地圖構(gòu)建同時(shí)進(jìn)行
不知起點(diǎn),不知地圖。SLAM技術(shù)最早由Smith等人于1986年提出,移動(dòng)機(jī)器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時(shí)逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實(shí)時(shí)定位和導(dǎo)航。在日后的導(dǎo)航研究中,混合地圖中的幾何一拓?fù)浠旌檄h(huán)境模型被得到廣泛應(yīng)用,主要用來(lái)解決SLAM問(wèn)題。
2003年,在解決SLAM技術(shù)難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機(jī)地圖創(chuàng)建方法。下面是該算法步驟:
a)數(shù)據(jù)采集:首先初始化系統(tǒng),從攝像頭傳感器采集距離數(shù)據(jù);
b)狀態(tài)預(yù)測(cè):視覺系統(tǒng)預(yù)測(cè)機(jī)器人運(yùn)動(dòng)狀態(tài),實(shí)時(shí)返回新位姿信息和協(xié)方差矩陣,預(yù)測(cè)地圖;
c)觀測(cè):從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;
d)測(cè)量預(yù)測(cè):預(yù)測(cè)機(jī)器人當(dāng)前位姿的全局地圖;
e)位置匹配:應(yīng)用最鄰近濾波器匹配局部地圖中的觀測(cè)點(diǎn)和預(yù)測(cè)點(diǎn);
f)估計(jì):使用擴(kuò)展Kalman濾波器更新地圖;
g)創(chuàng)建:將非相關(guān)的觀測(cè)點(diǎn)加入地圖,對(duì)機(jī)器人返回增量式地圖;
h)輸出地圖。
制約機(jī)器人視覺系統(tǒng)性能的重要因素是信息實(shí)時(shí)處理的計(jì)算復(fù)雜度和處理效率,SLAM算法需要在地圖密度與計(jì)算效率之間取得權(quán)衡。
3.3無(wú)環(huán)境地圖
在這類系統(tǒng)中,機(jī)器人不需要依賴任何的環(huán)境地圖信息,機(jī)器人的活動(dòng)取決于其當(dāng)時(shí)識(shí)別和提取出來(lái)的環(huán)境信息,這些環(huán)境信息可能是桌子、椅子和門等,不需要知道這些環(huán)境元素的絕對(duì)位置。無(wú)環(huán)境地圖的導(dǎo)航技術(shù)典型的技術(shù)有3大類:基于光流的導(dǎo)航技術(shù)、基于外觀信息的導(dǎo)航技術(shù)、基于目標(biāo)識(shí)別的導(dǎo)航技術(shù)和基于目標(biāo)跟蹤的導(dǎo)航技術(shù)。
3.3.1基于光流的導(dǎo)航技術(shù)
光流是三維空間運(yùn)動(dòng)物體在觀測(cè)成像面上的像素運(yùn)動(dòng)的瞬時(shí)速度,也是圖像亮度的運(yùn)動(dòng)信息描述。光流法計(jì)算最初是由Horn和Schunck于1981年提出的,其利用二維速度場(chǎng)與灰度,引入光流約束方程,得到光流計(jì)算的基本算法。光流計(jì)算基于物體移動(dòng)的光學(xué)特性提出了2個(gè)假設(shè):①運(yùn)動(dòng)物體的灰度在很短的間隔時(shí)間內(nèi)保持不變;②給定鄰域內(nèi)的速度向量場(chǎng)變化是緩慢的。如Santos-Victor等人研發(fā)了一種基于光流的robee視覺系統(tǒng),該系統(tǒng)模擬了蜜蜂的視覺行為。在robee視覺系統(tǒng)中,使用單獨(dú)的雙目視覺方法來(lái)模擬蜜蜂的中心反射(Centering Reflex):當(dāng)機(jī)器人移動(dòng)到走廊兩側(cè)的墻壁中心時(shí),左眼捕獲場(chǎng)景的瞬時(shí)速度與右眼捕獲場(chǎng)景的瞬時(shí)速度是相同的,幾乎沒有差別,那么機(jī)器人就可以知道他們?cè)谧呃鹊闹行?。如果眼睛兩?cè)的眼睛的瞬時(shí)變化速度不同,則機(jī)器人移動(dòng)到較慢的速度。在自動(dòng)機(jī)器人導(dǎo)航的實(shí)現(xiàn)中,基于這個(gè)想法是測(cè)量攝像機(jī)捕獲圖像場(chǎng)景瞬時(shí)速度差異。這種導(dǎo)航技術(shù)只能用于室內(nèi)單通道直走道導(dǎo)航,不能引導(dǎo)機(jī)器人改變方向,具有一定的局限性。
3.3.2基于外觀信息的導(dǎo)航技術(shù)
基于外觀的機(jī)器人導(dǎo)航方法,不需要構(gòu)建真實(shí)的地圖導(dǎo)航,機(jī)器人通過(guò)自身所攜帶的攝像頭和傳感器感知周圍目標(biāo)的外觀信息進(jìn)行自主定位和導(dǎo)航。其中,所述的外觀信息多為目標(biāo)信息的顏色、亮度、形狀、空間大小和物理紋路等。機(jī)器人在導(dǎo)航時(shí)存儲(chǔ)連續(xù)視頻幀的環(huán)境圖像信息,并將連續(xù)視頻幀與控制指令相關(guān)聯(lián),從而再執(zhí)行指令規(guī)劃有效路徑到達(dá)目的地。
3.3.3基于目標(biāo)識(shí)別導(dǎo)航技術(shù)
為了達(dá)到目標(biāo)點(diǎn)或是識(shí)別目標(biāo),機(jī)器人很多時(shí)候只能獲取少量的圖像信息。Kim等人提出了一種用符號(hào)代替導(dǎo)航各個(gè)位置的賦值方法。該賦值方法中,機(jī)器人執(zhí)行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過(guò)相關(guān)的符號(hào)命令,機(jī)器人自動(dòng)識(shí)別并建立路標(biāo),通過(guò)符號(hào)指令到達(dá)目標(biāo)點(diǎn)。例如“去你后面的椅子旁”,這樣的命令就是告訴機(jī)器人路標(biāo)是椅子、路徑向后。該導(dǎo)航技術(shù)的難點(diǎn)在于目標(biāo)是否可以準(zhǔn)確實(shí)時(shí)識(shí)別路標(biāo)。第一,識(shí)別大量不同類別的物體,室內(nèi)環(huán)境有許多不同類別的物體,需要將它們組織到一個(gè)在給定的容易搜索圖像數(shù)據(jù)結(jié)構(gòu)中去,起到容易識(shí)別是用什么度量來(lái)區(qū)分物體;第二,識(shí)別大量不同背景下的物體,一個(gè)合適的物體表達(dá)式有助于將圖像組織成片斷,而這些片斷來(lái)自于物體的種類且與物體無(wú)關(guān)的;第三,在抽象層次上識(shí)別物體,機(jī)器人可以不需要在看到一個(gè)具體的杯子之前便能知道它是一個(gè)杯子,相關(guān)程序能夠類似的物體進(jìn)行識(shí)別和區(qū)分。
3.3.4基于目標(biāo)跟蹤的導(dǎo)航技術(shù)
基于目標(biāo)跟蹤的導(dǎo)航技術(shù),為機(jī)器人構(gòu)造一個(gè)虛擬地圖,機(jī)器人通過(guò)攝像頭獲取連續(xù)的視頻序定一個(gè)跟蹤的目標(biāo),為了達(dá)到對(duì)目標(biāo)的精確定位和實(shí)時(shí)跟蹤,可以利用粒子濾波算法對(duì)需要跟蹤的目標(biāo)進(jìn)行建模。基于粒子濾波的目標(biāo)跟蹤主要包含四個(gè)階段,分別是初始化目標(biāo)區(qū)域,概率轉(zhuǎn)移,目標(biāo)區(qū)域權(quán)重計(jì)算,目標(biāo)區(qū)域重采樣。在機(jī)器人導(dǎo)航之前,通過(guò)視頻序列的當(dāng)前幾幀標(biāo)注機(jī)器人所需要跟蹤的目標(biāo),在導(dǎo)航時(shí),機(jī)器人通過(guò)連續(xù)的視頻幀感知周圍的待跟蹤目標(biāo),同時(shí)對(duì)所需要跟蹤的目標(biāo)散播粒子,當(dāng)獲取的視頻幀對(duì)目標(biāo)區(qū)域重采樣后足以讓機(jī)器人確定所需要跟蹤的目標(biāo)時(shí),機(jī)器人通過(guò)確定的目標(biāo)為自己規(guī)劃最有效的路徑到達(dá)目的地。獲取視頻序列目標(biāo)跟蹤是算機(jī)視覺領(lǐng)域中的重要分支,它在工業(yè)生產(chǎn)、交通導(dǎo)航、國(guó)防建設(shè)、航空導(dǎo)航等各個(gè)領(lǐng)域有著廣泛的應(yīng)用。
關(guān)鍵詞OpenCV;科學(xué)教育;推廣價(jià)值
1、OpenCV庫(kù)簡(jiǎn)介
OpenCV是由Intel微處理器研究實(shí)驗(yàn)室的視覺交互組開發(fā)的一個(gè)跨平臺(tái)計(jì)算機(jī)視覺庫(kù),它的代碼都是開源的而且都經(jīng)過(guò)非常好的優(yōu)化,并且具有很好的移植性,可以根據(jù)需求導(dǎo)入到合適的環(huán)境中使用。它可以實(shí)現(xiàn)有關(guān)圖像識(shí)別與處理和計(jì)算機(jī)視覺技術(shù)方面的很多通用算法。它的優(yōu)勢(shì)是可以運(yùn)行在當(dāng)代社會(huì)使用熱門的各大操作系統(tǒng)上,適用性強(qiáng),還可以脫離外部庫(kù)而獨(dú)立運(yùn)行。OpenCV的C和C++都是經(jīng)過(guò)優(yōu)化的開源代碼,采用靈活的接口,提升計(jì)算機(jī)的運(yùn)行速度。其中包含的函數(shù)就有500多個(gè),包括的種類有C和C++等。OpenCV因?yàn)槊赓M(fèi)面向市場(chǎng),已經(jīng)被社會(huì)各界廣泛使用?,F(xiàn)已應(yīng)用于人機(jī)互動(dòng)、圖像識(shí)別、圖像分割、目標(biāo)追蹤、3D重建、機(jī)器視覺、結(jié)構(gòu)分析等數(shù)個(gè)領(lǐng)域。OpenCV主要包括以下幾個(gè)部分:①cxcore:核心功能模塊,包含一些基本函數(shù),運(yùn)用于各種數(shù)據(jù)類型的計(jì)算。②cv:圖像處理和計(jì)算機(jī)視覺功能。③ml:機(jī)器學(xué)習(xí)模塊,主要內(nèi)容是分類器。④cvaux:包括大部分實(shí)驗(yàn)性的函數(shù),例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持?jǐn)z像頭的讀取和轉(zhuǎn)換。
2、OpenCV處理圖像的功能
OpenCV中有很多的函數(shù),可以實(shí)現(xiàn)很多不同的功能,其中最具有學(xué)習(xí)價(jià)值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。
2.1加載圖像
不同類型的圖像有著不同的內(nèi)部結(jié)構(gòu)。我們需要根據(jù)圖像的結(jié)構(gòu)采用合適的方法將圖像文件中的數(shù)據(jù)讀入內(nèi)存。OpenCV中的cvLoadImage()函數(shù),可以加載圖像數(shù)據(jù)。而且圖像的格式不影響加載的效果,加載后它以一個(gè)指向IplImage結(jié)構(gòu)體的指針形式返回,大大方便了后續(xù)處理的過(guò)程。2.2顯示圖像加載圖像后需要通過(guò)函數(shù)使其顯示。cvNamedWindow()函數(shù)由HighGUI庫(kù)提供,它可以在屏幕上創(chuàng)建一個(gè)窗口,將圖像顯示出來(lái)。cvShowImage()函數(shù)的作用是在這個(gè)創(chuàng)建的窗口中顯示出加載過(guò)后的圖像。觀察圖像時(shí)經(jīng)常用到的重要函數(shù)還有可以使程序暫停的函數(shù)cvWaitKey(),以及用于釋放內(nèi)存的函數(shù)cvReleaseImage()和cvDestoryWindow(),掌握并運(yùn)用這些函數(shù),就可以輕松的實(shí)現(xiàn)觀察圖像的功能。
2.3處理圖像
OpenCV中包含的多種函數(shù),可以達(dá)到圖像處理技術(shù)方面的很多效果,包括圖像灰度化函數(shù)cvtColor(),邊緣檢測(cè)函數(shù)Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數(shù)addWeighted(),放大縮小函數(shù)resize(),閾值化操作函數(shù)imshow()等等。適當(dāng)選用合適的函數(shù)并加以運(yùn)用即可達(dá)到目標(biāo)所需。
3、OpenCV的推廣價(jià)值體現(xiàn)
OpenCV可以應(yīng)用在社會(huì)的各個(gè)領(lǐng)域,價(jià)值就體現(xiàn)在每個(gè)科學(xué)的產(chǎn)物當(dāng)中。舉個(gè)近在身邊的例子,隨著社會(huì)的發(fā)展,生活質(zhì)量的提高,人們的居住環(huán)境也在逐漸改善,樓層越蓋越高,無(wú)數(shù)摩天大樓,商業(yè)大廈群起而立,電梯已經(jīng)成為了我們?nèi)粘I钪斜夭豢缮俚墓ぞ?。盡管現(xiàn)在電梯的功能、質(zhì)量不斷地提升,但是仍然存在些許不足,當(dāng)我們?cè)趯W(xué)校的教學(xué)樓內(nèi)等電梯時(shí)發(fā)現(xiàn)了一個(gè)問(wèn)題,那就是在電梯使用的高峰期時(shí),比如在上下課時(shí)段,有很多人都在同一樓層等電梯。但是此時(shí)只有一臺(tái)離該樓層最近的電梯會(huì)過(guò)來(lái),而其余的電梯都會(huì)自動(dòng)向其它叫梯樓層運(yùn)行或是閑置??墒谴藭r(shí)這一臺(tái)電梯只能容納有限數(shù)量的人,時(shí)常不能使所有人坐上電梯,這樣就無(wú)法滿足全部人的需求,由此就導(dǎo)致了有部分人無(wú)法及時(shí)地坐上電梯,需要繼續(xù)等候,而閑置的電梯又不能及時(shí)地被利用。這樣不僅不能合理地利用資源,反而浪費(fèi)了許多不必要的時(shí)間。因此,我們想到可以通過(guò)利用圖像識(shí)別與處理的方法來(lái)彌補(bǔ)這個(gè)不足,首先通過(guò)硬件設(shè)備連接拍照捕獲候梯人像,后臺(tái)運(yùn)行判斷出候梯人數(shù),然后運(yùn)用語(yǔ)言編程來(lái)確定調(diào)動(dòng)電梯的個(gè)數(shù),從而來(lái)達(dá)到實(shí)現(xiàn)自動(dòng)控制每個(gè)電梯的運(yùn)行的目的,使所有人都能在第一時(shí)間乘坐電梯。而上文中提到的OpenCV就可以完成這項(xiàng)艱巨的任務(wù)。我們將OpenCV導(dǎo)入編程環(huán)境,其次修改電梯工作系統(tǒng)的運(yùn)行程序,將軟件與硬件設(shè)備相連通,這樣通過(guò)調(diào)度程序,就可以輕松高效地解決這個(gè)問(wèn)題。使用這種方法,不僅可以節(jié)約人們的候梯時(shí)間,方便學(xué)生、老師上課,而且可以合理有效地調(diào)度電梯,使電梯的價(jià)值得到最大化。見微知著,OpenCV可以應(yīng)用在每個(gè)領(lǐng)域,對(duì)各界的發(fā)展起到推動(dòng)作用,造福社會(huì)的科技發(fā)展,方便人們的生活。
4、科學(xué)教育存在的問(wèn)題
在歷年的教學(xué)模式中,老師們往往會(huì)強(qiáng)調(diào)理論知識(shí)的重要性,但卻忽略了對(duì)學(xué)生使用動(dòng)手能力的培養(yǎng),學(xué)生不能獨(dú)立完成實(shí)踐性的技術(shù)操作,也就是說(shuō)教學(xué)模式缺乏實(shí)踐性。只有將理論與實(shí)踐相結(jié)合,才能實(shí)現(xiàn)知識(shí)價(jià)值的最大化,因此,應(yīng)當(dāng)在教學(xué)中配合著實(shí)踐課程,舉一反三,讓學(xué)生們更加深刻地學(xué)習(xí)和了解所學(xué)到的知識(shí)。而如今雖然一部分學(xué)校也開設(shè)了實(shí)踐課程,但也只是淺嘗輒止,并沒有過(guò)多地講授計(jì)算機(jī)技術(shù)實(shí)踐方面的知識(shí),學(xué)生們也沒有真正擁有動(dòng)手實(shí)踐能力,這使學(xué)生們的技術(shù)知識(shí)十分受限。雖然現(xiàn)在多數(shù)學(xué)生對(duì)計(jì)算機(jī)略懂一二,但是實(shí)際上僅僅會(huì)使用類似Word等簡(jiǎn)單的軟件,而技術(shù)要求較高的一些軟件及工具卻全然不知,甚至對(duì)自己所學(xué)過(guò)的課程軟件的使用也是馬馬虎虎,這對(duì)于未來(lái)工作所需的能力來(lái)講,實(shí)在是九牛一毛。目前中學(xué)生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計(jì)算機(jī)學(xué)習(xí)更多的技能,這對(duì)青少年的發(fā)展實(shí)在是利大于弊的,而且這樣也失去了計(jì)算機(jī)的正向價(jià)值。因此,我們應(yīng)該改變現(xiàn)有的教學(xué)模式,一邊教授理論知識(shí),一邊配合指導(dǎo)學(xué)生動(dòng)手操作,將理論與實(shí)踐相結(jié)合,也能讓學(xué)生更好地消化和吸收所學(xué)到的知識(shí),并且引導(dǎo)學(xué)生正確使用計(jì)算機(jī),發(fā)揮計(jì)算機(jī)的價(jià)值,讓學(xué)生們都能夠在計(jì)算機(jī)中獲得更多的知識(shí)。
5OpenCV開源算法庫(kù)在各個(gè)領(lǐng)域的實(shí)例化體現(xiàn)
OpenCV在醫(yī)學(xué)領(lǐng)域、軍事領(lǐng)域、安全防護(hù)領(lǐng)域等都有很大的重要意義。在醫(yī)學(xué)領(lǐng)域中,由于有了這個(gè)開源算法庫(kù),我們可以盡可能地調(diào)用它,從而來(lái)進(jìn)行圖像處理、對(duì)象檢測(cè),讓醫(yī)生更好更快速觀測(cè)人體結(jié)構(gòu),及時(shí)發(fā)現(xiàn)病癥。在軍事領(lǐng)域中,大多數(shù)無(wú)人操作的機(jī)器運(yùn)作,比如無(wú)人機(jī)飛行、水下無(wú)人駕駛儀、無(wú)人駕駛汽車等等,都需要用到OpenCV來(lái)對(duì)圖像進(jìn)行處理,并進(jìn)行分析,并且可以檢測(cè)出人眼看不到的事物,這是OpenCV能夠帶來(lái)人類的巨大的進(jìn)步。在安全防護(hù)領(lǐng)域中,我們現(xiàn)實(shí)生活中常見的汽車的安全駕駛,房屋入侵的檢測(cè)、自動(dòng)監(jiān)視報(bào)警系統(tǒng)等等,正是由于這些技術(shù),讓我們的環(huán)境更加安全,這都是我們生活中息息相關(guān)不可缺少的。現(xiàn)如今,國(guó)家的科學(xué)技術(shù)飛速發(fā)展,日益強(qiáng)盛,OpenCV的成績(jī)有目共睹,未來(lái)的發(fā)展需要科學(xué)技術(shù)的不斷推進(jìn),才能為祖國(guó)未來(lái)的其他事業(yè)提供強(qiáng)有力的后盾。
6OpenCV在科學(xué)教育中的作用
在文化改革的大背景下,文盲的概念早已從沒有文化轉(zhuǎn)變成了不會(huì)使用計(jì)算機(jī)。因?yàn)殡S著科技的進(jìn)步,計(jì)算機(jī)的使用已經(jīng)越來(lái)越廣泛,計(jì)算機(jī)已經(jīng)逐步取代了以往人工可以完成的許多工作,比如在超市生成的結(jié)賬單、用計(jì)算機(jī)控制動(dòng)力系統(tǒng)的運(yùn)行、人造衛(wèi)星軌跡的計(jì)算等等,這些都依賴于計(jì)算機(jī)強(qiáng)大的功能。計(jì)算機(jī)的推廣證明著我國(guó)科技的發(fā)展和人類文明的進(jìn)步,由此可見,計(jì)算機(jī)技術(shù)知識(shí)的掌握對(duì)現(xiàn)代人來(lái)說(shuō)是十分重要的。如果想要成為一個(gè)真正有技術(shù)、有能力的人才,就務(wù)必要熟練掌握計(jì)算機(jī)技術(shù)的使用。但是目前當(dāng)代社會(huì)的教育在計(jì)算機(jī)技術(shù)方面的內(nèi)容還不夠豐富。減壓政策開放以來(lái),教育課時(shí)被壓縮,技術(shù)知識(shí)的傳輸也相應(yīng)減少,學(xué)生們的能力也因此日益下降。而科學(xué)教育,顧名思義,是使科學(xué)技術(shù)在教育過(guò)程中得以傳承。想要科學(xué)地教育學(xué)生,就必須要多多講授科學(xué)技術(shù)方面有關(guān)的知識(shí)。說(shuō)到科學(xué)技術(shù),它的重點(diǎn)自然是計(jì)算機(jī)技術(shù),而OpenCV作為計(jì)算機(jī)視覺技術(shù)的核心,可以說(shuō)也是計(jì)算機(jī)技術(shù)甚至科學(xué)教育中的一個(gè)重要部分。在教育中普及并傳承這個(gè)技術(shù)無(wú)疑可以提高學(xué)生們的技術(shù)水平。但是,相信有大多數(shù)的人在此之前從未聽說(shuō)過(guò)計(jì)算機(jī)視覺技術(shù),也并不了解OpenCV庫(kù),更加不會(huì)學(xué)習(xí)到與之有關(guān)的技術(shù)知識(shí)。在這樣嚴(yán)峻的形勢(shì)下,我們更應(yīng)該將類似OpenCV方面技術(shù)有關(guān)的知識(shí)通過(guò)教育傳遞下去。各大高校應(yīng)積極開展有關(guān)計(jì)算機(jī)的活動(dòng),開設(shè)與計(jì)算機(jī)技術(shù)有關(guān)的課程。這樣才能根據(jù)社會(huì)的需求來(lái)培養(yǎng)更多的綜合性人才。如果可以將其投入到現(xiàn)代教育當(dāng)中,定會(huì)使現(xiàn)在的教育事業(yè)更加輝煌,也能使祖國(guó)的未來(lái)更加璀璨。
參考文獻(xiàn)
[1]于仕琪,劉瑞禎.學(xué)習(xí)OpenCV(中文版)[M].北京:清華大學(xué)出版社,2009.
[2]陰法名.基于OpenCV圖像處理[J].科技信息,2009(32):220.
[3]賈小軍,喻擎蒼.基于開源計(jì)算機(jī)視覺庫(kù)OpenCV的圖像處理[J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(4):276-278.
[4]陳勝勇.基于OpenCV的計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)[M].北京:科學(xué)出版社,2008.
[5]劉潔,馮貴玉,張汗靈.一種圖像處理和計(jì)算機(jī)視覺的開發(fā)工具[J].計(jì)算機(jī)仿真,2006(11).
關(guān)鍵詞: 計(jì)算機(jī)視覺; 手指特征識(shí)別; 動(dòng)態(tài)閾值算法; 矩形模版
中圖分類號(hào): TN911?34; TP37 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)12?0113?04
Abstract: In order to improve the accuracy and speed of the finger feature recognition in video image, a dynamic threshold algorithm based on rectangle template is proposed. The rectangle template is used in the algorithm to smooth the image, and the gray threshold method is used to extract the edge of the target to recognize the finger feature accurately. The Matlab simulation results show that the algorithm is lightly influenced by environmental noise, and can segment the edge of the finger clearly and accurately. A finger feature recognition system based on computer vision was designed on FPGA platform. Its real?time performance, finger recognition accuracy and other performances were tested. The test results show that the running speed of the system is synchronous with the speed of capturing the image by camera, which can meet the real?time requirement of the system. The coordinates deviation of the finger position recognized by the system is about 3 pixels, which can basically meets the accuracy requirement of the system.
Keywords: computer vision; finger feature recognition; dynamic threshold algorithm; rectangle template
S著科學(xué)技術(shù)的飛速發(fā)展,人與計(jì)算機(jī)之間的交互活動(dòng)越來(lái)越密切,并逐漸成為人們?nèi)粘I畹闹匾M成部分。傳統(tǒng)觸摸屏是現(xiàn)階段一種最常見,也是最重要的人機(jī)交互方式,其是通過(guò)一種附加在顯示器表面的透明介質(zhì),依賴使用者的手指觸摸該介質(zhì)來(lái)實(shí)現(xiàn)對(duì)計(jì)算機(jī)的輸入控制[1?2]。目前,這種觸摸屏技術(shù)已經(jīng)相當(dāng)成熟,但是,技術(shù)上不容易做到大尺寸,且成本相對(duì)較高,也易于破損。為了突破傳統(tǒng)觸摸屏這種人機(jī)交互方式的局限,把任何成像平面變成可用手指進(jìn)行交互的系統(tǒng),本文提出了一種基于計(jì)算機(jī)視覺的手指特征識(shí)別算法,并在FPGA平臺(tái)上建立了一套基于計(jì)算機(jī)視覺的手指特征識(shí)別硬件系統(tǒng)。這種基于計(jì)算機(jī)視覺的手指特征識(shí)別方法可為基于視覺的人機(jī)互動(dòng)提供一種新的技術(shù)解決途徑。其與傳統(tǒng)觸摸屏的區(qū)別在于,不需要在成像屏幕上安裝任何特殊介質(zhì),使用壽命得到大幅延長(zhǎng),應(yīng)用范圍有了很大擴(kuò)展。
1 圖像采集平臺(tái)
本文所采用的圖像采集平臺(tái)如圖1所示,在任何與計(jì)算機(jī)連接的顯示設(shè)備(如投影屏幕、等離子電視等)的左上角、右上角安裝兩個(gè)攝像頭,通過(guò)這兩個(gè)攝像頭便可確定手指在屏幕上的二維坐標(biāo)信息(x1,x2)。然后,將此坐標(biāo)點(diǎn)傳至計(jì)算機(jī),并與Windows系統(tǒng)的鼠標(biāo)程序關(guān)聯(lián)即可實(shí)現(xiàn)人機(jī)交互功能。圖2是圖像采集平臺(tái)的側(cè)視圖。其中虛線框表示攝像頭視野中系統(tǒng)需要處理的區(qū)域,即手指出現(xiàn)的區(qū)域。
2 手指特征識(shí)別算法及仿真
在系統(tǒng)實(shí)現(xiàn)過(guò)程中,如何從攝像頭所拍攝的畫面中準(zhǔn)確地識(shí)別并提取出手指信息是其難點(diǎn)之一。在目前的圖像處理技術(shù)中,用于識(shí)別背景圖案中目標(biāo)物體的算法很多,本文在分析基于色彩聚類的膚色識(shí)別算法的基礎(chǔ)上,結(jié)合課題特殊需求,提出一種基于矩形模板的動(dòng)態(tài)閾值算法,并在Matlab中對(duì)上述算法的處理效果進(jìn)行了仿真。
從圖像采集平臺(tái)可以看出,本系統(tǒng)只關(guān)心距屏幕很近的小視野內(nèi)是否出現(xiàn)區(qū)別于背景的目標(biāo)物體。因此,只需從攝像頭拍攝的圖像當(dāng)中截取一部分,如圖3中的小矩形框所示。
2.1 基于色彩聚類的膚色識(shí)別算法
膚色是人體區(qū)別于其他物體的一個(gè)重要特征,人體膚色特征不受位置、角度、大小等因素影響,具有較強(qiáng)的穩(wěn)定性。因此,本文首先選定基于色彩聚類的膚色提取識(shí)別算法進(jìn)行研究。在色彩聚類方法中,Anil K.Jain的Cb,Cr橢圓聚類方法最為典型[3?4]。采用非線性分段膚色分割得到的膚色區(qū)域在Cb,Cr空間中近似于橢圓,如下:
由圖5可知,利用該算法分割手指信息的效果尚可,能從比較友好的環(huán)境中迅速準(zhǔn)確地識(shí)別出手指信息。圖6為利用橢圓聚類膚色分割算法對(duì)從圖像采集平臺(tái)讀取圖像的手指識(shí)別效果??梢?,該算法在普通環(huán)境下對(duì)手指的識(shí)別效果良好。但當(dāng)屏幕上的顏色影響手指膚色時(shí),該算法的識(shí)別能力就會(huì)有所降低??梢?,該算法對(duì)皮膚顏色的純度要求較高,適用范圍受限。圖7為屏幕出現(xiàn)大面積藍(lán)色時(shí)對(duì)手指識(shí)別造成的影響效果。
2.2 基于正方形模板的動(dòng)態(tài)閾值算法
基于正方形模板的動(dòng)態(tài)閾值算法,即采用灰度閾值法,用正方形模板平滑圖像[5?6]。圖8(a)是3×3模板動(dòng)態(tài)閾值算法平滑圖像的過(guò)程。
應(yīng)用基于3×3模板的動(dòng)態(tài)閾值算法對(duì)原圖4進(jìn)行邊緣提取的仿真效果如圖9(a)所示。可見,應(yīng)用3×3模板可以提取出目標(biāo)物體的邊緣,但不夠清晰。雖然可以通過(guò)增大模板取得比較理想的效果(圖9(b)為采用基于101×101模板的動(dòng)態(tài)閾值算法的處理效果),但會(huì)使計(jì)算量劇增,同時(shí)也縮小了模板所能完全覆蓋的范圍,使圖像邊緣產(chǎn)生無(wú)效的白色區(qū)域。
2.3 基于矩形模板的動(dòng)態(tài)閾值算法
根據(jù)課題實(shí)際需要,即所要處理的目標(biāo)區(qū)域?yàn)殚L(zhǎng)方形窄條區(qū)域(如圖3所示),本文提出一種基于矩形模板的動(dòng)態(tài)閾值算法。該算法與基于正方形模板算法的區(qū)別在于,平滑圖像時(shí)所用的模板為窄條形,如3×5模板,3×15模板,3×41模板等。圖8(b)是3×9模板動(dòng)態(tài)閾值算法平滑圖像的過(guò)程。
圖10給出了采用基于3×9模板、3×14模板、3×81模板、3×101模板動(dòng)態(tài)閾值算法對(duì)原圖4進(jìn)行手部邊緣提取的仿真效果。由仿真效果可知,基于矩形模板的動(dòng)態(tài)閾值算法在模板取值為3×9的情況下,便能夠清晰提取出目標(biāo)物體的邊緣。而且,隨著模板取值的增加,目標(biāo)物體邊緣的提取效果更加清晰準(zhǔn)確。與基于正方形模板的動(dòng)態(tài)閾值算法相比,基于矩形模板的動(dòng)態(tài)閾值算法計(jì)算量較小,節(jié)約了系統(tǒng)的計(jì)算資源。
3 基于FPGA的手指特征識(shí)別算法的系統(tǒng)測(cè)試
為了驗(yàn)證本文所提出的基于矩形模板的動(dòng)態(tài)閾值算法能否滿足屏幕交互系統(tǒng)的整體要求,本文通過(guò)編寫軟件程序在FPGA開發(fā)板上對(duì)這種算法進(jìn)行了硬件實(shí)現(xiàn)和系統(tǒng)測(cè)試。
3.1 硬件實(shí)現(xiàn)
本文所采用的硬件實(shí)現(xiàn)系統(tǒng)主要是基于美國(guó)Altera公司生產(chǎn)的型號(hào)為EFA?CY1C12的“紅色颶風(fēng)”(Red Cyclone)系列FPGA開發(fā)板,并另外集成了用Ommvison公司的型號(hào)為OV9655的CMOS數(shù)字?jǐn)z像頭,以及ISSI公司的型號(hào)為IS61LV25616AL的SRAM存儲(chǔ)器[7?10]。最終搭建的硬件系統(tǒng)如圖11所示。
3.2 系統(tǒng)測(cè)試
本文主要對(duì)系統(tǒng)的實(shí)時(shí)性、手指提取精度、資源占用情況等影響系統(tǒng)運(yùn)行的重要技術(shù)指標(biāo)進(jìn)行了測(cè)試。
(1) 實(shí)時(shí)性
OV9655攝像頭在1 280×1 024分辨率下,能提供15 f/s的圖像采集速率,課題所設(shè)計(jì)的軟件程序可以在一幀圖像的處理時(shí)間內(nèi)完成了數(shù)據(jù)的采集、手指邊緣的識(shí)別等運(yùn)算,實(shí)現(xiàn)了系統(tǒng)執(zhí)行速度與攝像頭拍攝速度的同步,達(dá)到了系統(tǒng)對(duì)實(shí)時(shí)性要求。
(2) 手指識(shí)別精度
由于課題在軟件設(shè)計(jì)過(guò)程中編入了圖像采集防抖動(dòng)處理程序,提高了圖像采集的穩(wěn)定性,也提高了手指識(shí)別的精度。經(jīng)過(guò)測(cè)試,本系統(tǒng)得到的手指位置信息的坐標(biāo)偏差為3個(gè)像素,基本滿足大屏幕交互系統(tǒng)對(duì)識(shí)別精度的需求。
(3) 資源占用情況
從Quartus Ⅱ的編譯報(bào)告中可以看出,本系統(tǒng)的軟件運(yùn)行已占用FPGA的9 702個(gè)邏輯單元,占邏輯單元總數(shù)的80%??梢?,該硬件系統(tǒng)的FPGA運(yùn)算資源基本能滿足系統(tǒng)的實(shí)際需要。
4 結(jié) 語(yǔ)
本文通過(guò)對(duì)基于矩形模板的動(dòng)態(tài)閾值算法的研究和基于FPGA的手指特征識(shí)別硬件系統(tǒng)的實(shí)現(xiàn),建立了一套基于計(jì)算機(jī)視覺的手指特征識(shí)別系統(tǒng)。該算法受環(huán)境噪聲影響較小,能清晰準(zhǔn)確地分割出手指邊緣,且隨著矩形模版取值的增大,算法的識(shí)別效果會(huì)更加良好。該系統(tǒng)的實(shí)時(shí)性、手指識(shí)別精度及資源占用情況均可滿足系統(tǒng)要求。這種基于計(jì)算機(jī)視覺的手指識(shí)別方法成本低、靈活性好,為基于視覺的人機(jī)交互提供了一種新的技術(shù)途徑。
參考文獻(xiàn)
[1] 呂明,呂延.觸摸屏的技術(shù)現(xiàn)狀、發(fā)展趨勢(shì)及市場(chǎng)前景[J].機(jī)床電器,2012,39(3):4?7.
[2] 陳康才,李春茂.電阻式觸摸屏兩點(diǎn)觸摸原理[J].科學(xué)技術(shù)與工程,2012,12(18):4525?4529.
[3] MAITRE H.現(xiàn)代數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2006:79.
[4] 帕科爾,景麗.圖像處理與計(jì)算機(jī)視覺算法及應(yīng)用[M].2版.北京:清華大學(xué)出版社,2014:104.
[5] GONZALEZ R C,WOODS R E,EDDINS S L.數(shù)字圖像處理的Matlab實(shí)現(xiàn)[M].2版.北京:清華大學(xué)出版社,2013:301.
[6] RUSS J C.數(shù)字圖像處理[M].6版.北京:清華大學(xué)出版社,2014:216.
[7] 于楓.Altera可編程輯器件應(yīng)用技術(shù)[M].北京:科學(xué)出版社,2014:68.
[8] 姚智剛,付強(qiáng).基于低成本CMOS攝像頭智能監(jiān)控系統(tǒng)的設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2006,29(3):126?128.
計(jì)算機(jī)技術(shù) 計(jì)算機(jī)安全 計(jì)算機(jī)維護(hù) 計(jì)算機(jī)理論 計(jì)算機(jī)軟件 計(jì)算機(jī)網(wǎng)絡(luò) 計(jì)算機(jī)畢業(yè)論 計(jì)算機(jī)英語(yǔ) 計(jì)算機(jī)畢業(yè) 計(jì)算機(jī)病毒 紀(jì)律教育問(wèn)題 新時(shí)代教育價(jià)值觀