前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇計算機視覺的應用方向范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
以下為報告詳細內(nèi)容:
2017年計算機視覺技術在更多的領域有所落地應用,自動駕駛領域、高考、政務等領域更多的場景開始應用計算機視覺技術。艾媒咨詢分析師認為,計算機視覺行業(yè)技術是核心基礎,隨著技術成熟度提高,未來將有更多的場景能夠應用計算機視覺技術,計算機視覺企業(yè)應在強化技術打造的前提下,發(fā)掘更多新的應用領域,提高商業(yè)落地應用。
2017年人臉識別技術在智能手機終端應用開始普及。9月蘋果新品會上,iPhone X宣布引入Face ID高精度人臉識別技術,引來人們高度關注。而除了iPhone X,華為、小米、OPPO、vivo等手機廠商都推出了帶人臉識別功能的智能手機。艾媒咨詢分析師認為,計算機視覺領域內(nèi)人臉識別功能可應用場景廣泛,商業(yè)化落地能力強,除了計算機視覺創(chuàng)業(yè)企業(yè),互聯(lián)網(wǎng)巨頭和硬件巨頭企業(yè)也紛紛關注布局人臉識別領域。但目前人臉識別技術仍然存在一定缺陷,艾媒大數(shù)據(jù)輿情管控系統(tǒng)數(shù)據(jù)顯示,“手機人臉識別”熱詞言值數(shù)據(jù)為48.5,整體輿情偏負向。現(xiàn)階段人臉識別技術在智能手機終端上的應用仍處于起步發(fā)展階段,技術和安全性仍有待提高,未來隨著各計算機視覺企業(yè)加強技術研發(fā),人臉識別技術有望進一步改善,成為智能手機標配。
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,2017年中國計算機視覺市場規(guī)模為68億元,預計2020年市場規(guī)模達到780億元,年均復合增長率達125.5%。艾媒咨詢分析師認為,人們安全和效率需求不斷提升,計算機視覺技術在各行業(yè)應用能有效滿足人們需求,市場發(fā)展空間巨大。國家政策對人工智能行業(yè)的支持也為計算機視覺的發(fā)展提供了有利的環(huán)境。隨著計算機視覺技術日漸成熟,企業(yè)商業(yè)化落地能力不斷提高,未來計算機視覺市場規(guī)模將迎來突破性發(fā)展。
iiMedia Research(艾媒咨詢)數(shù)據(jù)顯示,商湯科技以24.3%的企業(yè)知名度排名各計算機視覺企業(yè)首位,曠視科技與云從科技則分別以23.1%以及21.7%的知名度分列二三位。艾媒咨詢分析師認為,商湯科技計算機視覺技術及算法能力在行業(yè)內(nèi)較為出色,同時在安防、金融、商業(yè)、手機端等多個領域均有商業(yè)落地應用,在企業(yè)認知和品牌推廣方面具有優(yōu)勢。
iiMedia Research(艾媒咨詢)顯示,61.7%的受訪網(wǎng)民通過手機APP應用接觸計算機視覺應用,另外有50.9%的受訪網(wǎng)民接觸途徑為通過智能手機終端。艾媒咨詢分析師認為,計算機視覺企業(yè)主要服務B端用戶及政府機構,相比于其他途徑,移動端更適合應用計算機視覺技術的產(chǎn)品推廣。計算機視覺技術日趨成熟,在移動終端和APP上均有落地應用,也進一步為計算機視覺企業(yè)在大眾中奠定基礎。未來企業(yè)可通過線上渠道開發(fā)挖掘C端用戶市場。
iiMedia Research(艾媒咨詢)顯示,半數(shù)受訪網(wǎng)民認為智能手機及APP加入人臉識別技術功能方便了二者的使用,另有48.8%的受訪網(wǎng)民認為人臉識別技術在手機及APP上的應用是未來技術發(fā)展的趨勢。艾媒咨詢分析師認為,人臉識別技術在手機及APP端的應用滿足人們智能化和便捷化的需求,隨著越來越多的手機及APP產(chǎn)品加入人臉識別功能,未來其普及和認可程度將得到進一步提高。
iiMedia Research(艾媒咨詢)顯示,41.8%的受訪網(wǎng)民表示未來愿意使用人臉識別技術進行手機及APP解鎖,同時有41.4%的受訪網(wǎng)民雖持觀望態(tài)度,但愿意嘗試。此外,47.4%的受訪網(wǎng)民認為人臉識別將取代其他手機及APP解鎖技術成為未來主流。艾媒咨詢分析師認為,近期智能手機紛紛應用人臉識別技術解鎖推動該功能技術的普及,便捷性的優(yōu)勢使該功能技術前景受看好。但目前人臉識別解鎖技術的準確性仍然受到質疑,隨著未來技術進一步成熟,該技術有望成為智能手機設備標配。
iiMedia Research(艾媒咨詢)顯示,33.9%的受訪網(wǎng)民曾使用過人證比對功能進行業(yè)務辦理。在使用過該功能的人群中,54.6%認為其方便了業(yè)務辦理,提供了效率,且有47.3%該部分人群認為其識別準確程度高。艾媒咨詢分析師認為,政府、銀行等機構業(yè)務辦理效率以往常遭詬病,人證識別技術的應用提高了辦事效率,在提高人們滿意度的同時,加強了計算機視覺技術的認可度。未來計算機視覺技術在政府、銀行等機構的落地應用將進一步擴展,但其中涉及到個人信息保護等問題需要企業(yè)及相關機構合力解決。
iiMedia Research(艾媒咨詢)顯示,34.1%的受訪網(wǎng)民認為公安辦案為最有必要應用人臉識別技術的安防情景。而關于網(wǎng)民對人臉識別技術在安防監(jiān)控領域應用看法調查中,56.1%的受訪網(wǎng)民認為其能有力保護人們?nèi)松碡敭a(chǎn)安全。艾媒咨詢分析師認為,計算機視覺技術,尤其是人臉識別技術在安防領域應用意義重大,在刑偵破案、身份認證、公共安全保護等情景具有重要應用價值。未來安防領域將成為計算機視覺技術重點應用領域,而安防的重要性也對相關企業(yè)技術實力有嚴格的要求,未來安防領域市場或由少數(shù)技術實力較強的企業(yè)占據(jù)。
商湯科技是專注計算機視覺與深度學習原創(chuàng)技術的人工智能創(chuàng)業(yè)企業(yè),擁有強大的技術能力和人才資源儲備支撐發(fā)展。商湯科技在計算機視覺領域綜合實力較強,獲資本方青睞,B輪融資4.1億美元,同時與國內(nèi)外知名企業(yè)展開合作。艾媒咨詢分析師認為,商湯科技在商業(yè)營收上同樣處于行業(yè)領先水平,但其本質專注于技術發(fā)展,強大的技術基礎能較好支撐商湯科技在上層應用場景的擴展。商湯科技在技術驅動商業(yè)應用的同時,積累商業(yè)應用經(jīng)驗,提高企業(yè)知名度,拓展應用至更多領域。
艾媒咨詢分析師認為,商業(yè)化落地能力欠缺是目前計算機視覺行業(yè)大部分企業(yè)的痛點,商湯科技在商業(yè)落地應用方面處于行業(yè)領先位置。這一方面源于商湯科技技術能力往專業(yè)化發(fā)展,以專業(yè)技術和研發(fā)基礎實現(xiàn)場景差異化應用。另一方面,純計算機視覺技術或算法由于其專業(yè)性,需求方在使用時需要具備專業(yè)能力,而商湯科技技術產(chǎn)品往標準化方向打造,打包成行業(yè)解決方案,能適應更多企業(yè)使用需求,也有利于商湯科技技術進一步落地應用。未來堅持技術為基礎,繼續(xù)提高商業(yè)落地能力,商湯科技有望繼續(xù)保持良好發(fā)展態(tài)勢。
曠視科技成立于2011年,2017年10月完成巨額C輪融資,專注于人臉識別、圖像識別和深度學習技術自主研發(fā)和商業(yè)化落地,深耕于金融安全、城市安防、商業(yè)物聯(lián)、工業(yè)機器人等領域,同時打造人工智能開放云平臺。艾媒咨詢分析師認為,曠視科技利用云平臺為開發(fā)者提供技術支撐,有利于計算機視覺技術進一步結合產(chǎn)品運營,同時可以收集海量圖片數(shù)據(jù),通過進行深度學習,曠視科技圖像識別技術又能進一步得到提升,有利于其強化自身核心技術能力。
艾媒咨詢分析師認為,人臉識別技術對于金融行業(yè)業(yè)務辦理及風控等流程具有重要應用價值,曠視科技在人臉識別技術上的優(yōu)勢也助其有效開展金融領域的服務應用。未來隨著曠視科技利用云開放平臺相關圖片數(shù)據(jù)進行深度學習強化人臉識別技術,以及在金融領域積累的渠道資源,其有望在金融領域繼續(xù)強化技術服務,成為該領域市場有力的競爭者。
艾媒咨詢分析師認為,自動駕駛為人工智能和汽車行業(yè)未來發(fā)展方向,計算機視覺技術在自動駕駛汽車實現(xiàn)路況感知、高精度定位等方面發(fā)揮重要作用,自動駕駛為計算機視覺技術未來重要應用領域。圖森未來的計算機視覺技術和算法在自動駕駛領域實現(xiàn)專業(yè)化發(fā)展,未來有望在此細分領域成長為領先企業(yè)。
2017-2018中國計算機視覺行業(yè)發(fā)展趨勢
需求驅使計算機視覺行業(yè)發(fā)展?jié)摿薮髴脠鼍巴卣節(jié)B透各行業(yè)
艾媒咨詢分析師認為,人們對生活安全以及生產(chǎn)效率追求兩大需求的提升,決定計算機視覺行業(yè)具有巨大發(fā)展空間。而計算機視覺技術場景應用具有廣泛性,有望發(fā)展成為下一個智能時代的標配。目前計算機視覺技術主要應用在B端領域,短期內(nèi)行業(yè)發(fā)展趨勢也是集中于B端領域。未來隨著技術成熟,計算機視覺有望拓展更多新的應用場景,實現(xiàn)場景落地,滲透至各行各業(yè),形成AI+,開拓更多C端業(yè)務。此外,計算機視覺技術可以跟其他技術,如AR、VR、無人駕駛等結合發(fā)展,創(chuàng)造新的應用領域。
技術應用由點及面行業(yè)解決方案及軟硬件結合成商業(yè)產(chǎn)品出路
對于計算機視覺技術使用者來說,由于技術的學習應用需要花費較多時間和精力,硬件產(chǎn)品及行業(yè)解決方案往往更受青睞。未來計算機視覺企業(yè)需要將軟硬件結合,如打造嵌入式芯片等。此外,計算機視覺企業(yè)應將技術應用由點及面,將技術應用發(fā)展成針對各行業(yè)的解決方案。未來市場將出現(xiàn)更多基于計算機視覺技術應用的行業(yè)解決方案和軟硬一體化產(chǎn)品,只有打造方便用戶使用的商業(yè)產(chǎn)品,才能有效適應其需求,幫助計算機視覺企業(yè)迅速占領行業(yè)市場,在市場競爭中取得領先優(yōu)勢。
計算機視覺行業(yè)發(fā)展對企業(yè)綜合實力要求高
艾媒咨詢分析師認為,計算機視覺行業(yè)巨大的發(fā)展前景決定其具有高成長性特點,未來將涌現(xiàn)更多人工智能領域優(yōu)秀企業(yè)。但行業(yè)發(fā)展同時伴隨高風險性,行業(yè)競爭需要比拼企業(yè)技術算法能力、資金能力、以及人才資源,同時考驗企業(yè)能否實現(xiàn)技術迅速落地,對企業(yè)綜合實力要求高,綜合實力不具備優(yōu)勢的企業(yè)在行業(yè)內(nèi)將難以生存。
1.1自動化程度高
計算機視覺可以實現(xiàn)對農(nóng)產(chǎn)品的多個外形和內(nèi)在品質指標進行同時檢測分析,可以進行整體識別、增強對目標識別的準確性。
1.2實現(xiàn)無損檢測
由于計算機視覺技術對農(nóng)產(chǎn)品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。
1.3穩(wěn)定的檢測精度
設計的運行程序確定后,計算機視覺技術的識別功能就會具有統(tǒng)一的識別標準,具有穩(wěn)定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。
2計算機視覺技術在食品檢測中的應用
20世紀70年代初,學者開始研究計算機視覺技術在食品工業(yè)中的應用,近幾十年電子技術得到快速發(fā)展,計算機視覺技術也越來越成熟。國內(nèi)外學者在研究計算機視覺技術在食品工業(yè)中的應用方面主要集中在該技術對果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識別、內(nèi)部無損檢測等方面。國內(nèi)有關計算機視覺技術在食品業(yè)中的應用研究起始于90年代,比國外發(fā)達國家晚20多年,但是發(fā)展很快。
2.1計算機視覺技術在果蔬分級中的應用研究
計算機視覺技術在食品檢測中的應用研究相當廣泛,從外部直徑、成熟度的檢測到內(nèi)部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的最大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標準所規(guī)定的5mm分類標準差,可在工業(yè)生產(chǎn)中很好應用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術在蘋果檢測與分級中的應用,結果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎,結合模糊聚類知識利用計算機視覺技術來檢測蘋果缺陷域,檢測不僅快速而且結果精確。劉禾等[7]通過研究認為蘋果的表面缺陷可以利用計算機視覺技術進行檢測,計算機視覺技術還可以將蘋果按照檢測結果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應義斌等[8]通過計算機視覺技術、圖象處理技術、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術、遺傳算法、多層前饋神經(jīng)網(wǎng)絡系統(tǒng),實現(xiàn)了具有精確度高、靈活性強和速度快等優(yōu)點的蘋果成熟度自動判別。陳育彥等[10]采用半導體激光技術、計算機視覺技術和圖像分析技術相結合的方法檢測蘋果表面的機械損傷和果實內(nèi)部的腐爛情況,初步驗證了計算機視覺技術檢測蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過計算機視覺技術對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統(tǒng)的檢測方法速度快、準確率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結果顯示準確率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關性,然而根據(jù)相關性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數(shù)據(jù),對蘋果的外徑、體積、以及圓形度等參數(shù)進行處理,與人工檢測相比,計算機視覺技術具有檢測效率高,檢測標準統(tǒng)一性好等優(yōu)點。Blasco.J[15]通過計算機視覺技術分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統(tǒng)、輸送轉換系統(tǒng)、輸送翻轉系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實時監(jiān)測、品質動態(tài)的智能分級系統(tǒng),能夠很好地實現(xiàn)蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關系,應用計算機視覺技術檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其準確率均為92%,按果面損傷分級的準確率分別為76%和80%。
2.2計算機視覺技術在禽蛋檢測中的應用研究
禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級、品質檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術,獲得裂紋形狀并判斷,試驗結果表明,計算機視覺技術對雞蛋蛋殼裂紋的檢測準確率高達98%。汪俊德等[19]以計算機視覺技術為基礎,設計出一套雙黃雞蛋檢測系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設計的數(shù)學模型對比來實現(xiàn)雙黃雞蛋的檢測和識別,檢測準確率高達95%。鄭麗敏等[20]人通過高分辨率的數(shù)字攝像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學模型來預測雞蛋的新鮮度和貯藏期,結果表明,計算機視覺技術對雞蛋的新鮮度、貯藏期進行預測的結果準確率為94%。潘磊慶等[21]通過計算機視覺技術和聲學響應信息技術相結合的方法檢測裂紋雞蛋,其檢測準確率達到98%。MertensK等[22]人基于計算機視覺技術研發(fā)了雞蛋的分級檢測系統(tǒng),該系統(tǒng)識別帶污漬雞蛋的正確率高達99%。
2.3計算機視覺技術在檢測食品中微生物含量的應用研究
計算機技術和圖像處理技術在綜合學科中的應用得到快速發(fā)展,在微生物快速檢測中的應用也越來越多,主要是針對微生物微菌落的處理。食品工業(yè)中計算機視覺技術在微生物檢測方面的研究和應用以研究單個細胞為主,并在個體細胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術為基礎,設計了一套應用計算機視覺技術快速定量檢測食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測結果與傳統(tǒng)方法的檢測結果具有很好的相關性,但與傳統(tǒng)方法相比,可以節(jié)省5d時間,檢測時間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質。Lawless等[24]人等時間段測定培養(yǎng)基上的細胞密度,然后通過計算機技術建立時間和細胞密度之間的動態(tài)關聯(lián),利用該關聯(lián)可以預測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計算機可以顯示被檢測菌落的具置,并且根據(jù)動態(tài)關聯(lián)計算機視覺系統(tǒng)可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術用于豬肉的分級進行了研究,結果顯示計算機視覺技術在識別豬肉表面微生物數(shù)量上與國標方法檢測的結果顯著相關,該技術可以有效地計算微生物的數(shù)量。Bayraktar.B等[26]人采用計算機視覺技術、光散射技術(BARDOT)和模式識別技術相結合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態(tài)特征有,對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經(jīng)網(wǎng)絡、圖像處理等技術,用分辨率為520萬像素的數(shù)字攝像機拍攝細菌內(nèi)部的染色效果,并結合新的圖像處理算法,對細菌形態(tài)學的8個特征參數(shù)進行檢測,檢測結果與傳統(tǒng)檢測結果顯著相關(相關系數(shù)R=0.9987),和傳統(tǒng)檢測方法相比該方法具有操作簡單、快速、結果準確、適合現(xiàn)場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數(shù)量進行識別,并以此作為衡量乳制品質量是否達標的依據(jù),并對產(chǎn)品進行分級。
2.4計算機視覺技術在其他食品產(chǎn)業(yè)中的應用研究
里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對照數(shù)學模型,采用數(shù)字圖像處理技術、計算機識別技術實現(xiàn)了對貝類和蝦類等海產(chǎn)品的無損檢測和自動化分類、分級和質量評估,并通過實例詳細闡述了該技術的實現(xiàn)方法,證實了此項技術的有效性。計算機視覺技術還可以檢驗玉米粒形和玉米種子質量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術對圖像進行分析評估,毛葉棗可食率的評估結果與運用物理方法測得的結果平均誤差僅為1.47%,因此得出結論:計算機視覺技術可以應用于毛葉棗的自動分級。GokmenV等[33-34]通過對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率的關系,結果顯示兩項參數(shù)相關性為0.989,從而可以應用計算機視覺技術來預測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術對花生內(nèi)部和外部采集圖像,并通過圖像對其外在品質和內(nèi)在品質進行分析,并建立相應的數(shù)學模型,該技術在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等[36]人以國家標準為依據(jù),通過數(shù)字攝像技術獲取豬肉的細菌菌斑面積、脂肪細胞數(shù)、顏色特征值以及氨氣等品質指標來實現(xiàn)豬肉新鮮程度的分級辨認。
3展望
新技術的研究與應用必然伴隨著坎坷,從70年代初計算機視覺技術在食品工業(yè)中進行應用開始,就遇到了很多問題。計算機視覺技術在食品工業(yè)中的研究及應用主要存在以下幾方面的問題。
3.1檢測指標有限
計算機視覺技術在檢測食品單一指標或者以一個指標作為分級標準進行分級時具有理想效果,但以同一食品的多個指標共同作為分級標準進行檢測分級,則分級結果誤差較大[37]。例如,Davenel等[38]通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結果顯示,系統(tǒng)會把花萼和果梗標記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復雜,造成分級誤差很大,分級正確率只有69%。Nozer[39-40]等以計算機視覺為主要技術手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。
3.2兼容性差
計算機視覺技術針對單一種類的果蔬分級檢測效果顯著,但是,同一套系統(tǒng)和設備很難用于其它種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計算機視覺設備。Reyerzwiggelaar等[41]利用計算機視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測桃子的準確率顯著高于杏的。Majumdar.S等[42]利用計算機視覺技術區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。
3.3檢測性能受環(huán)境制約
關鍵詞:計算機視覺;教學應用;教學改革
計算機視覺是人工智能學科中的一門重要課程。隨著相關應用在多個領域中的出現(xiàn),越來越多的學生開始對這門課產(chǎn)生了濃厚的興趣。如何讓學生能夠在整個課程中保持盎然的興趣,并為有志于深入研究計算機視覺的學生指明方向,成為我們教師首先應注重的問題。
在實際的教學工作中,通過不斷摸索總結,我們認為,以實際應用引導學生的學習興趣,既滿足了學生想了解計算機視覺實際應用的需求,又加深了學生對于算法的理解,把算法放在一個實際應用中,學生可以理解怎么用,為什么這么用。在這樣的目標導引下,我們從選擇教材開始,準備教學內(nèi)容(包括合理的應用實例的選擇)、制作PPT、探索教學方法,形成了目前以實際應用為主導的創(chuàng)新教學體系,非常受學生歡迎。在此,我們對這期間遇到的問題,解決方法、心得體會做一個總結和思考,希望能對同行有些許參考作用。
1選擇教材
在我們這個專業(yè),每年的上研率基本都保持在50%左右。在本專業(yè)的研究生階段,也開設了雙語教學的計算機視覺課程。另外,畢業(yè)后選擇參加工作的同學也基本都進入和本專業(yè)非常相關的一些單位,所從事的工作,都是和在學校學習的知識密切相關。
因此,如何讓這門課程的教學既兼顧本科畢業(yè)就參加工作的那部分同學,又兼顧繼續(xù)深造的學生的需求,也是在這門課程講授的過程中,需要特別注意的一個問題。對于本科畢業(yè)就要參加工作的同學而言,需要“廣度”,需要了解計算機視覺這門課在各個領域中的應用,在實際中接觸到相關的項目或工作時,能夠知道去哪里可以找到自己需要的參考資料;而對于要進一步深造的同學而言,則需要一定的“深度”,為研究生階段的研究打下基礎。
全盤考慮到這些學生畢業(yè)之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學出版社于 2000年出版的《機器學習》[2],這是一部順應了時代與教學發(fā)展要求的教材,對計算機視覺中的基本概念、基本算法、基本算法的應用、經(jīng)典應用進行了由淺入深的介紹。內(nèi)容涵蓋了所有經(jīng)典的數(shù)字圖像處理與機器視覺方法,也對一些已經(jīng)得到非常好實際應用的方法,如光流法等作了簡要介紹。另外還選擇了一本英文原版的計算機視覺的經(jīng)典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],機械工業(yè)出版社于2003年出版。這是國內(nèi)外非常推崇的一本計算機視覺著作,該教材條理清晰,深入淺出,對計算機視覺的基本原理、算法、應用的介紹非常詳盡。
在教學中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機器視覺》,這樣中英文對照講解,一方面加深學生對教學內(nèi)容的理解,另一方面也為學生今后閱讀專業(yè)的英文論了相應準備。
2教學內(nèi)容和工程實例的選取
2.1選取教學內(nèi)容
本課程之前,大學二年級的本科生已開設數(shù)字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學內(nèi)容的安排上,分為兩大部分:數(shù)字圖像處理部分和視覺部分。數(shù)字信號處理部分主要講解在視覺部分會用到的一些基本算法,為后面進入計算機視覺部分打基礎。這部分約占總課時的1/3。視覺部分的課時也分為兩部分:算法講解與實例講解。在算法講解部分,對計算機視覺的基本算法、經(jīng)典算法都做了深入淺出的講解。實例部分則選擇了經(jīng)典的工業(yè)應用,讓學生能夠對所學算法進一步加以理解。
2.2選取適當?shù)墓こ虒嵗?/p>
就計算機視覺的教學內(nèi)容而言,各個孤立的算法和方法對本科生來講,有些抽象不好理解。如果在教學上僅僅通過老師在課堂上的講解,很難讓學生深入地理解相關的教學內(nèi)容,而選擇一個觸手可及且簡單好理解的工程實例往往就會達到意想不到的教學結果,學生可以把課堂上所學的枯燥理論與現(xiàn)實中活生生的事物聯(lián)系起來,從而加深對教學內(nèi)容的理解。
通過反復比對、反復論證,我們選擇了在講解基本原理和算法之后,在課程結束前,專門留出課時講解手機制造這個例子。手機現(xiàn)在是人手一部,是這些年青學子再熟悉不過的事物了,通過對手機主板、手機鍵盤的制造過程的講解,把所學的算法都融合進來,學生在覺得有趣的同時,不知不覺就加深了對所學算法的理解。
另外,在教學的過程中,我們還不斷穿插其他學生耳熟能詳?shù)膶嵗?如數(shù)碼相機原理中的一些算法的講解,我們和學生一起探討應該怎么選擇數(shù)碼相機。再有,濾波器算法、在課堂上對Photoshop功能的演示,與所學算法關聯(lián)起來,學生都很容易理解接受。
3教學點滴
3.1點睛之筆
在第一節(jié)課的講述中,我們的重點不在于Marr理論,而是告訴學生:
人工智能就是要讓計算機像人一樣,能夠會聽、會看……
我們這門課程就是要讓計算機“會看”,要像人一樣會看。進而展示給學生一些我們精心挑選的圖片,讓學生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計算機看到的到底有什么不一樣。
每次講到這里,學生都會進行熱烈的討論,每個人都有不同的看法,每個人都有自己的堅持,不知不覺中,對這門課就產(chǎn)生了濃厚的興趣,有了繼續(xù)深入學習下去的愿望。在課堂討論的最后,比較人眼對圖片的判斷以及計算機的判斷后,讓學生自己總結歸納,我們這門課到底要研究些什么,都有可能應用在哪些方面,然后對爭議比較大的提議一一探討。每到這個時候,大家的積極性就都被激發(fā)出來,在不斷的爭論與思想碰撞中找出正確的結論。
3.2拿身邊的事物說“事”
計算機視覺課程的前半部分,多涉及到圖像處理的一些常見算法。在講授各種各樣的濾波器和算子時,并沒有針對各個濾波器和算子擺出一堆示例圖片,讓學生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現(xiàn)在人手一臺的數(shù)碼相機為例提出問題,你為什么要選擇你手里的這臺數(shù)碼相機?當初選這個品牌和型號時,你的考慮是什么?歷年學生的回答幾乎都是看網(wǎng)上測評,或者在網(wǎng)上看別人怎么說。這時列出我們收集到的各個品牌相機的測評報告,列出它們的優(yōu)缺點,然后引導學生去思考,例如這個品牌的相機的缺點是照片發(fā)灰,不是很鮮亮,而另一個品牌的相機則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?
通過如此簡單的對比,學生的積極性被完全激發(fā)。原來,數(shù)碼相機這個幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學到的知識這么密切相關。
再有,就是利用學生們都熟悉的PS(Photoshop),演示現(xiàn)在所謂的“完美證件照”是怎么來的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點了一下鼠標,其實在后臺,是加入了一個濾波器進行了濾波。各種這樣的演示,學生都非常喜聞樂見。因為他們突然發(fā)現(xiàn),原來那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯(lián)系。
還有一個很受學生歡迎的例子就是對于“鼓形失真”的講解。我們的老師每次講到這里,都不會簡單告訴學生“鼓形失真”發(fā)生的原因是什么,應該怎么解決?老師都會問學生,明星為什么都一窩蜂去減肥?現(xiàn)在的女明星為什么都要去弄個“錐子臉”?課堂上就會出現(xiàn)一個小,男同學和女同學的看法各異,彼此之間開始爭論不休。此時再趁熱打鐵地問學生,如果拿著相機,離自己的鼻子一公分,會拍出什么樣的效果?有學生開始拿出手機對著自己和別人開拍,有的學生開始頭頭是道地分析。每到這種學生都開始熱烈討論的時候,就可以適時引導學生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個時候,學生都會頗有成就感,對于問題的理解也會特別的深刻。
3.3選擇合適的實際應用
在所有理論講解結束后,我們會留出2~4次課講述計算機視覺在工業(yè)上的應用。這些年來,對于手機制造這樣一個工業(yè)應用,非常受學生歡迎。正如“數(shù)碼相機”這個例子一樣,現(xiàn)在學生都是人手一部手機,是大家再熟悉不過的東西。這個例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學生通過對這個工業(yè)應用的理解,更進一步加深了對算法的理解。
以講解手機鍵盤的制造過程為例,向學生提出和前面所講內(nèi)容相關的問題,引導學生自發(fā)思考,如為什么選擇模板匹配法,而不是采用其他更復雜更精確的方法等等。每到這個時候,課堂氣氛總是分外熱烈,學生各抒己見,在不斷爭論中,更進一步加深對課本上枯燥理論的認識。
在這里需要注意的問題是一定要一步一步提出問題,循循善誘,引導學生一層一層地深入思考。如果問題的答案過于“深藏不露”,則有可能觸發(fā)學生的抵觸情緒,無法繼續(xù)深入地思考。
4結語
通過多年的教學摸索,我們認為,在計算機視覺課程的講述中,以實際應用引導學生這樣的教學方法非常可取,而且也收到了很好的效果。另外,除了制定好的教學大綱,并選擇合適的教材外,根據(jù)學校現(xiàn)在的時間情況,我們選擇了多媒體手段輔助教學,充分利用Matlab和大屏幕投影等方方面面的優(yōu)勢,結合多種方法進行教學,對講好計算機視覺這門課,非常有益。
參考文獻:
[1] 林堯瑞,馬少萍. 人工智能導論[M]. 北京:清華大學出版社,1989.
[2] 賈云得. 機器視覺[M]. 北京:科學出版社,2000.
[3] Ramesh Jain. Machine Vision[M]. 北京:機械工業(yè)出版社,2003.
[4] 蔡自興. 智能控制原理與應用[M]. 北京:清華大學出版社,2007.
Innovation in the Course of Computer Vision
HAN Hong, JIAO Li-cheng
(School of Electronic Engineering, Xidian University, Xi’an 710071, China)
關鍵詞:農(nóng)業(yè)機械;新技術;發(fā)展
1.農(nóng)業(yè)機械新技術的應用和發(fā)展的重要性
我國是一個農(nóng)業(yè)大國,農(nóng)業(yè)是我國國民經(jīng)濟的基礎,農(nóng)業(yè)機械新技術的應用和發(fā)展具有重要的意義。
第一,提高機械的運作效率。目前在農(nóng)業(yè)機械的使用方面,有的機械在使用過程中不能清晰地識別農(nóng)作物的位置,比如,在收割小麥的過程中,有的小麥受到大風影響產(chǎn)生倒伏,對這些倒伏區(qū)域,機械在收割過程中很容易漏掉。所以在農(nóng)業(yè)機械中使用新技術有利于彌補農(nóng)業(yè)機械的漏洞,提高機械的運作效率。
第二,解放勞動力,促進經(jīng)濟發(fā)展。農(nóng)業(yè)是一個需要大量年輕勞動力的行業(yè),農(nóng)業(yè)機械新技術的應用有利于實現(xiàn)農(nóng)業(yè)種植、收割的自動化,解放勞動力。這些年輕的勞動力投入到其他的領域,有利于促進我國經(jīng)濟的發(fā)展。
2.農(nóng)業(yè)機械新技術的應用
21世紀是個科技迅速翻新的時代,目前農(nóng)業(yè)機械領域的新技術也層出不窮,下面介紹幾種最新出現(xiàn)的農(nóng)業(yè)機械新技術。
(1)計算機視覺技術。計算機視覺技術出現(xiàn)于20世紀70年代末,主要利用計算機視覺技術進行農(nóng)產(chǎn)品品質和農(nóng)產(chǎn)品等級的檢查。計算機視覺是一種以圖像處理為基礎而興起的學科,主要對視覺信息處理的計算理論、表達與計算方法進行研究。[1]隨著計算機視覺技術應用領域的不斷擴展,目前在農(nóng)業(yè)機械生產(chǎn)方面,計算機視覺技術不僅能夠用于檢查農(nóng)產(chǎn)品品質和分級,還可以用于播種和收割。但是由于計算機視覺技術在農(nóng)業(yè)機械方面的使用時間比較短,一些技術難題還沒有得到解決,所以計算機視覺技術在農(nóng)業(yè)機械方面的應用還需要繼續(xù)研究。
(2)人工智能技術。隨著智能化的發(fā)展,智能技術在農(nóng)業(yè)機械方面的應用也得以實現(xiàn)。美國運用人工智能技術發(fā)明了激光拖拉機,不僅可以控制拖拉機的行進方向,還能夠對拖拉機進行具體的定位。[2]通過人工智能技術,人們建立了一個龐大的數(shù)據(jù)庫,通過這個數(shù)據(jù)庫可以對土地的具體情況進行掌握,以設計出具體的農(nóng)業(yè)生產(chǎn)所需的化肥、種子、農(nóng)藥、水等原料的用量。
(3)機器人技術。比智能化更進步的就是機器人技術,機器人技術在農(nóng)業(yè)機械中的應用,這是計算機信息網(wǎng)絡和計算機視覺技術以及自動化控制等技術的結合的產(chǎn)物。目前研發(fā)出了除草機器人、播種機器人、澆水機器人、施肥機器人等,利用機器人進行農(nóng)業(yè)生產(chǎn)活動,可以節(jié)省人工費用,解放勞動力,避免有些農(nóng)業(yè)生產(chǎn)活動,對人體產(chǎn)生危害。
(4)自動控制技術。在農(nóng)業(yè)機械中運用自動控制技術,可以幫助操作者降低操作難度,同時可以根據(jù)地勢的高低和秸稈的長短來調節(jié)高度,保證機械使用過程中的安全性,提高農(nóng)業(yè)機械使用的可靠性,提高農(nóng)業(yè)生產(chǎn)效率。
3.農(nóng)業(yè)機械新技術的發(fā)展
農(nóng)業(yè)機械新技術的應用和發(fā)展都是為了提高農(nóng)業(yè)的生產(chǎn)率服務的,所以農(nóng)業(yè)機械新技術的發(fā)展主要表現(xiàn)為以下幾點:
第一,加速新技術的使用和推廣??茖W技術是第一生產(chǎn)力,加速計算機視覺技術、自動控制技術、智能化技術等新技術在農(nóng)業(yè)機械中的使用,同時引進國外先進的機械新技術,對推動我國農(nóng)業(yè)的發(fā)展,提高農(nóng)業(yè)的生產(chǎn)效率具有重大的意義。
第二,政府補貼。新型機械的購買都是生產(chǎn)個體自行組織的,資金壓力大,使得機械新技術難以推廣,所以對于農(nóng)業(yè)機械新技術的推廣使用,政府要在物質上予以補貼,拓展新機械的使用范圍。
第三,提高農(nóng)業(yè)資源利用效率。機械使用的目的就是為了提高農(nóng)業(yè)的生產(chǎn)效率,提高農(nóng)業(yè)資源的利用率。例如,在傳統(tǒng)的農(nóng)業(yè)生產(chǎn)過程中,對農(nóng)作物秸稈的處理方式,絕大多數(shù)情況就是焚燒,不僅浪費資源,而且污染空氣。但是農(nóng)業(yè)機械新技術的使用通過將農(nóng)作物的秸稈進行粉碎處理,將農(nóng)作物秸稈轉化為肥料,不僅提高了農(nóng)作物資源的使用效率,也減小了空氣的污染程度。
4.結語
隨著科技的發(fā)展,計算機視覺技術、自動控制技術、智能化技術等新技術在農(nóng)業(yè)機械方面的應用越來越廣,農(nóng)業(yè)機械新技術的應用和推廣將大大提高我國農(nóng)業(yè)的生產(chǎn)效率,提高農(nóng)業(yè)資源的利用率,促進國民經(jīng)濟的發(fā)展。
參考文獻:
[1]田 靜.探討農(nóng)業(yè)機械新技術的應用與發(fā)展[J].中國農(nóng)資,2013(36): 74.
關鍵詞:計算機視覺系統(tǒng) 工業(yè)機器人 探究
中圖分類號:TP242 文獻標識碼:A 文章編號:1007-9416(2015)05-0000-00
計算機視覺系統(tǒng)主要是為了工業(yè)機器人更好的工作而研發(fā)出來的,是一套裝有攝像機視場的自動跟蹤與定位的計算機視覺系統(tǒng)。近年來,機器人已經(jīng)廣泛使用于工業(yè)生產(chǎn),但是多數(shù)機器人都是通過“示教-再現(xiàn)”的模式工作,在工業(yè)機器人工作是都是由操作員進行操作示范再由機器人跟著示范進行工作。由于機器人缺乏對外界事物的識別能力,工作中經(jīng)常發(fā)生偏差或者位移等情況。由于工作環(huán)境的惡劣以及各種阻礙,為了提高工業(yè)機器人的工作效率、靈活性、適應性等,讓機器人更好的識別外部環(huán)境并及時調整運作方向,能更好的發(fā)揮其作用,在原有的機器人系統(tǒng)中添加了一套計算機視覺系統(tǒng),利用計算機視覺圖像裝置的信息,通過圖像使機器人進行外部環(huán)境的識別處理,采用三維的重建,通過作業(yè)中利用三維圖像的信息進行計算,采用Motocom32軟件和機器人控制柜通訊等設備,對工業(yè)機器人進行控制,更好的實現(xiàn)機器人對空間特點的跟蹤與定位。
1系統(tǒng)的結構與原理
本文主要針對Motoman UP6工業(yè)機器人系統(tǒng)的二次研究,在原有的工業(yè)機器人的系統(tǒng)中,增加了一套計算機視覺系統(tǒng), 使工業(yè)機器人更好的識別外界環(huán)境的系統(tǒng)。計算機視覺系統(tǒng)主要包括:Panasonic CCD攝像機、Motoman UP6工業(yè)機器人系統(tǒng)、工控機、OK C-50圖像采集卡等外部設備。工業(yè)機器人的整個系統(tǒng)由原有系統(tǒng)與計算機視覺系統(tǒng)組成,在原有的系統(tǒng)中包含了YASNAC-XRC- UP6機器人控制柜、Motoman UP6工業(yè)機器人本體、示教編程器、Motocom32系統(tǒng)以及相關的外部設備等[1]。計算機視覺系統(tǒng)的設備主要有Panasonic CCTV攝像機、AVENIR TV鏡頭、OK系列C-50圖像采集卡、工控機、AVENIR TV鏡頭、Panasonic CCD攝像機、OK系列C-50圖像采集卡形成的視頻采集系統(tǒng)主要是捕獲物體的圖像,該功能主要是分三個層次進行圖像處理、計算、變換以及通信等功能來實施工控機。利用遠程控制來對工業(yè)機器人進行Motocom32系統(tǒng)進行通信。
2計算機視覺系統(tǒng)的構建
2.1硬件的組成
CCD攝像頭:選用的CCD攝像機采用PAP-VIVC810AOZ型彩色攝像頭,如圖1。攝像機的像素為P:500(H)x582(V),N:510(H)x 492(V),攝像機的分辨率為420。攝像機的成像器使用1/33"CCD,信噪>48 dB,同時攝像機具有自動背景光補償、自動增益控制等功能。
圖像采集卡:圖像采集卡主要采用CCD攝像頭配套的MV-200工業(yè)圖像處理。如圖2所示。MV-200圖像采集卡的分辨率、圖像清晰度具有較高的穩(wěn)定性,其真彩色實施工業(yè)圖像采集卡,該圖像采集卡的硬件構造、地層函數(shù)都具有穩(wěn)定性,同時在惡例的環(huán)境中都可以穩(wěn)定運行[2]。圖像采集卡的圖像采集效果非常好,畫面效果非常流暢。
MV-200圖像采集卡性能特點:其分辨率為768 x 576,具有獨特的視頻過濾技術,使圖像質量的采集、顯示更加清晰流暢。主要支持的系統(tǒng)為Win98 /2K/XP,主要用于人工智能、事物識別、監(jiān)控等多種領域。
工控機:工控機以奔4系列為主。
2.2軟件組成
圖像匹配軟件。
圖像處理與獲取軟件。
定標和定位算法軟件,功能分布如圖3所示。
3視覺系統(tǒng)的原理及流程圖
工業(yè)機器人的主要系統(tǒng)包括是由工業(yè)機器人本體、相關的外部設備、控制器(供電系統(tǒng)、執(zhí)行器等)計算機視覺系統(tǒng)主要由三部分組成:圖像處理和獲取、圖像匹配、攝像機的定位等組成。通過借助OpenCV的視覺庫進行VC++.NET實行,流程如下圖表4所示。
在本視覺系統(tǒng)運行中,需要對攝像機實行定標,建立實際空間點和攝像機的對應點。在定標的過程中,就需要標記基準點,使攝像機在采集圖像時可以準確的把這些基準點投放到攝像機的坐標上[3]。同時在采集卡的圖像中,對圖像進行處理并計算出該基準點圖像的坐標,通過定標計算法,從而得出攝像機的參數(shù)。
在機器人系統(tǒng)中的反饋,計算機通過C語言的調節(jié)圖像采集卡進行動態(tài)鏈接來控制函數(shù)[4]。同時,對攝像機中的數(shù)據(jù)、視頻信號進行采集,構成數(shù)字化的圖像資料,采用BMP格式存儲進行計算,在計算機上顯示活動視頻,然后系統(tǒng)對獲取的圖像進行分析處理,以及對噪聲的去除、圖像的平滑等進行處理,利用二值化處理對那些灰度閥值的圖像進行處理,同時檢測計算機獲取圖像的特征量并計算[5]。在完成圖像的處理后,就需要確立圖像的匹配特征,對圖像進行匹配[6]。如果兩個圖像不重疊,就需要建立3D數(shù)據(jù)庫進行模型重新選擇,再把模型進行計算、投影計算、坐標更換等指令,直到找到與圖像相匹配的數(shù)據(jù)模型,才能真正得到真實有效的圖像。重疊時,要獲得有效的圖像,以工業(yè)機器人識別物體為目的,才能建立機器人系統(tǒng)之間的通信。同時,通過三維圖像重建,進行機器人空間定位[7]。如下圖表5所示。
4結語
綜上所述,計算機視覺系統(tǒng)主要是為了工業(yè)機器人更好的工作而研發(fā)出來的,是一套裝有攝像機視場的自動跟蹤與定位的計算機視覺系統(tǒng)。通過3D數(shù)據(jù)模型指定目標,機器人系統(tǒng)利用計算機視覺圖像的采集裝置來識別外界環(huán)境的數(shù)據(jù),經(jīng)過圖像的姿態(tài)預算、影像的投影計算產(chǎn)生圖像,通過圖片的合成比較,以此來實現(xiàn)機器人在工作中對物體的識別。利用計算機系統(tǒng)對機器人進行有效的控制,在工業(yè)機器人工作中對事物目標的搬運、跟蹤、夾持等指令。計算機視覺系統(tǒng)具備清晰的視覺功能,有利于提高工業(yè)機器人的靈活性以及適應性。
參考文獻
[1]夏群峰,彭勇剛.基于視覺的機器人抓取系統(tǒng)應用研究綜述[J].機電工程,2014(06):221-223.
[2]華永明,楊春玉.機器人視覺系統(tǒng)在立體編織自動鋪紗過程中的應用研究[J].玻璃纖維,2011(01):189-191.
[3]王培屹.基于多傳感器多目標實時跟蹤視覺系統(tǒng)在全自主機器人上的應用[J].軟件導刊,2011(01):263-264.
[4]譚民,王碩.機器人技術研究進展[J].自動化學報,2013(07):123-125.
[5]鮑官軍,荀一,戚利勇,楊慶華,高峰.機器視覺在黃瓜采摘機器人中的應用研究[J].浙江工業(yè)大學學報,201(01):93-95.