前言:本站為你精心整理了名茶鑒別技術(shù)淺探范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
光譜預(yù)處理
由于光源強(qiáng)度的不均勻分布,使得光強(qiáng)弱的波段存在暗電流,采集得到的圖像信息包含很多的噪音,因此對高光譜圖像進(jìn)行矯正[4]。相同采集條件下,獲取白色標(biāo)準(zhǔn)圖像W和黑色校準(zhǔn)圖像B,最終得到相對圖像R,完成高光譜圖像矯正。圖2顯示了在408~1117nm范圍內(nèi)的不同像素的茶樣圖像的光譜曲線。在光譜維中,剔除700nm以下曲線值比較低和900nm以上噪聲較強(qiáng)的光譜曲線后,選取該范圍內(nèi)的圖像數(shù)據(jù);在二維圖像維中,將圖像數(shù)據(jù)通過ENVI重新采樣,最終對由287張波長在700~900nm范圍內(nèi)且像素大小為650*811的碧螺春茶樣高光譜圖像三維數(shù)據(jù)塊進(jìn)行分析。
特征提取
高光譜三維圖像數(shù)據(jù)雖然可完全涵蓋研究對象的信息,但是每個樣本過大的數(shù)據(jù)量降低了后期數(shù)據(jù)處理的速度。相關(guān)性較大的相近波段圖像造成了數(shù)據(jù)塊中存在大量的冗余信息,所以需要在不丟失有效數(shù)據(jù)信息的前提下,選擇合適的算法降低數(shù)據(jù)塊的維數(shù)來消去冗余信息,以減少后期處理時間和增強(qiáng)識別結(jié)果的準(zhǔn)確性。主成分分析是將原始眾多具有一定相關(guān)性的變量信息按協(xié)方差最大的方向投影,得到幾個彼此相互獨(dú)立而且互不相關(guān)的綜合變量,并同時完成原始變量數(shù)據(jù)維數(shù)的降低和原始數(shù)據(jù)中冗余信息的消除。實(shí)驗(yàn)采用PCA來篩選特征波長圖像。結(jié)合本PCA原理可知,原始茶樣圖像由各PCA圖像結(jié)合對應(yīng)方差的大小經(jīng)過線性組合而成;方差貢獻(xiàn)率數(shù)值的大小即決定了PCA圖像各自所體現(xiàn)原始圖像信息的比重;比較權(quán)重系數(shù)即可尋找到最能表征每個原始碧螺春茶樣信息的最佳PCA圖像[5]。經(jīng)過PCA后得到的前4個主成分圖像PC1,PC2,PC3和PC4,如圖3所示。通過對比可以看出,PC1在波長范圍內(nèi)最能反映原始茶樣,它是由287個特定波長處圖像和對應(yīng)權(quán)重系數(shù)的線性組合,順序選取前2個最大權(quán)重系數(shù)依次對應(yīng)763.36nm和791.17nm處的特征圖像。按照此流程,通過PCA分別優(yōu)選出所有茶樣這兩個波長下的圖像作為對應(yīng)的特征圖像。灰度共生矩陣一直是重要的紋理統(tǒng)計分析方法之一。GLCM建立在對二維灰度圖像中各像素信息之間的二階組合條件概率密度函數(shù)的形象描述,它可以表述為在以灰度級i為始點(diǎn),θ方向相隔一定的像元距離d時,出現(xiàn)特定灰度級j的概率,即為GLCM矩陣的像元,記為p(i,j,d,θ)。GLCM構(gòu)造的結(jié)構(gòu)統(tǒng)計和紋理特征從不同的角度反映研究對象圖像的灰度分布,信息的數(shù)量以及質(zhì)地粗糙等特性[6]。本實(shí)驗(yàn)針對每個茶樣優(yōu)選出2個特征波長下的圖像,為了消去培養(yǎng)皿邊緣光線反光以及背景圖像的影響,以特征圖像的中心位置點(diǎn)為中心,選擇為400*400、包含茶葉信息的正方形圖像區(qū)域,以GLCM構(gòu)造的對比度(Contrast)、相關(guān)性、能量和均勻性4個統(tǒng)計量作為紋理特征值。在利用GLCM獲取紋理特征時,不同構(gòu)造因子(如像元方向角θ和像元距離d)所得到的GLCM差別很大,進(jìn)而導(dǎo)致最終獲取的二次統(tǒng)計量也存在較大的差異:在討論像元方向角θ取值時,由于茶葉平鋪于培養(yǎng)皿掃描的隨機(jī)和不均勻性,本實(shí)驗(yàn)采用固定像元方向角為0°的方法來消除其影響。不同的像元距離d決定了茶樣圖像GLCM中的兩個采樣像素點(diǎn)間的距離。紋理像元較大的粗紋理中,d與紋理像元的幅度相比較小,此時GLCM中的高灰度值的像元就集中在矩陣對角線周圍;而對細(xì)紋理而言,如果d與紋理像元的幅度大小差不多,此時GLCM中高灰度值的元素分布較均勻。由此需要針對不同的研究對象選擇合適的d,使得到GLCM構(gòu)成的紋理統(tǒng)計量能最好地描述所研究的對象[7]。利用MATLAB編制了提取GL-CM特征參數(shù)的程序,從所有數(shù)據(jù)中任選5張圖像分析其GLCM紋理特征參數(shù)并進(jìn)行比較,最終選取像元方向角θ=0°、所有參數(shù)數(shù)值最大時的d=4作為構(gòu)造GLCM的最佳像元距離。
模型建立與鑒別結(jié)果
SVM是按照間隔大小將低維空間非線性可分映射到高維空間,劃分成若干高維可分子集,建立結(jié)構(gòu)風(fēng)險最優(yōu)化模型[8]。SVM可以通過出色的學(xué)習(xí)能力自動尋找到對分類有較強(qiáng)劃分能力的支持向量,構(gòu)造的分類器可將各類之間間隔距離達(dá)到最大限,其分類準(zhǔn)確率可以達(dá)到很高[9]。因此,本文采用SVM作為模式識別模型,來對真?zhèn)伪搪荽翰铇覩LCM構(gòu)造的紋理統(tǒng)計信息進(jìn)行預(yù)測和判別。SVM核函數(shù)的引入,使其在算法復(fù)雜度不增加的情況下又具有了很高的學(xué)習(xí)機(jī)器非線性處理能力。研究最多的核函數(shù)有多項(xiàng)式核、徑向基核以及Sigmoid核函數(shù),但是徑向基核函數(shù)較Sigmoid的局部性強(qiáng),較多項(xiàng)式核的參數(shù)少、計算時間短[10]??紤]需要對真?zhèn)尾枞~樣本的快速鑒別,因此選取了徑向基核函數(shù)。核函數(shù)參量懲罰系數(shù)C和寬度δ對模型也會產(chǎn)生一定的影響,本實(shí)驗(yàn)采用交叉驗(yàn)證法對核函數(shù)的參量進(jìn)行優(yōu)化,結(jié)果模型識別效果最佳的徑向基核函數(shù)懲罰系數(shù)C=39.78,寬度參量δ=2.82。在每個茶樣的特征波長下,對應(yīng)圖像構(gòu)成的8個GLCM紋理特征變量組成的訓(xùn)練集和預(yù)測集數(shù)據(jù)變量之間仍然存在一定的相關(guān)性,所以在模型建立之前,繼續(xù)采用PCA對數(shù)據(jù)進(jìn)行獨(dú)立的主成分分量提取,構(gòu)成基于RBF核函數(shù)的SVM模式識別的變量輸入;選擇合適的主成分?jǐn)?shù)對鑒別模型的建立也很重要。不同主成分?jǐn)?shù)對模型結(jié)構(gòu)的影響如圖4所示。由圖4可以看出:在主成分?jǐn)?shù)等于6之前,預(yù)測模型的判別率隨主成分?jǐn)?shù)的增加而升高;但當(dāng)主成分?jǐn)?shù)增加到6以后,再隨著主成分?jǐn)?shù)的增加,預(yù)測時判別率卻有下降的趨勢。圖4訓(xùn)練和預(yù)測模型的判別率與主成分?jǐn)?shù)關(guān)系比較后,最終選取訓(xùn)練預(yù)測集都最高的像元方向角θ為0°,像元距離d為4的前6個主成分特征變量作為SVM模型的輸入變量。表1為真?zhèn)尾铇颖镜挠?xùn)練和預(yù)測的結(jié)果。從表1可以看出,真?zhèn)纹凡栌?xùn)練集的誤判數(shù)為0,總體判別率為100%。預(yù)測集中,將一個真品碧螺春茶樣誤判為偽品茶,2個偽品茶樣誤判為真品茶樣,模型總體鑒別率為96.25%。結(jié)果表明,真?zhèn)纹凡铇予b別模型的識別率和穩(wěn)定性都達(dá)到一個很高的水平。實(shí)驗(yàn)中,偽品樣本誤判數(shù)高于真品是由不同采購產(chǎn)地偽品茶樣本模仿真品碧螺春茶制作工藝的技術(shù)優(yōu)劣差別造成的,一些經(jīng)過優(yōu)良加工的偽品茶樣本和真品碧螺春茶樣本之間品質(zhì)指標(biāo)比較接近,這就會使模型的識別結(jié)果產(chǎn)生一定的誤差。
本文作者:蔡健榮韓智義作者單位:江蘇大學(xué)