題目:
基于高光譜成像的陽山桃子產地鑒定
應用關鍵詞:
高光譜成像;桃子地理起源,;組稀疏表示分類器,;生理代謝
背景:
陽山地區(qū)的桃子是中國地理標志保護產品,以其質地鮮嫩,,風味誘人,營養(yǎng)豐富而聞名,,特別是“白鳳”和“湖景”品種,。桃子的摻假行為,會給消費者,、生產商以及公眾對于品牌的真實性失去信心,。然而,目前還沒有有效的方法來鑒定陽山地區(qū)的桃子,。
光譜成像,、高分辨率質譜、核磁共振,、近紅外光譜和Raman光譜是識別茶葉,、蜂蜜、水稻,、可可豆地理來源的重要工具,。高光譜成像結合成像和光譜信息檢測目標物外部或內部屬性,是一種可靠的地理來源預測方法,。將高光譜成像和機器學習相結合,,可以對化學成分進行分類。因此,,高光譜成像技術可用于評估由特殊生長條件(如溫度,、日照時間,、降雨和土壤質量)引起的桃子化學成分差異。盡管高光譜成像技術在其他農產品地理來源分類方面取得了一定進展,,但其在桃子上的應用仍面臨許多挑戰(zhàn),。
本研究的目的是探討高光譜成像在桃子地理來源分類和生理代謝分析方面的潛力,以確定鑒定陽山地區(qū)桃子地理來源所需的關鍵因素,。本研究測定了不同產地桃子可溶性糖和有機酸代謝的差異,;利用陽山桃高光譜反射率建立地理產地鑒別分類模型;對不同地理來源桃的不同生理代謝相互轉化導致的高光譜反射率差異進行了解釋,;驗證了組稀疏編碼分類器對陽山桃產地認證的有效性,。
試驗設計
南京農業(yè)大學汪小旵教授團隊利用GaiaSorter可見-近紅外高光譜成像系統(tǒng)(江蘇雙利合譜公司)獲取“白鳳”和“湖景”兩種桃子(產自陽山和南京)的高光譜影像。其波長范圍為380 - 1038 nm,,波段數(shù)為520,。為了從基礎上了解不同產地同一品種桃的生理變化,采集圖像后對碳水化合物,、有機酸和礦物質含量進行了分析,。具體流程如圖1所示。
組稀疏表示(Group sparse representation, GSR)已證明具有較為出色的模式識別能力,,研究中使用GSR分類器對桃子的地理來源進行分類,。將計算得到的ROI均值光譜作為樣本。對于GSR分類器來說,,一個判別性的組結構字典是不可少的,,通過如下步驟構建:對于每個類,隨機選擇一定的樣本進行訓練,,并逐列排列形成子字典,。其次,將不同產區(qū)同一品種對應的子詞典級聯(lián),,構建具有鑒別性的組結構字典,。當給定未知來源的測試樣本時,我們將其分解為鑒別組結構字典與繼承字典可鑒別性的GSR系數(shù)向量的乘積,。系數(shù)由幾個相鄰的子集組成,,每個子集中的系數(shù)都為零或非零。最后,,通過評估哪一類重構誤差最小來實現(xiàn)地理來源認證,。具體流程圖如圖2所示。
研究中使用GSR的主要原因如下:(1)GSR分類器在解決模式識別問題時優(yōu)于許多優(yōu)秀的分類器,,而桃子產地的認證主要是一個模式識別問題,。(2)組稀疏約束降低了稀疏表示系數(shù)的自由度,提高了稀疏編碼的速度,,有利于實際生產中的實時處理,。(3)由于字典具有連續(xù)結構,,因此可以使用較少實測樣本來恢復GSR向量α,從而推斷較少波段的光譜足以獲得良好的性能,。
圖1 地理來源分類分析流程
圖2 基于組稀疏編碼的地理產地認證方法
結論
從表1可以看出,,來自陽山區(qū)域的桃總糖含量最高,來自南京地區(qū)的“白鳳”桃的總糖含量低,。不同產區(qū)同一品種桃的果糖,、葡萄糖、蔗糖和總糖含量存在差異,。同一產地不同品種桃的蔗糖和總糖含量相近,。較高的晝夜溫差有利于糖的積累,3 - 6月桃子生長期間,,陽山區(qū)的晝夜溫差高于南京,。蘋果酸、莽草酸和奎寧酸的含量在不同產地間存在差異,,而檸檬酸的含量在不同產地間無顯著差異,。糖酸比是指水果樣品中總糖與總有機酸含量的比值,它在很大程度上決定了水果的口感和風味,,糖酸比高的桃子比糖酸比低的桃子更甜,。顯然,陽山地區(qū)桃子的糖酸比要高于南京地區(qū),?;ㄇ嗨嘏c果肉顏色有關。陽山地區(qū)桃的花青素含量低于南京樹,,這也解釋了為什么“白鳳”的果肉比“湖景”的果肉更白。
通過對糖,、酸,、酚類物質的分析,發(fā)現(xiàn)不同產地桃子的化學成分差異很大,,因此可用近紅外高光譜技術捕獲足夠的差異信息來建立判別模型,。
表1 兩種桃子碳水化合物、有機酸和花青素的比較
圖3四個類別桃子的可見-近紅外平均光譜,。在400 - 1000 nm光譜范圍內觀察到果實的普遍反射規(guī)律,,450 - 550 nm附近的部分吸收來源于花青素。在1900 - 2500 nm范圍內,,反射率在0.1以下,,說明該范圍內的圖像信號噪聲較低,光譜反射信息不準確,。來自南京和陽山的“白鳳”在400 - 600 nm的反射率與來自南京和陽山的“湖景”有顯著差異,。這種差異在1000 - 1900 nm范圍剛好相反,。一種可能的解釋是400 - 600 nm的波長是可見光,這主要與桃子色素含量有關,,包括葉綠素和花青素,。A類花青素含量是C類花青素含量的4倍,高于B類與D類花青素含量之比,。近紅外光譜往往相對準確地對應于化合物變化,。在該范圍內,B類的光譜反射率最高,,D類的光譜反射率低,,反射率由強到弱的排列順序與糖酸比相同。可溶性糖含量也顯示了類似的結果,。這表明與色素和化學成分相關的波長對地理來源識別的重要性,。
圖3 四個類別桃子的平均光譜。(A:“白鳳”來自陽山,,B:“湖景”來自陽山,,C:“白鳳”來自南京,D:“湖景”來自南京),。
使用留一交叉驗證計算六種算法的平均分類精度(表2),。在所有分類器中,GSR分類器在所有情況下的總體分類精度最高,。在所有波長范圍內,,“湖景”的分類精度都高于“白鳳”。“湖景”在1000 - 1900 nm波段的分類精度大多優(yōu)于400 - 1000 nm波段的分類精度,,這可能是由于1000 - 1900 nm波段的光譜反射信息中含有與可溶性糖含量相關的判別因素,。
圖4(A)可以看出,A類的少數(shù)訓練樣本具有較大的系數(shù),,而C類的訓練樣本具有很少的非零系數(shù),。從圖4(B)可以看出,A類重構殘差最?。?/font>1.12),,而C類重構殘差很大(134.98)。根據(jù)GSR分類器的決策規(guī)則,,判斷測試樣本為A類,,與地面真實值一致。
表2 六種分類方法的分類精度
圖4 A類測試樣本的組稀疏表示分類器系數(shù)(A)以及相對于A類和C類的重構殘差(B)
GSR分類器的成功依賴于每個類有足夠的訓練樣本,,這些樣本跨越了一個子空間,,使得這個類的任何樣本都位于這個子空間上。如果假設不成立,,GSR分類器很可能會失敗,。因此,,有必要評估訓練樣本數(shù)量對分類結果的影響。如圖5所示,,更大的注冊規(guī)模導致更高的分類精度,;注冊規(guī)模大于或等于10足以確保GSR分類器達到95%以上的準確率。當注冊規(guī)模為5時,,分類準確率僅為82%,,這意味著假設不成立。
綜上所述,,本研究發(fā)現(xiàn)陽山地區(qū)的桃子總糖含量和糖酸比較高,,可能與晝夜溫差較大有關。400 - 1000 nm是判別陽山地區(qū)果實的有效波段,,與花青素和其他色素含量有關,,而近紅外波段(1000 - 1900 nm)蔗糖和酸類是判別不同桃品種的重要波段。本研究將提出的GSR分類器與其他五種分類器進行了比較,,結果表明,,GSR分類器實現(xiàn)了99.3%的總體分類精度。將高光譜成像技術與生理代謝分析相結合,,有助于陽山地區(qū)桃子的產地鑒定,。
圖5 GSR分類器的分類精度與每個類別樣本數(shù)量之間的關系
作者信息
汪小旵,博士,,南京農業(yè)大學工學院教授,,博士生導師。
主要研究方向:作物信息智能化檢測,、農業(yè)裝備智能化控制,。
參考文獻:
Sun, Y., Li, Y.H., Pan, L.Q., Abbas, A., Jiang, Y.P., & Wang, X.C. (2021). Authentication of the geographic origin of Yangshan region peaches based on hyperspectral imaging. Postharvest Biology and Technology, 171, 111320.
https://doi.org/10.1016/j.postharvbio.2020.111320
立即詢價
您提交后,,專屬客服將第一時間為您服務