国产精品久久久麻豆_午夜久久久_久操视频免费_日本在线视频一区_国产精品成人在线观看_午夜精品视频

文章詳情

高光譜成像與NMR技術融合深度學習:開啟枸杞產地溯源新篇章(上)

日期:2025-06-03 17:53
瀏覽次數:268
摘要:高光譜成像技術憑借其強大的空間和光譜信息獲取能力,已成為植物產品地理來源識別與質量控制的前沿工具。根據研究,高光譜技術結合深度學習模型,可以實現枸杞的地理來源精準分類,準確率高達95.63%。通過特征波長提取,不僅顯著提高了分析效率,還增強了數據的科學解釋性。此外,高光譜與化學分析(如NMR)的結合,能夠進一步揭示樣品化學成分與光譜特征的關聯,為復雜樣品的快速、非破壞性檢測提供**解決方案。

高光譜成像技術憑借其強大的空間和光譜信息獲取能力,已成為植物產品地理來源識別與質量控制的前沿工具。根據研究,高光譜技術結合深度學習模型,可以實現枸杞的地理來源精準分類,準確率高達95.63%。通過特征波長提取,不僅顯著提高了分析效率,還增強了數據的科學解釋性。此外,高光譜與化學分析(如NMR)的結合,能夠進一步揭示樣品化學成分與光譜特征的關聯,為復雜樣品的快速、非破壞性檢測提供**解決方案。

背景

枸杞以其**的營養價值和顯著的藥用功效享譽全球,尤其是在抗氧化、**調節和抗腫瘤等方面表現突出。這些特性與其地理來源密切相關,地理來源不僅決定了其化學成分和藥用效果,還顯著影響市場價值。因此,快速、準確地識別枸杞的地理來源對于質量控制和市場調節至關重要。傳統的地理來源識別方法主要依賴于物理化學特性或感官評價,但這些方法通常依賴專家經驗,缺乏客觀性和**。近年來,現代分析技術(如近紅外光譜、超高光譜成像(HSI)、核磁共振(NMR)和液相色譜-飛行時間質譜)在地理來源鑒定中顯示出強大優勢。其中,HSI提供了豐富的光譜和空間信息,NMR在成分識別與定量分析中表現突出。然而,這些方法單獨使用時存在一定局限性,如數據復雜性高、維度大,導致傳統機器學習模型難以有效處理。
為克服上述挑戰,深度學習技術被引入到分析過程。這些方法能夠從高維數據中自動提取特征,能夠有效利用光譜與空間特征,從而顯著提升地理來源的分類精度。同時,SHAP解釋模型的引入解決了深度學習的“黑箱”問題,增強了結果的可解釋性。因此,該研究通過將HSI和NMR技術與深度學習技術相結合,用于識別枸杞的地理來源。具體目標包括:(i) 通過將HSI數據與SHAP方法相結合,改進ResNet-34模型,實現枸杞地理來源的判定;(ii) 利用NMR技術識別枸杞的地理來源及其特定地理標記(GI);(iii) 建立枸杞地理標記物與HSI數據中提取的特征波長之間的關聯。

實驗設計

材料與方法

(1)樣品制備
干燥后的枸杞樣品由中國寧夏農業產品質量標準與檢測技術研究所下屬的農業產品質量監測中心提供。所有枸杞樣品均采自四個主要產區的當地農場,包括寧夏同心縣(TX)和寧夏中寧縣(ZN,品種分別為ZN1和ZN2)、青海諾木洪(NMH)以及青海德令哈(DLH)。
寧夏地區的枸杞樣品于2022年6月下旬至7月上旬采收,青海地區的樣品則于2022年9月完成采收。不同產地和品種的枸杞均采用人工手工采摘的方式,從每棵枸杞樹的東、南、西、北四個方向分別采摘,以保證采樣的**性。為確保數據分析的一致性并減少潛在偏差,每個產地的樣品經過嚴格篩選,盡量保持大小均勻。采摘完成后,枸杞在自然條件下日曬干燥數日。*終共獲得525份樣品(每個產地n=105)。樣品的兩面分別標記為A面和B面,其RGB圖像如圖1所示。隨后,所有樣品均迅速冷凍保存于-80°C環境中,以保持其生化和物理特性。

圖1. 不同地理和品種產地的代表性枸杞樣品的RGB圖像
(2)HSI和1H核磁共振(NMR)采集和數據預處理
HSI數據采集及光譜預處理:HSI數據在可見光-近紅外(VNIR)高光譜成像系統(GaiaField-V10E)上獲取。該系統由高光譜成像儀(GaiaField-V10E)、透鏡(HSIA-OL23)、光源(HSIA-LS-T-200W)、標準漫射參考板(HSIA-CT-400×400)和安裝有SpecView軟件的計算機組成。將枸杞樣品放置在離透鏡35cm的工作臺上。分別采集枸杞兩側的HSI數據,記為A面和B面。然后對枸杞的高光譜數據進行黑白校正。為了減少光譜外圍噪聲波動的影響,校正后的高光譜圖像中初始6個波長被消除。隨后,對枸杞高光譜數據進行了準確的分割處理。每個枸杞被指定為一個獨特的興趣區域,以方便深入分析。
1H NMR采集及光譜預處理:在完成所有枸杞樣品的HSI數據采集后,從每個地理產地和品種中隨機挑選30個枸杞樣品,迅速在液氮中冷凍,并使用研缽和研杵將其研磨成細粉。每個樣品中取100mg的粉末,溶解于甲醇-氯仿-水的混合溶劑中,體積比為4:4:6。混合液通過渦旋混合1分鐘以確保充分混勻,然后在冰浴中冷卻15分鐘以促進相分離。冷卻后,溶液在4°C條件下離心10分鐘。小心將上清液轉移至5 mL的Eppendorf管中,并使用樣品濃縮器蒸發30分鐘后,進行24小時的冷凍干燥,以去除殘留的甲醇和水。干燥殘渣用600μL的氘化磷酸鹽緩沖液(100mM,pH=5.7)重新溶解,該緩沖液中含有0.05%的TSP(鈉鹽3-(**基硅基)丙酸-2,2,3,3-d4)。混合液再渦旋混合5分鐘后,在10,000g×4 °C條件下離心10分鐘。*后,將550 μL的上清液轉移至5mm NMR管中,用于采集1H NMR光譜數據。
所有枸杞樣品的1H NMR光譜均使用850 MHz的Bruker AVANCE III核磁共振波譜儀(Bruker公司,德國卡爾斯魯厄)采集,配備CPTCI探頭,工作頻率為850.32 MHz。1H NMR光譜通過ZGPR脈沖序列采集,參數設定如下:溫度為298K,譜寬為14KHz,數據點數為32K,弛豫延遲為4.0秒,采集時間為1.9秒,共64次掃描。
所有枸杞樣品的1H NMR光譜數據均通過MestReNova軟件(V14.0.0,Mestrelab Research,西班牙)進行預處理。處理步驟包括傅里葉變換、相位和基線校正,以及利用TSP的單峰信號(δ0)對光譜進行對齊。在δ0-10范圍內,將光譜分割為寬度為0.002 ppm的區間,并移除殘留甲醇峰(δ3.35-3.37)和水峰(δ4.75-4.90)的干擾信號。對TSP峰(δ0)進行歸一化處理,使其峰強值為9,便于后續的定量分析。*終,將積分數據導入SIMCA 14.1軟件進行**的多變量統計分析。
(3)枸杞的地理來源鑒定
傳統機器學習:采用邏輯回歸(LR)和采用基于徑向基函數核函數的非線性支持向量機(SVM)進行枸杞產地的識別。為了優化SVM模型的性能,使用網格搜索方法調整懲罰因子(C)和核參數(γ)。具體來說,懲罰因子C從20.1變化到250,核參數γ從2-15調整到2-10。
改進的ResNet-34:與傳統機器學習算法相比,深度學習模型在分類任務中表現出更高的準確性,這主要歸因于其能夠自動從高維數據中提取更**的特征。這種優勢在高精度地理來源識別中得到了驗證。如今,ResNet被廣泛應用于各種分類任務。考慮到HSI數據的復雜性和高維性,以及模型的性能要求,本研究選擇了一種改進版的ResNet-34架構。
表1展示了改進版ResNet-34的架構,說明其由五個模塊組成,每個模塊包含36個卷積層,*終連接至一個全連接層。與原始ResNet相比,*顯著的區別在于初始卷積層Conv1_x的修改。傳統的2D卷積層被替換為3D卷積層,以更好地適應枸杞HSI數據的復雜性。Conv1_x層包含三個3D卷積子層和一個2D卷積子層,各自配備不同尺寸的卷積核:3×3×17、3×3×11、3×3×7(3D卷積)和3×3(2D卷積)。每次卷積操作均應用修正線性單元(ReLU)激活函數。這一架構調整的動機是利用HSI數據中固有的多波段圖像特性,這不僅提供了豐富的空間和光譜信息,也顯著增加了數據的復雜性和體量。整個枸杞HSI數據集(包括A面和B面)隨機分為訓練集(占70%)和測試集(占30%)。訓練集用于優化改進版ResNet-34模型的參數,測試集則用于評估模型的預測性能。在本研究中,學習率、批量大小、訓練周期數、損失函數和優化器分別設置為0.001、16、200、交叉熵損失和Adam。這些參數的選擇旨在有效處理具有64×64像素空間維度和114個光譜波段的圖像。

特征波長提取:雖然HSI提供了豐富的光譜和空間信息,但其高維性和共線性以及冗余性對計算效率和模型魯棒性構成了重大挑戰。此外,深度學習模型的“黑箱”性質(其特征是缺乏固有的可解釋性)進一步使其應用復雜化。為了解決這些問題,有必要對預處理后的光譜進行特征提取,以盡量減少非相關變量的影響,消除冗余信息,從而提高模型的計算效率和性能。
利用SHAP技術對模型輸出進行解析,提取了400-1040nm光譜范圍內的特征波長。計算SHAP值,得到各光譜波段各數據點的貢獻分數,這些SHAP值代表各光譜波段對模型的重要程度。該方法不僅揭示了HSI數據中每個光譜波段對全球范圍內預測結果的重要性,而且還描繪了其在每個HSI區域內的影響。在本研究中,迭代選取貢獻率*高的5%以內的光譜波段圖像作為模型的訓練數據,每一步遞增5%,直到模型的預測精度接近于原始模型。
(4)統計分析
所有NMR積分數據隨后通過SIMCA 14.1軟件進行多變量統計分析。在此之前,數據進行了單位方差縮放,以突出微量成分的差異。使用偏*小二乘判別分析(PLS-DA)來揭示不同產地之間的組成差異,隨后應用正交偏*小二乘判別分析(OPLS-DA)以識別枸杞的地理或品種標志物。PLS-DA和OPLS-DA模型的性能通過模型參數R2X、R2Y和Q2進行評估。此外,為了檢測潛在的過擬合,模型進行了200次置換檢驗。
枸杞中各成分的定量通過比較每種成分特征峰的積分與內標物(TSP)的積分實現,濃度以平均值 ± 標準偏差(SD)表示,基于三次重復實驗獲得。在本研究中,構建了一個四維火山圖以展示倍數變化、p值、**相關系數(r)和投影變量重要性(VIP)。枸杞的地理標志(GI)標志物基于以下嚴格標準進行識別:倍數變化不在0.8–1.2范圍內,p<0.05,|r|>0.90,且VIP值位于前5%。

為了分析同一枸杞樣品中NMR數據與HSI數據之間的相關性,計算了它們的Pearson相關系數。此外,使用精度評估了LR、SVM和改進的ResNet-34模型在識別枸杞地理起源方面的性能。

結果與討論

(1)基于HSI數據的枸杞產地識別
圖2顯示了不同地理產地的枸杞樣品A面和B面的平均反射率。不同產地的枸杞樣品中相似的光譜趨勢表明相似的化學成分,而光譜強度的差異表明不同成分的濃度不同。同時,圖2a和b顯示了枸杞樣品的A面和B面光譜差異很小,這一發現意味著從單側采集HSI數據是一種可行的方法,因為盡管樣本兩側的外部和內部特征存在潛在變化,但它不會引入重大誤差。在400-560nm的可見光光譜中,枸杞樣品的光譜反射率明顯較低,曲線重疊,這可能是由于枸杞的紅色表面在該波長范圍內反射的光較少。相反,在560-850nm波長范圍內,枸杞表面的反射率逐漸增加,光譜曲線呈現出微小的差異。雖然不同產地的枸杞樣品的反射率曲線開始出現差異,但差異仍然很小。枸杞在922nm和985nm處有小谷,在963nm處有小峰,這些特征表明了O-H拉伸的**和**泛音。

圖2.來自不同地理和品種產地的枸杞樣品的(a)A面和(b)B面平均反射光譜
盡管不同地理來源或品種的枸杞在光譜上存在差異,但不能通過視覺比較來有效區分。此外,相似的顏色和形狀增加了視覺區分的難度。因此,選擇合適的分類策略對其進行準確分類就變得至關重要。為了獲得更好的分類結果,本研究采用了機器學習技術。表2顯示了線性(LR)和非線性(SVM)模型對枸杞地理來源識別的分類結果。在A側和B側的測試數據集上,LR和SVM模型對枸杞產地的分類準確率均未超過90%,但當使用一側數據訓練的模型對枸杞產地進行識別時,LR模型和SVM模型的預測準確率分別達到95.24%和99.43%。總體結果表明,機器學習結合HSI技術有效地識別了枸杞的起源。此外,通過從枸杞的任何一側收集HSI數據,可以實現可靠的地理來源追溯。


考慮到LR和SVM模型的分類準確率不足90%,引入深度學習對高維HSI數據進行進一步分析。正如之前的研究所指出的那樣,深度學習模型需要大量的訓練數據集。因此,我們將來自枸杞兩側的HSI數據納入了包含730個樣本的訓練數據集和包含320個樣本的測試數據集。為了避免同一枸杞樣品的A面或B面被分配至不同的數據集(從而影響驗證結果的完整性),同一樣品的兩面被策略性地分配至相同數據集。

川公網安備 51011202000202號

主站蜘蛛池模板: 美女操网站 | 亚洲人在线播放 | 国产精品久久久久久中文字 | 成人精品鲁一区一区二区 | 三级视频在线观看 | 色网站入口 | 久久久婷婷 | 96av麻豆蜜桃一区二区 | 成人在线观看免费 | 亚洲网在线 | 成人a免费| 日韩精品一区二区三区久久 | 国产精品久久久久久亚洲调教 | 国产精品日韩在线观看一区二区 | 日韩av在线一区 | 日韩欧美三区 | h在线播放| 亚洲狠狠| 亚洲国产视频一区二区 | 国产成人免费视频网站视频社区 | 综合久久av | 狠狠视频 | 久久中文一区二区 | 国产精品99久久久久久www | 国产三级在线观看播放 | 精品熟人一区二区三区四区 | 亚洲精品视频播放 | 日本精品视频在线观看 | 久久一级大片 | 男女污污动态图 | 久久国产精品久久久久久 | 91激情视频 | 国产精品一区二区欧美黑人喷潮水 | 蜜桃视频在线观看免费视频网站www | 中文字幕一区在线观看视频 | www网站在线观看 | 欧美一区二区三区视频 | 国产精品伦理一区二区三区 | 国产在线精品一区二区 | 日韩视频一级 | 久久久99国产精品免费 |