摘要:對江蘇、遼寧、湖北、黑龍江4個(gè)省份的169個(gè)大米樣品,利用波數(shù)測定范圍為10 000~4 000 cm-1的Thermo Antaris Ⅱ傅里葉變換近紅外分析儀,采用化學(xué)計(jì)量學(xué)模式識別主成分分析(PCA)和線性判別分析(LDA)方法進(jìn)行產(chǎn)地溯源分析。結(jié)果表明,PCA方法基于前2個(gè)主成分可基本區(qū)分大米產(chǎn)地,但各類樣品有部分重疊;采用PCA-LDA法可更有效區(qū)分大米產(chǎn)地,利用蒙特卡羅模擬方法隨機(jī)重復(fù)選取訓(xùn)練集和預(yù)測集判別4個(gè)省份的大米產(chǎn)地準(zhǔn)確率在9300%以上,識別準(zhǔn)確率相對較高。因此,化學(xué)計(jì)量學(xué)模式識別方法結(jié)合紅外光譜用于大米產(chǎn)地溯源分析具有一定的可行性和應(yīng)用價(jià)值。
關(guān)鍵詞:大米;產(chǎn)地溯源;化學(xué)計(jì)量學(xué);主成分分析(PCA);線性判別分析(LDA)
中圖分類號: TS2077文獻(xiàn)標(biāo)志碼: A
文章編號:1002-1302(2017)21-0193-03
收稿日期:2017-06-14
基金項(xiàng)目:國家自然科學(xué)基金(編號:31601665);江蘇省自然科學(xué)基金(編號:BK20160576)。
作者簡介:李勇(1987—),男,黑龍江鶴崗人,博士,助理研究員,主要從事農(nóng)產(chǎn)品質(zhì)量安全研究。Tel:(021)84391229;E-mail:liyong_213@163com。
通信作者:余向陽,博士,研究員,主要從事農(nóng)產(chǎn)品質(zhì)量安全研究。E-mail:yuxy@jaasaccn。
地理標(biāo)志產(chǎn)品具有獨(dú)特的品質(zhì)和較高的經(jīng)濟(jì)效益,備受消費(fèi)者青睞。然而,假冒偽劣的地理標(biāo)志產(chǎn)品極為普遍,嚴(yán)重?cái)_亂市場秩序,損害消費(fèi)者利益,因此,為整頓市場秩序,急需建立完善的地理標(biāo)志產(chǎn)品產(chǎn)地溯源分析方法。目前,常用的產(chǎn)地溯源分析方法有近紅外光譜(NIR)分析技術(shù)、色譜分析技術(shù)、DNA溯源技術(shù)、同位素分析技術(shù)等,均有一定的應(yīng)用前景1-2],其中,近紅外光譜技術(shù)作為一種新型的快速檢測技術(shù),具有分析速度快、成本低、無損檢測、重現(xiàn)性好等特點(diǎn),常應(yīng)用于食品、農(nóng)產(chǎn)品、藥品中感興趣成分的快速定性定量分析3-4]。
來源不同產(chǎn)地的地理標(biāo)志產(chǎn)品其化學(xué)成分及各組分含量存在差異,致使近紅外光譜也存在差異,而使近紅外光譜能夠反映出地理標(biāo)志產(chǎn)品的產(chǎn)地特征信息。近紅外光譜屬分子吸收光譜,主要反映有機(jī)物分子中C—H、N—H、O—H等含氫基團(tuán)振動光譜信息,檢測波數(shù)范圍為12 820~4 000 cm-1,由于其光譜吸收帶相對較寬,譜帶重疊較為嚴(yán)重,利用傳統(tǒng)分析方法鑒定產(chǎn)地信息比較困難5],而近紅外光譜結(jié)合化學(xué)計(jì)量學(xué)模式識別方法可更加有效地區(qū)分不同產(chǎn)地產(chǎn)品的光譜差異6]。目前,常用的化學(xué)計(jì)量學(xué)模式識別方法分為2類,即無監(jiān)督模式識別和有監(jiān)督模式識別5-8]。無監(jiān)督模式識別法又稱為聚類分析法,包括系統(tǒng)聚類法、最小生成樹、主成分分析法(PCA)等5],類似樣本在多維空間中彼此距離相對較近,而不相似樣品的空間距離相對較遠(yuǎn),“物以類聚”;有監(jiān)督模式識別包括距離判別法、線性判別分析(LDA)、偏最小二乘判別分析法(PLS-DA)等,是利用已知類別的樣品作為訓(xùn)練集,建立判別模型,再利用模型對未知樣品類別進(jìn)行預(yù)測5]。
近紅外光譜結(jié)合化學(xué)計(jì)量學(xué)模式識別方法(SIMCA)已廣泛應(yīng)用于食品、農(nóng)產(chǎn)品品質(zhì)鑒定及真?zhèn)舞b別中9-16]。劉威等利用近紅外光譜結(jié)合主成分分析及聚類分析研究法國波爾多、我國河北昌黎和沙城葡萄酒產(chǎn)地的溯源分析,準(zhǔn)確率達(dá)到889%17];湯麗華等利用SIMCA方法結(jié)合近紅外光譜區(qū)分寧夏回族自治區(qū)、甘肅省、青海省、內(nèi)蒙古自治區(qū)、河北省等8個(gè)產(chǎn)地的枸杞,所建模型識別率達(dá)到80%以上18];周健等采用PLS和歐氏距離結(jié)合近紅外光譜方法實(shí)現(xiàn)了茶葉原料的鑒別19];錢麗麗等基于PLS-DA結(jié)合近紅外方法對黑龍江省五常、佳木斯、齊齊哈爾、雙鴨山、牡丹江5個(gè)水稻產(chǎn)區(qū)進(jìn)行溯源研究20]。本研究利用化學(xué)計(jì)量學(xué)模式識別方法結(jié)合近紅外光譜對江蘇、遼寧、湖北、黑龍江4個(gè)省份的169個(gè)大米樣品進(jìn)行產(chǎn)地溯源分析,建立大米產(chǎn)地溯源模型,為大米產(chǎn)地溯源研究提供理論依據(jù)。
1材料與方法
11材料
試驗(yàn)于2016年進(jìn)行,共采集江蘇、遼寧、湖北、黑龍江4個(gè)省份的大米樣品169個(gè),分別為江蘇省泰州市45個(gè)樣品,品種為南梗46;遼寧省盤錦市45個(gè)樣品,品種為盤錦大米;湖北省荊門市39個(gè)樣品,品種為橋米;黑龍江省五常市45個(gè)樣品,品種為五常香米。大米樣品進(jìn)行脫殼、脫糙,封存,待測。
12數(shù)據(jù)采集
Thermo Antaris Ⅱ傅里葉變換近紅外分析儀采用反射積分球模式采集大米近紅外光譜,儀器參數(shù)為波數(shù)范圍 10 000~4 000 cm-1,掃描間隔3856 cm-1,每條光譜包含 1 557個(gè)點(diǎn)。每個(gè)樣品采集60次,取平均值作為樣品最終光譜;以樣品為行變量,以近紅外光譜波數(shù)為列變量,獲得大小為169×1 557的數(shù)據(jù)陣。
13數(shù)據(jù)分析
利用Matlab軟件對近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理、主成分分析、線性判別分析,相關(guān)程序?yàn)楣P者所在實(shí)驗(yàn)室科研人員自編。
2結(jié)果與分析
21數(shù)據(jù)預(yù)處理
由圖1-a可見,利用近紅外漫反射光譜采集大米樣品光譜會存在一定的散射和噪聲干擾,且同一省份大米樣品的光譜差異較大,會對后續(xù)數(shù)據(jù)分析產(chǎn)生很大影響。試驗(yàn)采用標(biāo)準(zhǔn)正態(tài)變換(SNV)方法對近紅外數(shù)據(jù)進(jìn)行預(yù)處理,以去除數(shù)據(jù)中散射和噪聲的干擾。由圖1-b可見,經(jīng)預(yù)處理后,4個(gè)省份的大米樣品光譜均重疊在一起,幾乎不能用肉眼來進(jìn)行區(qū)分。
22主成分分析(PCA)
主成分分析是一種常用的數(shù)據(jù)降維方法,主要是對數(shù)據(jù)中的原始變量進(jìn)行線性組合,得到幾個(gè)正交的成分即主成分,對原數(shù)據(jù)的協(xié)方差陣進(jìn)行解釋,在主成分分析投影圖中相近的樣品將會聚到一起,而不相似的樣品空間距離相對較遠(yuǎn)21]。本試驗(yàn)利用奇異值分解方法對試驗(yàn)數(shù)據(jù)進(jìn)行主成分分析,在數(shù)據(jù)分析前,對數(shù)據(jù)進(jìn)行歸一化處理。分析結(jié)果表明,前6個(gè)主成分的累計(jì)方差貢獻(xiàn)率分別為6041%、2803%、446%、242%、151%、033%,其中前5個(gè)主成分的累計(jì)方差貢獻(xiàn)率為9683%,確定主成分?jǐn)?shù)為5。由圖2可見,利用前2個(gè)主成分基本可以區(qū)分4個(gè)省份的大米樣品,但部分樣品有重疊;利用其他主成分投影時(shí),不同類別樣品重疊則更為嚴(yán)重。
23線性判別分析(LDA)
線性判別分析是一種有監(jiān)督學(xué)習(xí)型的簡單線性判別函數(shù)分析方法,其訓(xùn)練集構(gòu)建函數(shù)要求組內(nèi)方差最小、組間方差最大,再利用構(gòu)建函數(shù)對未知樣品類別進(jìn)行預(yù)測22]。本試驗(yàn)利用蒙特卡洛模擬方法,將大米樣品隨機(jī)分為訓(xùn)練集、預(yù)測集,利用LDA對訓(xùn)練集樣品建立大米產(chǎn)地溯源模型,并利用已建立的模型對預(yù)測樣品進(jìn)行判定。根據(jù)PCA結(jié)論,該數(shù)據(jù)的組分?jǐn)?shù)為5,因此,LDA對前5個(gè)主成分進(jìn)行分析。基于訓(xùn)練集建模,得到3個(gè)判別函數(shù),即Function1、Function2、Function3:
Function1=0017×PC1+0010×PC2+0011×PC3-0095×PC4+0104×PC5+0027;
Function2=0018×PC1+0121×PC2-0277×PC3+0537×PC4-0739×PC5+0146;
Function3=0674×PC1-0958×PC2+3131×PC3-0064×PC4+1732×PC5+0715。
式中:Function1用于區(qū)分江蘇產(chǎn)地與其他3個(gè)省份的大米樣品,F(xiàn)unction2用于區(qū)分遼寧省和湖北、黑龍江2個(gè)省份的大米樣品,F(xiàn)unction3用于區(qū)分湖北省和黑龍江省的大米樣品。利用蒙特卡洛模擬方法隨機(jī)重復(fù)計(jì)算1 000次,結(jié)果由表1可見,在訓(xùn)練集中,識別江蘇省大米的準(zhǔn)確率為9625%,375% 的江蘇省大米樣品錯(cuò)誤判別為湖北省大米,遼寧、湖北2個(gè)省份的大米樣品識別準(zhǔn)確率均為10000%,黑龍江省大米識別率為9409%,591%的黑龍江省大米樣品被判定為江蘇省大米,總體而言,預(yù)測結(jié)果的正確率在9400%以上,訓(xùn)練集結(jié)果的準(zhǔn)確率相對較高,令人滿意;在預(yù)測集中,識別江蘇、遼寧、湖北、黑龍江4個(gè)省份大米樣品的準(zhǔn)確率分別為 9491%、10000%、10000%、9397%,預(yù)測結(jié)果的準(zhǔn)確率也較高。因此,PCA-LDA方法可有效區(qū)分不同地區(qū)的大米。
3結(jié)論
利用化學(xué)計(jì)量學(xué)主成分分析(PCA)和線性判別分析(LDA)結(jié)合近紅外光譜,對江蘇、遼寧、湖北、黑龍江4個(gè)省份的169個(gè)大米樣品進(jìn)行產(chǎn)地溯源分析,結(jié)果表明,利用Thermo Antaris Ⅱ傅里葉變換近紅外分析儀測定大米近紅外光譜會存在散射和噪聲的干擾,在采用標(biāo)準(zhǔn)正態(tài)變換(SNV)方法去雜、去噪的基礎(chǔ)上,PCA方法基本可區(qū)分大米產(chǎn)地,但各類樣品有部分重疊,而PCA-LDA法可更有效地區(qū)分大米產(chǎn)地,利用蒙特卡羅模擬方法重復(fù)隨機(jī)篩選訓(xùn)練集和預(yù)測集,識別4個(gè)省份大米品種的準(zhǔn)確率在9300%以上。因此,化學(xué)計(jì)量學(xué)模式識別方法結(jié)合紅外光譜可對大米產(chǎn)地進(jìn)行溯源分析,具有一定的可行性和應(yīng)用價(jià)值。LL]
參考文獻(xiàn):
1]ZK(#]魏益民,郭波莉,魏帥,等 食品產(chǎn)地溯源及確證技術(shù)研究和應(yīng)用方法探析J] 中國農(nóng)業(yè)科學(xué),2012,45(24):5073-5081
2]張曉焱,蘇學(xué)素,焦必寧,等 農(nóng)產(chǎn)品產(chǎn)地溯源技術(shù)研究進(jìn)展J] 食品科學(xué),2010,31(3):271-278
3]褚小立,劉慧穎,燕澤程 近紅外光譜分析技術(shù)實(shí)用手冊M] 北京:機(jī)械工業(yè)出版社,2016:114-161
4]褚小立,陸婉珍 近五年我國近紅外光譜分析技術(shù)研究與應(yīng)用進(jìn)展J] 光譜學(xué)與光譜分析,2014,34(10):2595-2605
5]梁逸曾,俞汝勤 分析化學(xué)手冊:化學(xué)計(jì)量學(xué)M] 北京:化學(xué)工業(yè)出版社,2000
6]許祿 化學(xué)計(jì)量學(xué):一些重要方法的原理及應(yīng)用M] 北京:科學(xué)出版社,2004:1-25
7]吳海龍,俞汝勤 化學(xué)多維校正的若干新進(jìn)展J] 化學(xué)通報(bào),2011,74(9):771-782
8]Wold S Chemometrics:what do we mean with it,and what do we want from it?J] Chemometrics and Intelligent Laboratory Systems,1995,3(1):109-115
9]趙杰文,畢夏坤,林顥,等 雞蛋新鮮度的可見-近紅外透射光譜快速識別J] 激光與光電子學(xué)進(jìn)展,2013,50(5):209-216
10]ZK(#]Pholpho T,Pathaveerat S,Sirisomboon P Classification of long an fruit bruising using visible spectroscopyJ] Journal of Food Engineering,2011,104(1):169-172
11]呂強(qiáng),湯明杰,趙杰文,等 近紅外光譜預(yù)測獼猴桃硬度模型的簡化研究J] 光譜學(xué)與光譜分析,2009,29(7):1768-1771
12]邵圣枝,陳元林,張永志,等 稻米中同位素與多元素特征及其產(chǎn)地溯源PCA-LDA判別J] 核農(nóng)學(xué)報(bào),2015,29(1):119-127
13]楊春艷,劉飛,王元忠 紅外光譜結(jié)合判別分析對瑪咖產(chǎn)地的鑒別J] 江蘇農(nóng)業(yè)科學(xué),2017,45(5):170-173
14]顧玉琦,劉瑞婷,壽國忠,等 應(yīng)用近紅外光譜技術(shù)快速鑒別鐵皮石斛的產(chǎn)地J] 江蘇農(nóng)業(yè)科學(xué),2016,44(5):365-368
15]劉飛,楊春艷,道永艷,等 傅里葉變換紅外光譜對滇重樓生長年限的鑒別研究J] 江蘇農(nóng)業(yè)科學(xué),2016,44(2):300-303,304
16]武小紅,孫俊,武斌,等 基于聯(lián)合區(qū)間偏最小二乘判別分析的豬肉近紅外光譜定性建模分析J] 激光與光電子學(xué)進(jìn)展,2015,52(4):242-247
17]劉威,戰(zhàn)吉宬,董衛(wèi)東,等 基于近紅外光譜技術(shù)的葡萄酒原產(chǎn)地辨識方法J] 農(nóng)業(yè)工程學(xué)報(bào),2010(增刊1):374-378
18]湯麗華,劉敦華 基于近紅外光譜技術(shù)的枸杞產(chǎn)地溯源研究J] 食品科學(xué),2011,32(22):175-178
19]周健,成浩,曾建明,等 基于近紅外的多相偏最小二乘模型組合分析實(shí)現(xiàn)茶葉原料品種鑒定與溯源的研究J] 光譜學(xué)與光譜分析,2010,30(10):2650-2653
20]錢麗麗,冷候喜,宋雪健,等 基于PLS-DA判別法對黑龍江大米產(chǎn)地溯源的研究J] 食品工業(yè),2017,38(1):171-174
21]Brereton G,Brereton Chemometrics for pattern recognitionM] New Jersey:John Wiley & Sons Inc,2009
22]Galdón B R,Rodríguez L H,Mesa D R,et al Differentiation of potato cultivars experimentally cultivated based on their chemical composition and by applying linear discriminant analysisJ] Food Chemistry,2012,133(4):1241-1248
推薦訪問:計(jì)量學(xué) 溯源 光譜 大米 產(chǎn)地