近红外漫反射光谱法快速鉴别石斛
摘 要:通过采集15种石斛171份样品的近红外漫反射光谱,结合化学计量学统计分析方法建立预测模型,对不同种石斛进行快速无损鉴别。应用Hotelling T2对随机抽取的5份样品的近红外光谱进行稳定性分析,结果表明,样品的近红外光谱具有较好稳定性。设计正交试验L24(2×4×3×8),对光程类型、光谱波段、导数和平滑四个因素进行优化处理。利用主成分分析对正交试验结果进行分析,结果显示,选择6500 cm-1~4000 cm-1的光谱波段,采用多元散射校正、二阶导数和Norris平滑对光谱预处理,提取的主成分数为7时,光谱判别正确率为100%。将正交试验优化条件作为偏最小二乘法判别分析的输入值,随机选取123份样本作为校正集建立预测模型,其余48份样本为预测集,评估预测模型的性能。结果表明,该模型前3个主成分累积贡献率为99.36%,设定鉴别标准偏差为±0.1时,该方法的正确识别率为97.92%,获得满意的结果。该方法的建立为不同种石斛的快速鉴别提供了一种新的方法,同时为药用植物的鉴别提供参考。
关键词:石斛;近红外漫反射光谱;主成分分析;偏最小二乘判别分析
Rapid Identification of Dendrobium Plants based on Near Infrared Diffuse Reflection Spectroscopy
LI Ji-Xiang(Yuxi XiangXin Agricultural Plantation, Yunnan, Yuxi 653100, P. R. China)
石斛为兰科(Orchidaceae)石斛属(Dendrobium)多年生附生草本植物,全世界共有1500多种,广泛分布于亚洲、欧洲、大洋洲等热带及亚热带地区[1]。我国约产76种,被列为我国二级保护植物,其中药用石斛近40种,主要分布于华南及西南地区[2]。干燥或加工成枫斗后的石斛类药材形态相似,加之受基源、产地、生境、采收时间、加工等众多因素的影响,药材质量参差不齐。目前鉴定石斛药材的常用方法有性状鉴别、显微鉴别、光谱鉴别、色谱鉴别以及分子生物学技术鉴别等。其中薄层色谱和DNA指纹图谱方法来鉴别石斛属的不同种类,特别是中国药典中收录的种类,已成为研究的热点[3]。光谱法中红外、紫外、近红外指纹图谱结合计算机分类技术或模糊数学方法,进行中药材产地、真伪鉴别的研究得到广泛应用[4-5]。目前,利用近红外光谱法对石斛药材进行快速鉴别的应用研究,尚未见报道。本文利用近红外漫反射光谱法对石斛属15种植物进行鉴别分析,从其内部化学品质角度,为石斛属的快速鉴别提供新的方法。
1 材料与方法
1.1 仪器设备
实验使用Antaris П型近红外光谱仪(美国,Thermo Fisher Scientific),配置漫反射模块,其光谱采样间隔为1.98 cm-1,光谱范围10000 cm-1~4000 cm-1,分辨率为8 cm-1,扫描次数为64次,使用Result 2.1软件采集光谱图、TQ 8.4分析软件进行主成分分析;DFT-100型中药粉碎机(浙江,温岭市林大机械有限公司),80目不锈钢筛盘(北京,中西泰安);SIMCA-P+11.5软件(美国,UMETRICS);SPSS 19.0分析软件。
1.2 实验材料及光谱获取
实验材料取自云南省玉溪市祥馨农产品种植基地兰科种质资源圃,经云南省农业科学院药用植物研究所金航研究员鉴定(见表1)。所有样品在45 ℃下,烘干至恒重。取不同种石斛的干燥茎,用中药粉碎机粉碎,过80目网筛(样品直径不能大于1.0 mm)。均匀混合后称取20.0 g样品于采样杯中,使用Result 2.1软件编写流程采集光谱。随机选择石斛样品SH8、SH12、SH21、SH22及SH30平行采集30次光谱,将光谱通过SIMCA-P+11.5软件的Hotelling T2进行稳定性分析,其余样品均采集3次,取其平均光谱。
1.3 光谱数据预处理
根据样品光谱信息,将近红外光谱波段分为四个不同范围:10000 cm-1~4000 cm-1、8500 cm-1~4000 cm-1、7500 cm-1~4000 cm-1、6500 cm-1~4000 cm-1。为消除高频随机噪声、基线漂移、样品不均匀、光散射等影响,需对光谱进行预处理。通过L24(2×4×3×8)正交试验设计,对光程类型、光谱波段、导数和平滑四个因素进行优化处理。
主成分分析(Principal component analysis,PCA)目的是将数据进行降维,消除相互重叠的信息部分,通过对实测的多个指标相关矩阵内部相关信息的提取,利用原有指标线性的组合产生少数几个指标,用于更好的表征原有指标的性质[6]。实验将所采集的171份样品光谱数据在有监督模式下进行正交试验设计进行优化分析,采用TQ 8.4分析软件对各优化处理结果进行主成分分析。
偏最小二乘法判别分析(partial least squares discriminant analysis,PLS-DA)是主成分分析的回归扩展,是将两个变量模块X和Y的信息进行关联分析,应用几何表达式提供许多模型参数和残差诊断工具,用于解释和建立回归模型,并对回归模型进行诊断的一种方法[6]。采用SIMCA-P+11.5软件PLS-DA分析方法,建立快速鉴别不同种石斛的预测模型。
Table 1 Different species of Dendrobium samples
序号 |
种名 |
份数 |
序号 |
种名 |
份数 |
序号 |
种名 |
份数 |
SH5 |
金耳石斛 |
11 |
SH14 |
细叶石斛 |
16 |
SH22 |
杓唇石斛 |
10 |
SH6 |
球花石斛 |
11 |
SH15 |
束花石斛 |
10 |
SH24 |
长苏石斛 |
10 |
SH8 |
肿节石斛 |
12 |
SH17 |
钩状石斛 |
12 |
SH25 |
罗河石斛 |
11 |
SH9 |
金钗石斛 |
10 |
SH20 |
重唇石斛 |
10 |
SH27 |
西畴石斛 |
10 |
SH12 |
翅萼石斛 |
10 |
SH21 |
长距石斛 |
10 |
SH30 |
美花石斛 |
10 |
2 实验结果与分析
2.1近红外漫反射光谱
15种石斛的典型近红外光谱曲线如图1所示。图1中横坐标为波长,波数范围是10000 cm-1~4000 cm-1,纵坐标为光谱漫反射率(Log (1/R) 表示)。由图1可知,不同种石斛的光谱曲线有明显区别,并具有一定的特征性和指纹性,这一差异为石斛不同种的鉴别奠定了数据基础。
Fig. 1 The near-infrared diffuse reflectance spectroscopy of Fig. 2 Stability of the five different species of Dendrobium
fifteen different species of Dendrobium
2.2 Hotelling T2稳定性分析
1.2中随机选择的石斛样品SH8、SH12、SH21、SH22及SH30 的Hotelling T2稳定性分析结果见图2。由图2可知,5个样品平行各采集30次,在95%的置信控制区间内各样品光谱间虽有微小波动,但均在控制线范围内,表明采用近红外光谱采集石斛样品稳定可靠。
2.3主成分分析
采用TQ 8.4分析软件对正交试验结果进行主成分分析,结果见表2。由表2可知,24种优化处理方法中得分最高的分析分别为 5、13、17和24号。对主成分得分较为满意的4种处理分别进行可视化分析,结合优化处理的光谱波段选择、提取的主成分数及光谱处理方式综合考察显示,24号优化方法在三维空间中能将171份样品较好的分为15类,分类结果如图3所示。从图3中可以看出15种石斛在主成分空间中呈现较好的聚合度,15个种间的分界清楚分明。同时可以观察到美花石斛(SH30)、肿节石斛(SH8)、罗河石斛(SH25)和重唇石斛(SH20)与其余种分界线较为明显,其余种多集中分布,这可能与种的亲缘关系和样品间分布的空间距离有关。
Table 2 Box scores of optimization process by PCA
处理次数序号 |
得分 |
错误个数 |
主成分数 |
处理次数序号 |
得分 |
错误个数 |
主成分数 |
1 |
96.52% |
4 |
8 |
13 |
100.00% |
0 |
8 |
2 |
97.39% |
3 |
8 |
14 |
99.13% |
1 |
8 |
3 |
99.13% |
1 |
8 |
15 |
97.39% |
3 |
8 |
4 |
98.26% |
2 |
8 |
16 |
98.26% |
2 |
8 |
5 |
100.00% |
0 |
8 |
17 |
100.00% |
0 |
7 |
6 |
97.39% |
3 |
8 |
18 |
98.26% |
2 |
8 |
7 |
99.13% |
1 |
8 |
19 |
99.13% |
1 |
8 |
8 |
97.39% |
3 |
8 |
20 |
98.26% |
2 |
8 |
9 |
99.13% |
1 |
8 |
21 |
98.26% |
2 |
8 |
10 |
99.13% |
1 |
8 |
22 |
99.13% |
1 |
8 |
11 |
97.39% |
3 |
8 |
23 |
98.26% |
2 |
8 |
12 |
98.26% |
2 |
8 |
24 |
100.00% |
0 |
7 |
2.4建立不同种石斛快速鉴别模型
将2.3中光谱数据的优化结果24号作为PLS-DA的输入值,从171份不同种样本中随机抽取123份样本作为校正集建立预测模型。剩余的48份样本作为验证集,评估预测模型的性能。结果显示,原始光谱经24号处理方法处理后,提取的前3个主成分贡献率分别为93.09%、4.80%和1.47%,累积贡献率为99.36%。因此,将前3个主成分作为最佳的优化条件,对预测集样品进行分析,结果如表4所示。设定石斛种真实值“1”代表SH5,“2”代表SH6,“3”代表SH8,“4”代表SH9,“5”代表SH12,“6”代表SH14,“7”代表SH15,“8”代表SH17,“9”代表SH20,“10”代表SH21,“11”代表SH22,“12”代表SH24,“13”代表SH25,“14”代表SH27,“15”代表SH30,设定预测得分结果偏差在±0.1以内为种间分界线。结果表明,只有钩状石斛样品SH17-12预测偏差超出范围,该样品预测值被判定为长距石斛(SH21)种,对预测集样品预测的正确辨别率为97.92%,获得了较理想的预测结果。
Table 4 Prediction results of 48 different species of Dendrobium samples by PLS-DA
预测样品序号 |
真实值 |
预测值 |
预测样品序号 |
真实值 |
预测值 |
预测样品序号 |
真实值 |
预测值 |
SH5-9 |
1 |
0.92669 |
SH14-1 |
6 |
5.99463 |
SH21-7 |
10 |
9.94809 |
SH5-10 |
1 |
0.94812 |
SH14-2 |
6 |
6.00678 |
SH22-1 |
11 |
10.99660 |
SH5-11 |
1 |
0.94812 |
SH14-3 |
6 |
5.98718 |
SH22-5 |
11 |
11.03772 |
SH6-1 |
2 |
1.93085 |
SH14-4 |
6 |
5.96762 |
SH22-10 |
11 |
10.92521 |
SH6-2 |
2 |
1.93253 |
SH14-8 |
6 |
5.96968 |
SH24-1 |
12 |
12.03153 |
SH6-3 |
2 |
1.98941 |
SH15-1 |
7 |
6.94878 |
SH24-5 |
12 |
11.95934 |
SH8-1 |
3 |
3.04933 |
SH15-4 |
7 |
7.08712 |
SH24-6 |
12 |
11.96263 |
SH8-4 |
3 |
3.08173 |
SH15-9 |
7 |
7.02798 |
SH25-1 |
13 |
12.98260 |
SH8-7 |
3 |
3.06314 |
SH17-1 |
8 |
8.01556 |
SH25-6 |
13 |
12.99971 |
SH8-11 |
3 |
3.06131 |
SH17-11 |
8 |
7.95449 |
SH25-10 |
13 |
12.99295 |
SH9-2 |
4 |
4.08579 |
SH17-12 |
8 |
10.97477 |
SH27-1 |
14 |
14.07461 |
SH9-4 |
4 |
4.02477 |
SH20-1 |
9 |
8.94656 |
SH27-6 |
14 |
13.96527 |
SH9-6 |
4 |
4.00395 |
SH20-3 |
9 |
8.95391 |
SH27-8 |
14 |
13.99775 |
SH12-5 |
5 |
5.00843 |
SH20-7 |
9 |
8.92458 |
SH30-3 |
15 |
14.98733 |
SH12-8 |
5 |
4.92110 |
SH21-1 |
10 |
10.08649 |
SH30-7 |
15 |
14.96771 |
SH12-10 |
5 |
4.94895 |
SH21-4 |
10 |
9.93511 |
SH30-9 |
15 |
15.04402 |
3 结论
应用近红外漫反射光谱法采集15种171份石斛样品,随机选5份不同种的样品平行采集30次,通过SIMCA 软件Hotelling T2对所采集的样品进行稳定性分析,结果显示近红外光谱用于采集石斛样品稳定性较好。为准确鉴别不同石斛种,利用正交试验设计对所采集的光谱进行优化处理,通过选择6500 cm-1~4000 cm-1的光谱波段,采用段长为3,段间距为5的Norris 平滑处理和二价微分去除高频波段的噪声,使用MSC对石斛样品进行判别分析,优化提取主成分数为7时,判别正确率为100%。将正交试验设计的优化结果作为PLS-DA的输入值建立石斛鉴别模型,该模型的正确识别率达到97.92%,获得了理想的预测精度。该方法的建立表明,利用近红外光谱技术结合现代化学计量学,可以快速、准确、无损的对石斛种类进行鉴别。通过光谱的优化处理,采用PLS-DA方法建立石斛的鉴别模型用于预测未知样品精度较高。该方法的建立为石斛的快速鉴别提供了一种新方法,同时对中药材真伪和种类的鉴别提供参考。
参考文献
[1] Dressler Robert L. Phylogeny and classification of the orchid family. Cambridge: Cambridge University Press, 1933.
[2] JI Zhan-he (吉占和). Journal of Systematics and Evolution (植物分类学报), 1980, 18(4): 427.
[3] FU Juan, DU Jing, HUANG Lin-fang (付娟, 杜静, 黄林芳). Journal of Guangdong Pharmaceutical University (广东药学院学报), 2013, 29(1): 1.
[4] Liu X H, Xu C H, Sun S Q, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2012, 97: 290.
[5] DING Yong-li, WANG Yuan-zhong, ZHANG Ji, et al (丁永丽,王元忠,张霁,等). Spectroscopy and spectral analysis (光谱学与光谱分析), 2013, 33(2): 471.
[6]ErikssonL,JohanssonE,Kettaneh-WoldN,etal.Multi-and megavariate data analysis, Part Ⅰ: Basic principles and applications. Second revised and enlarged edition, Umetrics AB, 2006.