您现在的位置是:首页 > 石斛知识

石斛知识

近红外漫反射光谱法快速鉴别石斛

2020-03-01 09:27:19 0
摘 要:通过采集15种石斛171份样品的近红外漫反射光谱,结合化学计量学统计分析方法建立预测模型,对不同种石斛进行快速无损鉴别。应

摘 要:通过采集15种石斛171份样品的近红外漫反射光谱,结合化学计量学统计分析方法建立预测模型,对不同种石斛进行快速无损鉴别。应用Hotelling T2对随机抽取的5份样品的近红外光谱进行稳定性分析,结果表明,样品的近红外光谱具有较好稳定性。设计正交试验L24(2×4×3×8),对光程类型、光谱波段、导数和平滑四个因素进行优化处理。利用主成分分析对正交试验结果进行分析,结果显示,选择6500 cm-1~4000 cm-1的光谱波段,采用多元散射校正、二阶导数和Norris平滑对光谱预处理,提取的主成分数为7时,光谱判别正确率为100%。将正交试验优化条件作为偏最小二乘法判别分析的输入值,随机选取123份样本作为校正集建立预测模型,其余48份样本为预测集,评估预测模型的性能。结果表明,该模型前3个主成分累积贡献率为99.36%,设定鉴别标准偏差为±0.1时,该方法的正确识别率为97.92%,获得满意的结果。该方法的建立为不同种石斛的快速鉴别提供了一种新的方法,同时为药用植物的鉴别提供参考。

关键词:石斛;近红外漫反射光谱;主成分分析;偏最小二乘判别分析

Rapid Identification of Dendrobium Plants based on Near Infrared Diffuse Reflection Spectroscopy

LI Ji-Xiang(Yuxi XiangXin Agricultural Plantation, Yunnan, Yuxi 653100, P. R. China)

石斛为兰科(Orchidaceae)石斛属(Dendrobium)多年生附生草本植物,全世界共有1500多种,广泛分布于亚洲、欧洲、大洋洲等热带及亚热带地区[1]。我国约产76种,被列为我国二级保护植物,其中药用石斛近40种,主要分布于华南及西南地区[2]。干燥或加工成枫斗后的石斛类药材形态相似,加之受基源、产地、生境、采收时间、加工等众多因素的影响,药材质量参差不齐。目前鉴定石斛药材的常用方法有性状鉴别、显微鉴别、光谱鉴别、色谱鉴别以及分子生物学技术鉴别等。其中薄层色谱和DNA指纹图谱方法来鉴别石斛属的不同种类,特别是中国药典中收录的种类,已成为研究的热点[3]。光谱法中红外、紫外、近红外指纹图谱结合计算机分类技术或模糊数学方法,进行中药材产地、真伪鉴别的研究得到广泛应用[4-5]。目前,利用近红外光谱法对石斛药材进行快速鉴别的应用研究,尚未见报道。本文利用近红外漫反射光谱法对石斛属15种植物进行鉴别分析,从其内部化学品质角度,为石斛属的快速鉴别提供新的方法。

1 材料与方法

1.1 仪器设备

实验使用Antaris П型近红外光谱仪(美国,Thermo Fisher Scientific),配置漫反射模块,其光谱采样间隔为1.98 cm-1,光谱范围10000 cm-1~4000 cm-1,分辨率为8 cm-1,扫描次数为64次,使用Result 2.1软件采集光谱图、TQ 8.4分析软件进行主成分分析;DFT-100型中药粉碎机(浙江,温岭市林大机械有限公司),80目不锈钢筛盘(北京,中西泰安);SIMCA-P+11.5软件(美国,UMETRICS);SPSS 19.0分析软件。

1.2 实验材料及光谱获取

实验材料取自云南省玉溪市祥馨农产品种植基地兰科种质资源圃,经云南省农业科学院药用植物研究所金航研究员鉴定(见表1)。所有样品在45 ℃下,烘干至恒重。取不同种石斛的干燥茎,用中药粉碎机粉碎,过80目网筛(样品直径不能大于1.0 mm)。均匀混合后称取20.0 g样品于采样杯中,使用Result 2.1软件编写流程采集光谱。随机选择石斛样品SH8、SH12、SH21、SH22及SH30平行采集30次光谱,将光谱通过SIMCA-P+11.5软件的Hotelling T2进行稳定性分析,其余样品均采集3次,取其平均光谱。

1.3 光谱数据预处理

根据样品光谱信息,将近红外光谱波段分为四个不同范围:10000 cm-1~4000 cm-1、8500 cm-1~4000 cm-1、7500 cm-1~4000 cm-1、6500 cm-1~4000 cm-1。为消除高频随机噪声、基线漂移、样品不均匀、光散射等影响,需对光谱进行预处理。通过L24(2×4×3×8)正交试验设计,对光程类型、光谱波段、导数和平滑四个因素进行优化处理。

主成分分析(Principal component analysis,PCA)目的是将数据进行降维,消除相互重叠的信息部分,通过对实测的多个指标相关矩阵内部相关信息的提取,利用原有指标线性的组合产生少数几个指标,用于更好的表征原有指标的性质[6]。实验将所采集的171份样品光谱数据在有监督模式下进行正交试验设计进行优化分析,采用TQ 8.4分析软件对各优化处理结果进行主成分分析。

偏最小二乘法判别分析(partial least squares discriminant analysis,PLS-DA)是主成分分析的回归扩展,是将两个变量模块X和Y的信息进行关联分析,应用几何表达式提供许多模型参数和残差诊断工具,用于解释和建立回归模型,并对回归模型进行诊断的一种方法[6]。采用SIMCA-P+11.5软件PLS-DA分析方法,建立快速鉴别不同种石斛的预测模型。

Table 1 Different species of Dendrobium samples

 

序号

种名

份数

序号

种名

份数

序号

种名

份数

SH5

金耳石斛

11

SH14

细叶石斛

16

SH22

杓唇石斛

10

SH6

球花石斛

11

SH15

束花石斛

10

SH24

长苏石斛

10

SH8

肿节石斛

12

SH17

钩状石斛

12

SH25

罗河石斛

11

SH9

金钗石斛

10

SH20

重唇石斛

10

SH27

西畴石斛

10

SH12

翅萼石斛

10

SH21

长距石斛

10

SH30

美花石斛

10

2 实验结果与分析

2.1近红外漫反射光谱

15种石斛的典型近红外光谱曲线如图1所示。图1中横坐标为波长,波数范围是10000 cm-1~4000 cm-1,纵坐标为光谱漫反射率(Log (1/R) 表示)。由图1可知,不同种石斛的光谱曲线有明显区别,并具有一定的特征性和指纹性,这一差异为石斛不同种的鉴别奠定了数据基础。


 

Fig. 1 The near-infrared diffuse reflectance spectroscopy of Fig. 2 Stability of the five different species of Dendrobium

fifteen different species of Dendrobium

2.2 Hotelling T2稳定性分析

1.2中随机选择的石斛样品SH8、SH12、SH21、SH22及SH30 的Hotelling T2稳定性分析结果见图2。由图2可知,5个样品平行各采集30次,在95%的置信控制区间内各样品光谱间虽有微小波动,但均在控制线范围内,表明采用近红外光谱采集石斛样品稳定可靠。

2.3主成分分析

采用TQ 8.4分析软件对正交试验结果进行主成分分析,结果见表2。由表2可知,24种优化处理方法中得分最高的分析分别为 5、13、17和24号。对主成分得分较为满意的4种处理分别进行可视化分析,结合优化处理的光谱波段选择、提取的主成分数及光谱处理方式综合考察显示,24号优化方法在三维空间中能将171份样品较好的分为15类,分类结果如图3所示。从图3中可以看出15种石斛在主成分空间中呈现较好的聚合度,15个种间的分界清楚分明。同时可以观察到美花石斛(SH30)、肿节石斛(SH8)、罗河石斛(SH25)和重唇石斛(SH20)与其余种分界线较为明显,其余种多集中分布,这可能与种的亲缘关系和样品间分布的空间距离有关。

Table 2 Box scores of optimization process by PCA

 

处理次数序号

得分

错误个数

主成分数

处理次数序号

得分

错误个数

主成分数

1

96.52%

4

8

13

100.00%

0

8

2

97.39%

3

8

14

99.13%

1

8

3

99.13%

1

8

15

97.39%

3

8

4

98.26%

2

8

16

98.26%

2

8

5

100.00%

0

8

17

100.00%

0

7

6

97.39%

3

8

18

98.26%

2

8

7

99.13%

1

8

19

99.13%

1

8

8

97.39%

3

8

20

98.26%

2

8

9

99.13%

1

8

21

98.26%

2

8

10

99.13%

1

8

22

99.13%

1

8

11

97.39%

3

8

23

98.26%

2

8

12

98.26%

2

8

24

100.00%

0

7


 

2.4建立不同种石斛快速鉴别模型

将2.3中光谱数据的优化结果24号作为PLS-DA的输入值,从171份不同种样本中随机抽取123份样本作为校正集建立预测模型。剩余的48份样本作为验证集,评估预测模型的性能。结果显示,原始光谱经24号处理方法处理后,提取的前3个主成分贡献率分别为93.09%、4.80%和1.47%,累积贡献率为99.36%。因此,将前3个主成分作为最佳的优化条件,对预测集样品进行分析,结果如表4所示。设定石斛种真实值“1”代表SH5,“2”代表SH6,“3”代表SH8,“4”代表SH9,“5”代表SH12,“6”代表SH14,“7”代表SH15,“8”代表SH17,“9”代表SH20,“10”代表SH21,“11”代表SH22,“12”代表SH24,“13”代表SH25,“14”代表SH27,“15”代表SH30,设定预测得分结果偏差在±0.1以内为种间分界线。结果表明,只有钩状石斛样品SH17-12预测偏差超出范围,该样品预测值被判定为长距石斛(SH21)种,对预测集样品预测的正确辨别率为97.92%,获得了较理想的预测结果。

Table 4 Prediction results of 48 different species of Dendrobium samples by PLS-DA

 

预测样品序号

真实值

预测值

预测样品序号

真实值

预测值

预测样品序号

真实值

预测值

SH5-9

1

0.92669

SH14-1

6

5.99463

SH21-7

10

9.94809

SH5-10

1

0.94812

SH14-2

6

6.00678

SH22-1

11

10.99660

SH5-11

1

0.94812

SH14-3

6

5.98718

SH22-5

11

11.03772

SH6-1

2

1.93085

SH14-4

6

5.96762

SH22-10

11

10.92521

SH6-2

2

1.93253

SH14-8

6

5.96968

SH24-1

12

12.03153

SH6-3

2

1.98941

SH15-1

7

6.94878

SH24-5

12

11.95934

SH8-1

3

3.04933

SH15-4

7

7.08712

SH24-6

12

11.96263

SH8-4

3

3.08173

SH15-9

7

7.02798

SH25-1

13

12.98260

SH8-7

3

3.06314

SH17-1

8

8.01556

SH25-6

13

12.99971

SH8-11

3

3.06131

SH17-11

8

7.95449

SH25-10

13

12.99295

SH9-2

4

4.08579

SH17-12

8

10.97477

SH27-1

14

14.07461

SH9-4

4

4.02477

SH20-1

9

8.94656

SH27-6

14

13.96527

SH9-6

4

4.00395

SH20-3

9

8.95391

SH27-8

14

13.99775

SH12-5

5

5.00843

SH20-7

9

8.92458

SH30-3

15

14.98733

SH12-8

5

4.92110

SH21-1

10

10.08649

SH30-7

15

14.96771

SH12-10

5

4.94895

SH21-4

10

9.93511

SH30-9

15

15.04402

3 结论

应用近红外漫反射光谱法采集15种171份石斛样品,随机选5份不同种的样品平行采集30次,通过SIMCA 软件Hotelling T2对所采集的样品进行稳定性分析,结果显示近红外光谱用于采集石斛样品稳定性较好。为准确鉴别不同石斛种,利用正交试验设计对所采集的光谱进行优化处理,通过选择6500 cm-1~4000 cm-1的光谱波段,采用段长为3,段间距为5的Norris 平滑处理和二价微分去除高频波段的噪声,使用MSC对石斛样品进行判别分析,优化提取主成分数为7时,判别正确率为100%。将正交试验设计的优化结果作为PLS-DA的输入值建立石斛鉴别模型,该模型的正确识别率达到97.92%,获得了理想的预测精度。该方法的建立表明,利用近红外光谱技术结合现代化学计量学,可以快速、准确、无损的对石斛种类进行鉴别。通过光谱的优化处理,采用PLS-DA方法建立石斛的鉴别模型用于预测未知样品精度较高。该方法的建立为石斛的快速鉴别提供了一种新方法,同时对中药材真伪和种类的鉴别提供参考。

参考文献

[1] Dressler Robert L. Phylogeny and classification of the orchid family. Cambridge: Cambridge University Press, 1933.

[2] JI Zhan-he (吉占和). Journal of Systematics and Evolution (植物分类学报), 1980, 18(4): 427.

[3] FU Juan, DU Jing, HUANG Lin-fang (付娟, 杜静, 黄林芳). Journal of Guangdong Pharmaceutical University (广东药学院学报), 2013, 29(1): 1.

[4] Liu X H, Xu C H, Sun S Q, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2012, 97: 290.

[5] DING Yong-li, WANG Yuan-zhong, ZHANG Ji, et al (丁永丽,王元忠,张霁,等). Spectroscopy and spectral analysis (光谱学与光谱分析), 2013, 33(2): 471.

[6]ErikssonL,JohanssonE,Kettaneh-WoldN,etal.Multi-and megavariate data analysis, Part Ⅰ: Basic principles and applications. Second revised and enlarged edition, Umetrics AB, 2006.