当前位置:轶方文库网 > 专题范文 > 公文范文 >

基于深度学习模型的伽马能谱解析方法

时间:2023-09-11 19:50:05 来源:网友投稿

赵 日,刘 娜

(1.中国辐射防护研究院,山西 太原 030000;
2.核药研发转化与精准防护山西省重点实验室,山西 太原 030000)

传统伽马能谱解析方法亦称为峰分析法,它通过滤波定位、基底扣减、峰拟合等算法分析能谱中的光电峰[1-2]。然而,该方法在弱峰、重峰、高本底等情况下误差较大,易造成核素漏识别和误识别,且活度估算不准确。另一些能谱解析方法,如逐道最小二乘法、能谱重建法等对测量条件、标准谱获取、响应矩阵构建等方面均有较严格要求,只能在特定条件下使用,应用范围较有限。

近期,随着人工智能技术的快速发展,基于人工神经网络(artificial neural network, ANN)的伽马能谱解析方法成为研究热点。Qi等[3]使用4层全连接神经网络(fully connected network, FCN)进行了点源测量条件下的NaI探测器低计数伽马能谱核素识别研究(核素共14种,单能谱只含1种);
Daniel等[4]使用5层卷积神经网络(convolutional neural network, CNN)实现了CdTe探测器能谱的核素识别(核素共6种,单能谱最多3种);
Kim等[5]基于3层FCN进行了塑料闪烁体能谱解析研究(核素共4种);
Zhang等[6]针对LaBr3(Ce)探测器测量钚和高浓铀样品开展了基于3层FCN的核素识别(核素共2种);
Sahiner等[7]将3层FCN应用于中子活化伽马能谱解析(核素共5种);
Jhung等[8]用4层FCN辅助LYSO探测器识别137Cs和152Eu混合源;
Kamuda等[9]报道了3层FCN驱动的NaI探测器自动核素识别(核素共32种,单能谱最多5种);
Chen等[10]报道了2层FCN在NaI探测器能谱解析上的应用结果(核素共8种,单能谱最多2种)。

然而,已有基于ANN的伽马能谱解析研究存在两个明显缺陷:均使用了浅层ANN架构(FCN至多5层,仅1例使用CNN),而浅层ANN只能实现简单的输入输出映射,无法进行深度、层次性特征提取,从而限制了已有研究对伽马能谱全谱特征的精细化表征能力;
ANN均直接与核素种类关联,造成其训练和识别必须依赖预设核素库。实际测量中难以提前预测对象所含核素种类,而一旦核素库设置不准确,即会造成核素漏识别、误识别。

为弥补上述缺陷,本文将深度学习概念引入伽马能谱分析,构建较已有模型显著加深、加大的ANN架构,并改进ANN的预测模式,突破对预设核素库的依赖,提高方法的通用性和应用潜力。

1.1 模型架构设计

本文针对伽马能谱数据特征,设计了包含51层、超107参数的深度神经网络模型。模型的输入为伽马能谱各道计数,输出则通过独特设计直接与放射源出射的伽马射线能量、数量对应。

相较于已有研究使用的全连接网络等浅层架构,本模型架构的最大特征是引入了残差卷积模块。残差卷积模块是当前图像识别、分类等领域主流深度学习模型的关键构成单元[11-13],它不仅继承了卷积操作所特有的对样本特征的多尺度精细化提取能力,同时,通过将前层输出值跨层连接到后层实现跳跃连接[14],使目标函数的梯度能跨层反向传播,避免过拟合和梯度消失,显著提高模型泛化性能。将残差卷积模块应用在伽马能谱解析中,可全面提取能谱不同尺度的形态特征;
同时,能谱数据维度较高,必须进行多层、深度提取才能形成最终清晰、稳定的高层抽象特征,而残差卷积模块的数值特性则恰好确保了多层卷积网络的构建,实现特征深度表征。

在具体实施中,本文构造了两类残差卷积模块R1和R2。R1、R2的具体结构如图1所示。R1用Din、Dout、Chin、Chout4个参数表征,Din、Dout分别表示R1的输入、输出数据维数,Chin、Chout分别表示R1的输入、输出数据通道数;
R2用D、Ch 2个参数表征,D表示输入输出数据的维数(R2的输入输出数据维数相等),Ch表示输入输出数据的通道数(R2的输入输出数据通道数相等)。R1不仅实现能谱特征提取,还实现数据降维,每次将维数降至1/2并使数据通道加倍;
R2作用与R1类似,但保持数据维度和通道数恒定。图1中,Conv1D(k,s)表示1维卷积,其参数k、s分别表示卷积核宽度和卷积步长;
Ch1、Ch2、Ch3分别表示相应卷积核的通道数,R1中Ch1=Ch2=Chout/4,Ch3=Chout;
R2中Ch1=Ch2=Ch/4,Ch3=Ch;
BN(batch normalization)为批标准化层;
ReLU(线性整流单元)为激励函数。

a——Ⅰ类残差模块(R1);
b——Ⅱ类残差模块(R2)图1 所构造深度学习模型中的残差模块Fig.1 Residual modules in constructed deep learning model

图2示出了本文构造的深度学习模型的完整结构。该模型由1个输入层、4个R1-R2联合模块、1个全连接层和1个输出层串联构成,其中,输入层维数取常见伽马能谱道数值1 024,其他能谱道数可通过分道和并道进行匹配;
R1-R2联合模块含1层R1和3层R2;
R1、R2的内部参数,如卷积核宽度、卷积通道数、卷积层数等是在参考图像识别领域相关主流模型设计技巧的基础上,通过大量仿真实验反复测试优化后确定的。基于简洁性考虑,本文只给出了模型最终版本,具体优化过程略去。

图2 所构造的深度学习模型完整结构Fig.2 Complete structure of constructed deep learning model

该模型通过12个残差卷积模块实现能谱特征的反复抽象和提取,并将数据维度从输入的1 024降为16,将数据通道升至256。能谱的全部特征最终包含在该16×256维数据中,最后的全连接层则实现能谱特征与输出值间的满射。

由于R1和R2各包含3个卷积层,12个残差卷积模块再加上输入、输出层以及全连接层,整个模型共包含51层神经网络,总参数量则超过107个。

1.2 模型输出设计

已有研究中模型输出值直接与核素种类对应,虽较直观、便捷,但也决定了其训练和识别时须预设核素库,该库仅能包含少数几种核素,且只能根据经验设置。为弥补该缺陷,本文对模型输出层进行独特设计,具体考虑如下:核素出射的初始伽马射线具有特定的能量,用能谱描述时,该出射谱中仅在少数孤立道有计数,计数值与核素活度、测量时长、射线分支比相关,而其余道计数均为零。如果模型直接输出核素出射谱,给出更底层的初始伽马射线信息,则不仅同样可实现核素识别与活度计算,且无需对核素种类进行范围限制。

本文在实际实施中,用模型输出层神经元表示核素出射谱各道,各神经元所表示能量可自由定义,这里基于输入能谱的能量刻度函数确定神经元序号与能量对应关系,而神经元取值则对应各道计数。模型训练时,根据仿真能谱生成时所设置的伽马射线能量和数量设置模型输出值,通过训练使模型学习并建立起探测器测量谱与核素出射谱之间的映射关系;
应用时,模型根据输入谱直接给出核素所有伽马射线信息,但为滤除输出值较小时带来预测结果的偏差,设置阈值D,略去小于D的神经元取值,如图3所示。

图3 输出层设置示意图Fig.3 Illustration of output layer setting

D与模型预测效果直接相关,训练时通过下述过程得到最优值。

对固定的D,在训练集上计算该条件下的F1。F1是一权衡了识别敏感度和抗干扰能力的因子,定义如下:

(1)

其中:P为预测精度;
R为召回率。P和R的计算公式如下:

(2)

(3)

其中:真阳性数为被正确识别的伽马射线个数;
假阳性数为被错误识别的实际不存在的伽马射线个数;
假阴性数为真实存在但未被正确识别的伽马射线个数。

变化D可得F1曲线,F1取极大值时对应的即为最优D。

1.3 其他参数选择

根据输出层各道计数归一化特性,使用深度学习中常用的softmax函数作为输出层规范函数;
同时,为评价伽马射线能量和数量的预测值与真值间的接近程度,使用二进制交叉熵(binary cross entropy)作为机器学习损失函数。模型训练时,采用随机梯度下降算法,批数据量取32,学习率取10-3,迭代训练次数取30。

2.1 实验场景

构建的基于深度学习模型的伽马能谱解析方法具备通用性,不局限于特定场景使用。然而受实验室条件限制,本文基于现有仪器设备,选取自主搭建的NaI型WBC(全身计数器)测量人体放射性这一场景进行伽马能谱解析性能测试。

WBC获取的人体伽马能谱非常适合于开展能谱解析性能评估[15],这是因为:首先,NaI探测器的能量分辨率较差,其所测能谱中光电峰展宽严重,能谱信噪比低,且重峰现象较普遍,因而对能谱解析方法的灵敏度、准确性有较高要求;
其次,人体所含放射性核素活度通常较低,造成能谱中的光电峰很弱,进一步加大了核素识别的难度;
最后,人体是一大体积源,对伽马射线有显著散射作用,更降低了能谱的峰康比(光电峰和康普顿散射计数幅值比),从而需更优的能谱解析方法。

2.2 训练集构建

对2.1节中的测量场景进行精细数字建模,如图4所示,使用人体模型代表人体,通过计算机蒙特卡罗模拟技术生成该场景下大量仿真伽马能谱,形成训练数据集用于模型训练。

图4 测量场景数字模型 Fig.4 Digital model of detecting scenario

设置蒙特卡罗模拟参数时,伽马射线源粒子种类、能量、数量3个参数不与特定核素关联,而是以随机抽样方式产生更丰富、复杂的参数组合。随机抽样方式如下:单个能谱模拟中的伽马射线源粒子种类取随机整数值(范围1~10,这里的种类即不同能量),各种源粒子的能量取随机浮点数值(范围0.01~3.00 MeV),源粒子数量随机确定,范围根据真实内污染情况下常规测量时长(一般数分钟)和常见内污染核素活度(一般102~103Bq)确定。此外,源粒子根据常规实际情况设置为体内均匀分布,伽马能谱展宽函数取实测拟合值。最终生成了含105个能谱样本的训练集,样本例如图5所示。

图5 训练集能谱示例Fig.5 Example of spectrum in training set

2.3 仿真测试实验

开展基于仿真能谱的测试实验。不同于训练集,构造测试集时为能直接进行核素识别和活度计算的测试,仿真模拟时伽马射线源粒子与核素直接关联。具体来说,选定核设施职业内照射监测中常见的9种放射性核素[16-17](表1),单个能谱中核素种类在9种中随机选择1~5种(鉴于已有研究在单能谱的核素设置上均未超过5种)。核素活度在102~103Bq内随机取值。假定测量时长5 min,根据核素活度、伽马射线实际能量、分支比,设置源粒子能量、数量。最终生成了含100个能谱样本的测试集,样本例如图6所示。

表1 核设施职业内照射监测常见9种放射性核素及射线信息Table 1 Nine common radionuclides and their radiation informations in occupational internal exposure monitoring of nuclear facilities

图6 测试集能谱示意Fig.6 Example of spectrum in testing set

测试时,根据深度学习模型预测的核素出射谱进行核素识别和活度计算,具体方法如下。

若预测的伽马射线能量与真值相对误差小于3%时,则认为该伽马射线被正确识别,即:

(4)

其中,E、E′分别为伽马射线能量预测值与真值。

若某核素所有伽马射线均被正确识别,则认为该核素被正确识别,否则未被识别。

对被识别的核素,若预测的核素出射伽马射线数量为N,则核素活度为:

(5)

其中:T为测量时长,取5 min;
η为分支比。注意,计算活度时不需探测效率,因为N直接为核素出射射线数量。

当核素有m个伽马射线时,使用加权最小二乘法确定核素活度:

(6)

为进一步说明本文所构造深度模型的优势,对测试集同时采用传统峰分析法[15,18-19]、能谱重建法[20]以及浅层ANN模型进行能谱解析,并与本文所建模型的结果进行比较。

2.4 实测实验

基于仿真数据完成测试后,开展实测实验。使用WBC测量一含134Cs、137Cs、57Co、60Co的仿真人体物理模型,核素活度分别为3 849.6、2 879.5、5 498.2、4 023.1 Bq,比较各方法的核素识别和活度估算结果。其中深度学习模型、浅层ANN模型由2.3节训练而来。实测时测量10次能谱,各方法的核素活度结果取10次的平均值。实验前已对探测系统进行了能量刻度,效率刻度则采用蒙特卡罗仿真模拟结果。

3.1 仿真测试结果

用于测试的100个能谱中共含326个核素(核素类型9种)。本文统计了深度学习模型及3种对比方法的核素总识别率、漏识别率、误识别率3个指标,分别由被识别核素总数、漏识别核素总数、误识别核素总数除以核素总数得到;
同时,根据各方法给出的核素活度,计算活度计算平均误差值。

结果列于表2,本文构造的深度学习模型性能最好,其核素识别率达到了93.3%,且漏识别率、误识别率均小于5%,活度计算的平均误差小于10%;
峰分析法性能最差,核素识别率仅为62.3%,且漏识别情况普遍,误识别也超过了10%,活度估算误差高达28.3%;
能谱重建法与浅层ANN模型的解析性能较为接近,核素识别率在80%左右,漏识别仍较普遍,误识别有明显抑制,均小于10%,活度计算误差同样较大。

表2 4种方法在测试集上的性能比较Table 2 Performance comparison of four methods on testing set

3.2 实测实验结果

对于实测能谱,各种方法的解析效果如图7所示(取10次中的1次),其中,深度学习模型、能谱重建法、浅层ANN模型均直接给出核素出射谱,即核素出射伽马射线的能量和数量,而峰分析法则展示了其峰定位算法的卷积滤波结果(基底扣减与峰区拟合结果未展示),所得曲线的极小值点即为峰位。峰识别及核素活度计算详细结果列于表3、4(均为10次分析的平均结果)。表3显示,深度学习模型、能谱重建法、浅层ANN模型均成功识别出6条伽马射线,而峰分析法则在83.5 keV处有误识别情况;
对正确识别的射线,峰分析法误差最大,其余三者较接近;
各方法在峰识别中均存在一定误差,这是由于实测能谱的“温漂”造成的。表4显示,深度学习模型的活度估算误差最小,各核素均小于10%,峰分析法误差最大,最高达-35%,能谱重建法与浅层ANN模型的误差也相对较大。

a——深度学习模型效果(实测能谱幅值放大了103倍);
b——峰分析法峰定位效果;
c——能谱重建法效果(实测能谱幅值放大了103倍);
d——浅层ANN模型效果(实测能谱幅值放大了103倍)图7 4种方法在实测能谱上的解析效果对比Fig.7 Analysis comparison of four methods on measured spectrum

表3 4种方法在实测能谱上的峰识别效果对比Table 3 Comparison of peak identification of four methods on measured spectrum

表4 4种方法在实测能谱上的活度估算效果对比Table 4 Comparison of activity estimation of four methods on measured spectrum

各种方法在测试集上的性能差异的原因如下。

峰分析法误差最大,因为它只利用了能谱局部的峰形特征而忽视了大部分区域的计数信息,峰形特征在弱峰、重峰情况下不够显著,容易造成漏识别,由散射等因素形成的与光电峰相似的假峰结构也容易被误识别;
同时,峰区基底扣减、净计数拟合等在低峰康比、大统计涨落条件下误差也较大。相比而言,能谱重建法、浅层ANN模型、深度学习模型在解析能谱时不局限于峰区计数,利用了全谱信息,信息量更大、更全面,其核素识别的效果也更好;
且进行活度推断时,无需计算峰净计数,也不显式地使用探测效率,而是将其蕴含在响应矩阵或神经网络中,因而也一定程度减少了误差来源。

然而,能谱重建法、浅层ANN模型同样有其固有缺陷。能谱重建法依赖于精确的响应矩阵,这在实际难以实现;
同时响应矩阵各列高度相关,矩阵高度病态,显著增大了求解结果的误差。浅层ANN模型的参数量少、层次性差,严重制约了其特征提取能力。此前研究者应用浅层ANN模型时将预测任务限制于少数几种核素,模型输入输出映射关系相对简单,模型学习难度降低,因而可得到较好效果。本文则需ANN直接预测伽马射线能量和数量,映射关系复杂,此时,浅层架构的弊端显现,导致了不可忽视的预测误差。

深度学习模型则弥补了现有方法各方面的缺陷,以更多的层数和参数量实现对伽马能谱全谱信息多层次、高精度提取和表征,且残差结构、梯度下降算法等确保了其数值迭代精度,实现了在训练集上的充分训练,大幅提高了在测试集上的准确性。

3.2节实测实验的测试结果进一步印证了上述分析结论。实测能谱中,在80~100 keV附近出现了由较高能量伽马射线散射形成的散射峰,峰宽与该区域光电峰非常接近,因此造成了峰分析法的误识别,进而在拟合峰净计数时严重低估了122.1 keV伽马射线全能峰净计数,显著低估了57Co活度。同时,134Cs的604.7 keV伽马射线与137Cs的661.7 keV的伽马射线在能谱中形成较复杂重峰,给峰分析法的基底扣减和峰净计数拟合带来很大难度。该方法明显高估了134Cs活度并低估了137Cs活度。能谱重建法受求解算法精度的影响,得到的核素活度误差同样较大,且无明显规律可循。浅层ANN模型由于其有限的特征提取能力,对能谱中高峰康比的高能区解析精度较高,而在特征复杂的低能区解析误差较大。

本文针对已有伽马能谱解析方法在精度、通用性上的缺陷,设计、建立了能谱解析专用深度学习模型,利用多个残差卷积模块实现对伽马能谱全谱信息的多层次、精细提取与表征;
同时,对模型输出层进行了独特设计,使其能够直接预测核素出射的伽马射线能量和数量,无需提前预设核素库,拓宽了识别核素的范围,增强了方法的通用性。最终建立的深度学习模型含12个残差卷积模块、51个神经网络层、超107个参数,相较已有能谱解析ANN在模型深度、参数规模上大幅提高。测试实验环节,针对实验室自建的全身计数器,基于其测量人体放射性场景开展实验。具体实施上,首先使用蒙特卡罗模拟构造了含105个样本的训练集,完成模型训练后,构造了含核设施职业内照射监测中常见9种放射性核素的仿真伽马能谱测试集,测试了模型核素识别率和活度预测误差,并与峰分析法、能谱重建法、浅层ANN模型进行了比较。测试结果表明,深度学习模型核素识别率93.3%、活度计算平均误差8.6%,相较峰分析法的62.3%、28.3%、能谱重建法的78.2%、18.7%、浅层ANN模型的81.3%、14.8%优势明显。实测实验中,深度学习模型正确识别所有伽马射线,不存在误识别情况,且活度预测误差小于10%,显著优于其他3种方法。仿真和实测实验结果证明了方法的准确性、可靠性,说明了深度学习在特征提取与数值稳定性上的突出能力,显示了该方法未来付诸实际的应用潜力。

猜你喜欢伽马射线伽马核素我国观测到迄今最亮伽马射线暴科学之友(2022年11期)2022-11-03核素分类开始部分的6种7核素小片分布商丘师范学院学报(2022年9期)2022-08-16瞬发伽马中子活化分析技术在重介分选智能控制中的研究与应用选煤技术(2021年3期)2021-10-13中子伽马曲线受到自然伽马污染影响分析及消除原理石油管材与仪器(2021年1期)2021-04-13核素分类的4量子数商丘师范学院学报(2020年3期)2020-01-09三大抽样分布的理解与具体性质数学学习与研究(2019年12期)2019-08-07Understanding Gamma 充分理解伽马家庭影院技术(2018年8期)2018-08-213变量7×7核素区的公共区域商丘师范学院学报(2018年3期)2018-03-20伽马射线波段的地球与天空飞碟探索(2014年1期)2014-03-04植物对核素锶的吸附与富集作用研究现状癌变·畸变·突变(2014年6期)2014-02-27

推荐访问:深度 模型 解析