婁月申 郭文軍?
1) (上海理工大學物理系,上海 200093)
采用貝葉斯深度神經網絡對液滴模型進行優化改進,并運用KL (Kullback-Leibler)散度與變分推斷的方法使得模型便于實現.以最新的原子核數據(AME2020)中2457 個有精確值的原子核(Z ≥8 和 N ≥8)作為總數據集,隨機選取其中80%的數據為訓練集用于模型訓練,通過預測余下的20%進行模型驗證.最終兩個數據集的誤差均方根(RMS)基本相等,而且全部數據的RMS 從2.9894 MeV 降到0.5695 MeV,下降了80%,呈現出較好的結果.此模型進行了輸入參數上的改進(區域限定策略),使得未知核(Z =118—126)可以被限定在一個固定的區域內,從而提高了預測的準確性.為了驗證這一性質,對實驗數據(Z =100—117)進行了預測計算,結果也與實驗值符合得很好.最后使用該方案對未知元素 Z =118—126 進行了預測,為以后尋找新元素提供了新思路.
原子核內部的結構信息和動力學信息是核物理研究的重要任務.而且對原子核結合能的準確認識,在天體物理學中也有著極為重要的作用[1–5].原因是,結合能的準確描述可以用來幫助理解恒星的形成、演化及其最終的命運.因此,憑借與天體物理的精密聯系,核物理可幫助理解宇宙中的元素,也可相應地提供未知元素的預測.在兩個學科所定義的物理量中,核質量的重要性不言而喻,因為這個物理量包含了所有的強相互作用量.而且,原子核的質量與結合能是原子的基本屬性,可作為識別不同原子核的一種可靠的方式,類似于指紋識別.此外,精確的核質量測量也可應用于核物理以外的各個領域,如計量學、量子電動力學及元電荷的測量[6–8].在核天體物理學中需要一些可靠的性質,如原子質量、半衰期和不穩定核的反應截面.而在這些基本性質中原子核質量為一個重要的量,它對于估計核轉變速率、能量以及理解宇宙中元素的豐度分布都起到了至關重要的作用.但是實驗測量目前有著些許不足,如r-過程路徑實驗在一些核素的測量中有不盡人意的表現,而且大多數的原子核都在實驗已知的區域之外.而且,核結構還有一個重要的挑戰,即靠近“滴線”邊界的計算.因此,使用理論方法代替實驗方法進行相應的計算是不可避免的.此外,準確地確定質量值對測試Cabibbo-Kobayashi-Maskawa 矩陣的統一性十分重要,但現今仍存在3 個主要問題:1)如何產生豐中子原子核;2)如何將SMS(Schottky mass-spectrometry)的時間范圍擴展到壽命較短的核上去;3)如何得到不穩定的豐中子原子核,如在“等待點”,這對于加深理解r-過程有著極其重要的作用.雖然在亥姆霍茲重離子研究中心(GSI)的近期實驗中,已找到了解決第一與第二個問題的初步方法.但對于第三個問題,目前的GSI 設備還沒有很好的解決方案[9,10].因此,還是需要依賴于核質量的理論模型,來預測未知但重要的原子核的核質量.所以,全局核質量模型一直是主要的研究目標.
當下,全局核質量模型大致可分為兩類:微觀模型與宏觀-微觀模型.微觀模型如Hartree Fock Bogoliubov (HFB)[11]和相對論平均場模型[12].其中,前者可以很好地表現出核子之間的配對相關性,后者則可以很好地描述結合能對同位旋的依賴關系,這使得此模型可以可靠地應用于奇異原子核的理論計算.宏觀-微觀模型如Royer’s 公式[13],該模型推導出976 個奇異核;Thomas-Fermi 模型[14]在Z≥88的范圍內有著很好的計算結果,但是在全局范圍內有著很大的偏差;Duflo and Zuker (DZ)模型[15]有著良好的外推能力與計算結果,但是年代過于久遠;有限力程小液滴模型(FRDM)[16,17]與Weizs?cker-Skyrme (WS)模型[18]考慮了變形對宏觀能及鏡像核約束的影響,并將宏觀能的同位旋相關分量近似到Woods-Saxon 勢的深度;Warsaw局域重核模型 (HN)[19]在描述重核方面有著很好的優勢;WS3+[20]和WS4+[21]也是兩個重要的模型,它們使用的是徑向基函數 (RBF)[20].然而,上述模型的計算值對現有數據的計算以及預測與實際都相差了幾MeV,或者只在一定范圍內有效,雖然改進后有了一些提升,但是在超過適用范圍后往往就可能出現較大的偏差,因此預測效果就會有所折扣.
在全局核質量理論計算的研究目標驅使下,到目前為止,各類模型都有了很大的進展.其中就包括液滴模型(LDM)[16]的改進.雖然液滴模型很簡單,但它經過不斷的改進,計算準確性也在不斷地提升.原因是,LDM 認為原子核是一個不可壓縮的液滴,由質子和中子兩種量子流體組成,計算的結合能隨質子和中子的變化而平穩變化.而根據Strutinsky’s 能量定理[22],結合能由兩部分組成:第一部分大而平滑,第二部分小而可變.LDM 雖然成功擬合出了第一部分,但卻無法解釋殼隙周圍的波動.
以改進第二部分結合能存在的問題入手,通過對LDM 的改進,本文實現了新的理論計算方法.現在所知的理論計算方法有3 種:傳統方法、第一性原理及時下最流行的機器學習方法.傳統方法因有大量的猜測,所以大多準確性不足.第一性原理方法基于核子之間的相互作用,計算原子核的結合能,雖然可靠但是有效性與程序的可實現性有待提高.而機器學習方法,在實驗能提供越來越多可靠數據的基礎上,以機器學習作為模型或者改進優化,來評價和預測所獲得的結果,更加的可靠而且高效,可用來解釋由于核相互作用的影響而產生的質量波動及對未知區域的預測.現今有很多強大的統計學習方法,其中機器學習方法是使用最頻繁最有效的.機器學習也有很多的選擇,如人工神經網絡(ANN)[23]、貝葉斯神經網絡(BNN)[24]、支持向量機(SVM)[25].但由于BNN 是使用概率方法進行建模,因此有著量化不確定性的能力,所以在現有基礎上可以更加可靠地預測未知元素.得益于現今硬件的發展,BNN 進行了相應的改進,提升為貝葉斯深度神經網絡(BDNN).神經網絡對于結果和決策過程的解釋可通過輸入參量進行大致表現,可是由于傳統的神經網絡的參量為一個確定的值,所以只能在確定的范圍內有好的結果,跳出確定范圍后卻有著難以預估的偏差.但BDNN 有所不同,其使用概率方法提供了一個函數輸出的完整分布并可以識別預測中的不確定性,可在置信區間內確定出更加精確的預測值,很適合進行需要外推的任務[26].另外,用于訓練的實驗數據也有著不可避免的誤差,BDNN 對網絡參數的概率分布處理,可以很好地解決這一問題,因此在假設有其他未知不確定性的影響下,可以實現可靠的預測,也不易出現過擬合的情況[27].
本文使用宏觀-微觀模型的思想對全局核質量模型進行優化,并改進了輸入參量.提出使用區域限定策略為輸入參量的LDM+BDNN 模型,提升了已知原子核的理論計算能力以及對未知核的外推能力.在已知的數據中表現良好,并實現了全局模型的改進與原子核可探測范圍的預測修正.
在模型建立的經驗上,宏觀-微觀方法在解釋核質量計算的波動部分取得很好的成效,它利用微觀修正來解釋宏觀模型所缺失的復雜物理現象[28].本文基于上述方案創建了一種新的算法,即LDM+BDNN,主要用于未知核的預測.LDM+BDNN 模型分為宏觀、微觀兩個部分.模型公式為

其中,宏觀部分為LDM 模型,微觀部分為δLDM.LDM 模型的定義如下[29,30]:

其中,A,Z,Tz為質量數、質子數及同位旋的第三分量;av,kv為體積能的同位旋依賴;asks為表面能的同位旋依賴;ac為庫侖能;fp為對稱能.

式中dn,dp和dnp為奇偶效應中的可調參數.
液滴模型的所有可調參數通過最小二乘法來確定,所用的數據為符合Z≥8 和N≥8條件的2457 個原子核,這些核均來自于最新的原子核質量評估(AME2020)[31].最小二乘法X2函數為

擬合后的結合能誤差均方根為2.9894 MeV,如圖3 所示.結果表明,該模型在雙閉殼核中存在較大偏差,并有較大波動,顯示出了LDM 的缺陷.本文旨在盡可能地模擬結合能的波動部分δLDM.

圖3 δ E 為2457 個核素的實驗值與理論計算值的誤差均方根,其中黑點為LDM 模型的理論計算值,紅點為LDM+BDNN 模型的理論計算值Fig.3.δ E is the root mean square error of the experimental values and theoretical values of 2457 nuclear,the black spots are theoretical calculation value of LDM model,red dots are the LDM+BDNN theoretical calculation values of the model.
在(1)式中,本文將δLDM視為統計推理問題.概率解釋方法主要分為兩種:頻率派和貝葉斯派.頻率派認為,抽樣如果是無限的,那么決策規則就可以清晰地表現出來.數據作為可重復的隨機樣本,有一定的頻率.因此所建立模型中的參量為一個可固定的常量.但貝葉斯派有不同的看法,他們以概率的方法處理未知的量,參數應作為一個概率分布,不應作為一個常量,這樣才可以得到更準確的結果.貝葉斯定理如(5)式所示,它提供了給定數據集D與給定假設H之間的聯系[32].

式中,p(H|D)是給定數據集D假設為真的概率,p(H) 為先驗概率,p(D|H)為似然概率.
使用 (x,t)≡D作為相關的輸入輸出數據,ω ≡H表示完整的模型參數,后驗概率則定義為[33]

其中,p(x,t|ω) 為似然概率,p(ω) 為參數ω的先驗分布.
本文將深度神經網絡模型定義為

式中,模型中的參量為ω={a,bk,ck,dkj,ej,fji};H1和H2為隱含層節點數;n為輸入參數,包括(Z,A,Z?Z0,Z?Z1,N?N0,N?N1).在輸入參數n中Z,N和A分別為給定原子核的質子數、中子數及質量數.N0,1和Z0,1表示相應的幻數.分別為(N) 8,20,50,82,126,184 以及(Z) 8,20,50,82,126.而N0,1(Z0,1)的值是通過給定原子核在它附近上下左右的4 個幻數確定的(見圖1),此為本文新改進的區域限定策略.具體思想為,將一個核素通過與其鄰近的4 個幻數進行計算得到一個獨特的限定區域的效果.此方法可以提高各個核素的差異性,并且可以在外推預測時,將外推近似為內推,極大地增強了預測的穩定性.

圖1 假設原點為給定原子核,取上下左右4 個幻數與其的差值作為限定條件,近似地將給定核限定在一個固定范圍內,進而起到提高穩定計算與外推未知核結合能的作用Fig.1.The origin is assumed to be a given nucleus,and the difference between the four magic numbers above,below,left and right is taken as the limiting condition to approximately limit the given nucleus within a fixed range,thus improving the stability calculation and extrapolating the binding energy of unknown nuclei.

表1 液滴模型所有參數的最佳值Table 1.The best value of all parameters in the LDM.
深度神經網絡的結構示意圖如圖2 所示.

圖2 一個雙隱含層的貝葉斯深度神經網絡,其中有6 個輸入參量(Z,A, Z?Z0,1 , N?N0,1)和一個輸出參量 F=δLDM Fig.2.A double hidden layer Bayesian deep neural network.six input parameters are (Z,A, Z?Z0,1 , N?N0,1)and the output parameter is F =δLDM.
正如上述所講,宏觀部分使用LDM 體現,但并不能很好地解釋原子核結合能的所有變化,因此使用BDNN 來代替修正原子核結合能劇烈波動的部分(δLDM).在確定好LDM+BDNN 方法的基礎之后,就可以開始進行模型訓練了.首先在最新的原子核數據(AME2020)[31]中提取2457 個有精確數值的原子核結合能,原因是可以最大程度地削減錯誤數據帶來的誤差,保證模型預測的準確性.然后將所有數據隨機打亂并分成80%的訓練集和20%的預測集,用來驗證模型是否準確.計算結果見表2.

表2 對于AME2020 中提取的2457 個實驗數據采用LDM 和LDM+BDNN 模型進行運算.給出訓練集(1966)、預測集(491)以及整體核素的理論計算結果與實驗值的誤差均方根Table 2.LDM and LDM+BDNN models were used to calculate 2457 experimental data extracted from AME2020.The RMS of error between the theoretical calculation results and experimental values of the training set (1966),the prediction set (491),and the whole nuclide are given.
從表2 可以看出,訓練集、預測集以及整體的理論計算與實驗值的誤差均方根基本相同,在表明模型結果良好的同時,在預測方面因區域限定策略的作用也表現出了很好的效果,并且沒有出現過擬合的現象,體現出很好的魯棒性.而在表3 中本文模型與LSD,FRDM,FRDM12,TF,HF-B21,GHFB,KTUY[34],Bhagwat[29],LMNN[28]9 種全局模型進行了對比.在和前7 種微觀、宏觀-微觀模型的結果對比中,即使使用最新的原子核數據進行計算對比,本文的計算結果也大多優于他們.但對比后兩個模型,本文的計算結果有些許不足,原因在于本次研究主要聚焦于新的輸入策略和BDNN 在未知核外推方面的能力,所以犧牲了部分準確性,不過該問題可以通過引入更多準確的數據進行改進.但是,整體的誤差均方根也還在可接受的范圍內.

表3 LDM+BDNN 與其他全局模型計算結果的對比Table 3.Comparison of calculation results of LDM+BDNN with other global models.
為了更直觀地展現出本文模型的計算效果,給出了計算值和實驗值的誤差(δE)圖,如圖3 所示.
從圖3 可以看出,原模型在雙閉殼核處存在較大的誤差,而在加入BDNN 優化后,幾乎消除了LDM 模型在計算結合能時產生的一些大的波動,使得幾乎所有核素的結合能都能集中在一條緊密的粒子群區域,只存在一些輕微的波動.為了能夠更清晰地看出哪些區域的核素存在波動較大的問題,使用幻數對核素圖進行了區域劃分,繪制了全部2457 個核素以及預測的491 個核素誤差均方根的核素圖,以確定在哪個區域的核素計算結果較差,如圖4 所示.

圖4 (a)所有2457 個核素的誤差均方根的核素圖;(b)隨機選取的491 個預測核素的核素圖.其中的顏色代表實驗數據與LDM+BDNN 計算值的結合能誤差均方根Fig.4.(a) The root mean square error radionuclide diagram for all 2457 nuclides;(b) random selection of 491 predicted nuclides.The color represents the experimental data and the calculated value of the LDM+BDNN binding energy of the root mean square error.
研究結果表明,在幻數 50—82 和 82—126兩個區域中,核素誤差均方根呈明顯的規律分布.在50—82的區域中,誤差較大的核素呈垂直分布.而在 82—126的區域中,誤差較大的核素呈水平分布.并且在超重核的豐中子區域中有著較大計算誤差,原因可能是實驗數據的不足導致計算結果受到輕核與中核的影響.但從圖4(b)可以發現,新提出的區域限定策略與BDNN 的結合發揮了作用,極大地消除了在整體計算中的計算值與實驗值的誤差,并且在超重核區域也有著很好的改進效果,證明區域限定策略與BDNN 的結合表現出很好的預測穩定性.
為了保證外推預測的穩定性,對模型進行了更加嚴格的測試,檢測輕、中、重核的單、雙中子分離能,原因是這兩種觀測結果可以得到兩種不同的結合能之間的差異.在計算了所有核素的單、雙中子分離能(Sn,S2n),并與實驗值進行比較發現,Sn(S2n)與實驗的誤差均方根與質量公式所得出的結果一致,兩者符合得很好.圖5 選取了輕、中、重的Si,Nd 和Hg 原子核及其同位素的單、雙中子分離能與實驗符合得很好.為更好地體現計算值與實驗值的差別,圖5 中的插圖給出了誤差.

圖5 Si,Nd 和 Hg 原子及其同位素的單、雙中子分離能隨N 的變化,上排為單中子分離能 Sn ,下排為雙中子分離能 S2n ,實驗值由AME2020 提供(黑色方塊),理論計算值由LDM+BDNN 計算得出(紅色圓點).插圖給出了誤差Fig.5.Si,Nd and Hg atoms and their (Sn,S2n) vary with N.The upper row is Sn ,and the lower row is S2n.Experimental values are provided by AME2020 (black squares),and theoretical values are calculated by LDM+BDNN (red dots).The insets are the errors.
核素的奇偶效應也是影響結合能計算的重要參量,從圖6 中的結果可以看出,在原有模型的計算結果中,輕核與重核在奇奇核、奇偶核以及偶偶核區域均有較大的偏差,而BDNN 的引入極大地削減了核素的奇偶效應,使得輕、中、重 (8—90,91—180,181—270)核素在不同奇偶組合區域中的偏差近乎拉平.

圖6 輕、中、重核 (8—90,91—180,181—270) 在奇偶效應區分下的誤差均方根示意圖 (a) LDM 的計算結果;(b) LDM+BDNN 的計算結果Fig.6.The schematic diagram of root mean square error of light,medium and heavy nuclei (8—90,91—180,181—270) under parity effect differentiation:(a) the calculation result of LDM;(b) the calculation result of LDM+BDNN.
從圖4(b)可以看出,區域限定策略與BDNN的結合在預測方面有著很好的表現,因此,為了評估區域限定策略與BDNN 在外推方面的效果,在AME2020 實驗數據中選擇了訓練范圍之外Z≥100的核素,將預測值與實驗值進行比較,結果如圖7所示.可以看出,在訓練范圍外的重核區域,本文的模型體現了很好的預測結果.只有在Z=112 之后的核素才有些許偏差,其余的核素均貼合得很好,體現出了極強的預測能力,證明區域限定策略與BDNN 極大地提高了模型外推預測的穩定性.原因在于區域限定策略將核素的區域限定保證了區域核素的特殊性,而BDNN 利用概率學的方法提供了模型參量的整體分布(見文獻[27] 中的圖8),使其可以識別預測中的不確定性,進而得出準確的外推預測值.并且本文計算出了預測原子核結合能的計算誤差,如圖7(b)所示.在規定好BDNN 的置信區間為95%的條件下,預測計算的平均誤差為±2.96%.
有了圖7 的驗證,本文將外推的區域擴充到未知核的區域中,推斷了Z=118—126的超重核,這些超重核的中子數定義為N=Z—2Z.并選取10 個結合能最低的原子核作為確定值,原因是新元素的能量越低相對的穩定性就越強,這樣在實驗上就更容易發現,結果如圖8 所示.

圖7 (a)訓練范圍之外 Z =100—117 的核素結合能最小值的預測值與實驗值的誤差對比;(b) BDNN 預測值的系統誤差Fig.7.(a) Outside the scope of training Z=100–117 nuclide binding energy of the minimum of error comparison of the predicted values and the experimental value;;(b) system error of the BDNN predicted values.

圖8 (a)使用區域限定策略與BDNN 的結合,預測在(126,184)區域內未知的超重核,星號為本文預測的未知超重核;(b)外推結果(Z =50—126)與實驗結果(Z =50—126)的范圍對比,其中紅色的陰影為實驗值,藍色為預測值,外部虛線為整體變化趨勢,內部虛線為重核變化趨勢Fig.8.(a) Predicted the unknown superheavy nuclei in the region (126,184) using the combination of the region limiting strategy and BDNN,the asterisk is the unknown superheavy nuclei predicted;(b) the range comparison between extrapolation results(Z =50—126) and experimental results (Z =50—126).The red shadow is the experimental value and the blue is the predicted value.The outer dotted line shows the overall trend,while the inner dotted line shows the core trend.
從圖8 可以看出,與圖4(b)相同,在原子核外推預測的能力表現上,LDM+BDNN 模型在區域限定策略與BDNN 的結合下,展現出了極強的預測外推能力.整體核素預測值的變化趨勢與實驗值基本相同.而且,在超重核區域也依舊保持著相同的變化趨勢,證明了在未知超重核預測方面的穩定性,這表明即使在不確定性增加的情況下區域限定策略與BDNN 的結合依舊可以進行合理的預測推斷.而如圖8(a)所示,本文預測的超重核大多也在規定的限定區域中,進而保證了結果的準確性與穩定性.但是考慮到殼的性質,在超重核區域傳統的幻數可能不再適用[35?37].使用文獻[35?37]給出的超重核新殼層設定了不同的幻數區域進行預估,結果如圖9 所示.可以看出,在不同的殼結構可以得出相似的最低比結合能,但是給出的核素是不同的.表明模型可以得出發現概率最大的核素的比結合能.其次,本文尋找了文獻[38?40]中預測的超重核結構,進行了對比驗證,結果如圖10 所示.可以看出,所有的超重核預測(結合能最低的10 個)都符合得很好.而且,考慮到亞殼對超重核的影響,本文在超重核的預測上重新設計了幻數的限定方法:1)單純使用亞殼作為區域邊界;2)單純使用主殼層為區域邊界;3)將亞殼作為中間區域,使用主殼層作為區域邊界.結果發現,在使用亞殼層N=162 作為中間區域時模型表現出了更好的結果,相比其他兩種區域邊界,預測出的比結合能曲線更加平滑,而且與文獻[38?40]符合得更好,也就更有希望被找到,證明本文模型在超重核的預測上有著很好的準確性.

圖9 不同幻數的限定區域下,預測超重核的最低結合能Fig.9.The lowest binding energy of superheavy nuclei is predicted under the limited region of different magic numbers.

圖10 LDM+BDNN 所預測的超重核(線)與文獻[38?40]中預測的超重核(點)對比,選取不同的幻數Fig.10.A comparison between the predicted superheavy nuclei (line) and the predicted superheavy nuclei (point) in the Refs.[38?40]),select different magic numbers.
綜上所述,本文引用了LDM+BDNN 方法與新的區域限定策略來重新定義了一個新的可進行準確預測的理論計算方法.對比AME2012[41],AME2020 的最新數據增加了104 個新核,這降低了各個全局質量模型的計算精度,BDNN 方法以概率的方法處理未知的量,將參數作為一個概率分布而不是一個常量,從而保證在未知的不確定性很大的區域依舊可以得到準確結果,顯著地改善了以前的全局模型在預測方面不足的問題.并且,在使用新的區域限定策略的改善下,即使是外推的未知核素,因為被限定在了一個特定的區域內,其穩定性與準確性也得到了很好的保證.因為在限定好固定的區域后各個核素被進行了嚴格的劃分,最大程度地體現了核素的差異性.并且,區域限定策略也可將外推核素近似地轉化為內推,體現了很好的穩定性.并且在考慮了形變亞殼的影響下,在不同的殼結構可以得出相似的最低比結合能,雖然給出的核素是不同的.但模型可以得出發現概率最大的核素的比結合能.因此在不超規定范圍內進行的外推,都可認為是可靠的.
最終的結果也表明,本文新提出的理論計算方法,不僅顯著消除了原有模型在核質量計算時所產生的巨大波動.而且有效地改善了奇偶效應在輕、中、重核素的巨大差異.即使是現有最佳的全局核質量模型,依舊需要進行不斷地改進,而且大多數模型在預測未知核的能力上存在不足,最重要的是,一個通用的能量密度泛函也有其建立的困難性.但區域限定策略與BDNN 的結合,為未知核的預測提出了一種新的方案且建立簡單,有很大的發展空間.此外,BDNN 方法還可以改進核素的其他性質,如核電荷半徑[42]、β-衰變半衰期[43]、裂變產率[44]、總反應截面[45]等.并且,BDNN 經過長時間的發展也有了很多優化近似方法,因此還可以在現有的基礎上進行創新.
感謝上海理工大學物理系賈力源教授和張霄吉博士參與討論,以及西安交通大學郭威博士參與討論.