費 淼 楊笑千 嚴 靜 肖 波 鄭 炯 張明星 唐 華 曾 波
(中國核動力研究設計院,四川 成都 610213)
核輻射是原子核從一種結構或一種能量狀態轉變成另一種結構或另一種能量狀態過程中所釋放出來的微觀粒子流[1],核反應堆在運行過程中主要產生5 類輻射:α 射線、β 射線、χ射線、γ 射線、中子,對人體的外部照射損傷主要由χ 、γ 射線和中子輻射引起,處在該環境下的工作人員會受到不同程度的輻射,大劑量短時間急性輻射會導致人體皮膚出現放射性燒傷,也會引起人體全身疾病乃至死亡[2]。因此個人輻射劑量的大小應實現嚴格的監控。
個人所受輻射量的多少稱為個人劑量,單位為mSv(毫希沃特),根據GB 18871-2002《電離輻射防護與輻射源安全基本標準》,放射性職業工作者一年累積全身受職業照射不得超過20mSv。影響個人劑量與所處輻射環境、個人防護措施、受輻射時間長短等因素相關外,還可能與個人性別、年齡、所屬部門相關。
近年來隨著大數據、人工智能技術的興起,數據挖掘分析在各行各業有了較大的發展,相關性分析一般是對存在關聯關系的變量之間進行分析,進而用量化的方式判斷變量的相關性程度的分析方法,相關性分析主要是用于從數據中挖掘出那些不易為人所知的關系,相關關系的研究在各個領域均有廣泛的應用,如王小燕[3]提出利用皮爾遜相關值研究花生發芽率與粗蛋白含量、水分含量的相關關系,張怡文[4]用皮爾遜相關值研究PM 值大小與CO、NO2的關系;曾愛平[5]使用方差分析方法研究土壤、施肥和它們的交互作用對農作物苗高生長的影響,張峰[6]利用方差分析方法比較不同批次的飛機剩余使用壽命是否存在顯著性不同,并選擇壽命最長的批次。但在個人核輻射劑量的相關性研究中,國內外鮮有資料可循。
本文針對反應堆從業者年所受劑量的大小與個人性別、年齡、所處部門的相關關系進行探究。
為研究個人所受劑量值與其年齡、性別和所在部門之間是否存在相關關系,本文采用皮爾遜相關值和方差分析對其進行研究。
相關性分析是用來研究兩個或多個變量間的關聯緊密程度的一種方法,為了探求年個人輻射劑量大小與哪些因素相關,故采用相關性分析算法,皮爾遜相關值可以很好的表示兩個變量之間的相關性。實驗中的部分指標存在線性相關關系,現選擇使用皮爾遜相關值計算個人劑量影響因素的相關程度,皮爾遜相關值表達方式如公式(1)所示:

方差分析是一種重要的數理相關統計方法,在工業、農業和商業等領域應用廣泛。在實際中,大多需要考慮不同條件對結果的影響。方差分析是檢驗多個總體均值是否相等的一種統計分析方法。最終根據試驗處理平均數的方差與試驗誤差的方差之間的比值(F 值)的大小來判斷該因素對試驗結果有無顯著的影響。在實驗中要考察的結果稱為指標,而在實驗中變化的因素稱為因子,因子在實驗中的不同狀態稱為水平。方差分析分為單因素模型和多因素模型,如果一項實驗中,僅有1 個因素發生變化,其他因素保持不變,則稱這種試驗為單因子方差分析,本文只探究個人劑量大小與所在部門的相關性,故采用單因素方差模型,單因素方差模型實現過程如下:

采集目標:從事放射性工作的人員主要從事反應堆運行與檢修、核設施退役、三廢處理、輻照效應研究、輻射監測、核技術應用及核燃料元件研制等工作。輻射場主要來源于反應堆及反應堆運行產生的裂變產物和活化產物,從事放射性工作的人員主要受照類型為γ /X 外照射,主要輻射源包括反應堆一回路系統、核設施運行廢物、輻照物項、熱室、核燃料、放射源等。
采集方法:外照射個人監測采用熱釋光個人劑量計進行,內照射采用體外之間測量。
采集數據:實驗選取2015 年至2020 年共6 年的數據,共有4242 條數據,其中男性有3145 人,占比74.1%,女性有1097 人,占比25.9%,數據中的個人年度劑量值為內外照射和,最終采集結果匯總形成相應文件。
數據預處理是數據分析挖掘重要的一步,對實驗結果有著決定性的影響。本次實驗的預處理包括:
數據清洗:對采集來的數據中含有未測量、不完整、不相關、錯誤的進行清洗和去除。
數據規約:降低數據量,避免臟數據,提取核心數據。
數據初步統計:按照年份、部門等字段將數據集成,將每條數據打上所屬員工的年齡、性別標簽,為了對數據有初步的了解,對按照部門間對數據進行人數統計、性別統計、年齡統計、平均值計算和方差計算。
為探究個人所受劑量對個人性別、年齡的相關性,故選用皮爾遜相關值進行分析。在數據分析平臺建立個人劑量皮爾遜相關值分析模型,相關系數的取值為:年度劑量值;員工性別(“0”代表“女性”,“1”代表“男性”);員工年齡,列出皮爾遜相關系數矩陣如表1 所示。

表1 員工劑量值與性別年齡統計
根據公式(1)得,個人年度劑量與個人性別、年齡的相關系數值分別為0.1845 和0.0126,對結果分析可知,員工所受年度劑量值的大小,與員工的性別存在較弱的相關性,即男性總體受到的劑量值大小要多于女性,員工所受輻射劑量值的大小與年齡無關。
由于部門不是量化的單位,并且只考慮部門變化這單一因素,故探究個人所受劑量大小與部門的關系時,采用單因子方差分析方法。
在數據分析平臺建立個人劑量單因素方差分析模型,實現步驟如下:
4.1 建立方差分析表如表2 所示。

表2 員工部門與劑量值統計
4.2 檢驗假設H0:μ1=μ2=μ3=…=μn;即各組間的平均值不存在顯著差異;
檢驗假設H1:μ1,μ2,μ3,μ4,… ,μn不完全相等,即各組件的平均值至少有兩處存在顯著差異。
4.3 實驗數據r=13,n=4242 等代入公式(2)(3)(4)(5)(6)后,計算并形成最終方差分析的結果如表3 所示。

表3 員工劑量值與部門關系方差分析結果


本文采用皮爾遜相關值法和方差分析法分別對個人性別、年齡和所在部門進行了相關性分析,最后得出結論,個人所受劑量大小與其年齡無關,與員工性別存在較弱的相關性,即男性受到的劑量值要多于女性,與個人所在部門存在顯著相關,建議受輻射劑量大部門員工注意采取安全措施,及時調崗或休息。本文確定了個人劑量相關性研究路線,驗證了相關性方法的可行性,下一步可對工作場景、工作時間、工作內容等因素進行研究,確定影響個人劑量的關鍵因素,根據關鍵因素的權重大小,可以將權重較大因素作為趨勢預測的重要因素,然后建立關鍵因素與個人劑量的回歸方程,進行個人劑量下階段的趨勢預測。