*殷宇龍
(哈爾濱工程大學 黑龍江 150001)
目前已有電子探針、光譜分析儀等各類高精儀器能對古代文物的成分進行定量分析。本文主要探究通過關聯預測等數學方法分析古代玻璃組分的有效性。
(1)假設所給的有效數據均準確,不存在錯誤。
(2)假設未檢測出的成分在該樣本中不存在。
(3)假設樣本數量極少的兩項與其他成分不存在相關性。
符號說明:

①數據的預處理。由于檢測手段等多方面的原因導致部分數據中成分比例之和可能并不為100%,假設成分比例累加和介于85%~105%之間的數據為有效數據。以蜻蜓眼玻璃珠[3]為例,利用Excel將不滿足范圍要求的數據剔除,后續建模過程中不再重申。
②模型的建立與求解。玻璃類型、紋飾和顏色屬于離散化的變量,為量化三者對表面風化的關系,建立最優標度法模型,通過SPSS對得到相關性和容差值如表1。

表1 玻璃類型、紋飾和顏色與表面風化的相關性和容差表
從表1中可以得到玻璃文物的紋飾和類型對表面風化具有較高的相關性,同時由于容差較大因此使得結果可信度好,進一步得到三者對表面風化的影響系數如表2。

表2 玻璃類型、紋飾和顏色對表面風化影響系數
為了預測其風化前的值,依據t檢驗進行預測。當t>0.05時鉛鋇的數據方差具有齊性的特征,便可以直接由平均值差值來求得其風化前的數值,故鉛鋇類風化前化學成分預測公式如下。

鉛鋇類[2]風化前化學成分預測表如表3所示。

表3 鉛鋇類風化前化學成分預測表
而高鉀的萊文方差不具有統計學意義,因此采取另一方案。
在玻璃風化過程中SiO2的凈含量不變[1],其他物質的含量會逐步減少,以致使得SiO2百分比含量上升。據此,本文利用風化過程中SiO2的含量作為刻畫風化程度的變量,通過的SiO2含量,將剩余物質的百分比含量通過利用步進法做回歸分析,得到六個最相關的變量。通過回歸分析,得到了回歸系數,為下階段求出回歸前的變量作鋪墊。回歸分析表格如表4所示。

表4 化學成分之間的回歸性分析
為了預測SiO2的風化前的含量,利用t檢驗分析。從表5可以看出,k值得萊文方差滿足k>0.01,即k的數據方差齊性良好。使用其t檢驗的平均值差值,詳見表5,通過式(2)可以對風化前的SiO2值。


表5 二氧化硅的獨立樣本檢驗
利用上文得到的線性關系賦值以k的風化變化倍數,擬帶入風化后的各線性相關數據,通過式(3)求出k值,并將k值賦以各相關數據,通過式(4)便可得到各個值的風化之前含量,如表6所示。

表6 高鉀類[2]風化前化學成分預測

玻璃文物的化學成分作為高鉀類和鉛鋇類文物劃分的重要因素,通過SPSS將化學成分作為二階聚類的聚類變量進行聚類分析,聚類效果見圖。

圖1 二階聚類輸入15組玻璃制品,聚類為兩組,聚類的質量為良好
二階聚類效果良好,將二階聚類的結果與高鉀類與鉛鋇類分類的結果進行頻率擬合分析,結果見下表7。

表7 高鉀類與鉛鋇類聚類出現頻率
頻率表可以看出,聚類結果和原分類結果擬合較好,因此可通過二階聚類并依照聚類預測變量分析表可以得出,結果見圖2。

圖2 將玻璃文物進行二階聚類為2組,圖為預測變量的重要性柱狀圖
經上述模型可得,SiO2、PbO、P2O5、SrO和BaO對聚類產生重要的影響,可作為高鉀玻璃和鉛鋇玻璃的分類規律。
由表8的數據玻璃制品所含化學成分共有14種,并以此建立Fisher多分類判據進行降維分析,通過SPSS得出分類的可信度與相關數據。

表8 部分典型采樣點的采集成分占比
由Fisher分類結果表可得,其對原始數據與高鉀和鉛鋇類分類的結果重合度達到100%,為防止過擬合的現象,進行80%的訓練組和20%的驗證組進行多次分類,均得到100%的重合度,因此可以Fisher多分類判據進行分類,得到未標準化典則判斷函數系數如表9。

表9 Fisher分類結果表

表10 未標準化典則判斷函數系數
由未標準化典則判斷函數系數得典則判斷函數:

其中,將玻璃制品所含上述化學成分代入式(4)中,若結果小于0,分為高鉀組;反之分為鉛鋇組。

表11 未標準化典則判斷函數系數
由分類函數系數得到Bayes判別式:

由Bayse判斷式性質可得,化學成分代入兩式之中,即其在與大者所在的類別。
通過上述玻璃分類模型,即根據式子(4)(5)(6)對未知玻璃制品文物進行分析,得到以下分類表格。

表12 未知文物分類表
模型一分析出其相關性和容差值。利用t檢驗,發現鉛鋇萊文方差齊性,直接利用平均值差值進行計算。而高鉀的萊文方差不齊,便利用SiO2的不變性,巧妙地將風化程度合理量化,通過對其余下的總成分與各個化學成分進行線性回歸分析,濾除無關量之后,利用通過t檢驗預測出風化前的SiO2含量,反推出與之線性相關的主要化學成分風化前的含量。但是存在某些線性程度不好的變量無法進行分析求解的缺點,因此需尋求能夠將非線性變量進行線性化的方法。
模型二通過二階聚類的方法,聚類效果良好,通過聚類結果和高鉀鉛鋇類的分類進行擬合,擬合效果達到93.9%。
模型三采取了博克斯描述,利用組內協方差矩陣,得到了其費希爾系數以及非標準化系數。擬合程度非常良好,可以預測出采樣點是否風化。
本模型通過對一些基礎元素進行分析可以得到較為良好的預測效果,對古代玻璃成分的分析具有輔助幫助。