肖鑫 王恒亮

摘 要:本文通過數據庫數據挖掘的方法對紅山考古學文化和良渚考古學文化的出土玉器進行了統計學的對比,應用關聯規則建立了分析模型,并通過數據反映出的結果分別分析了良渚文化及紅山文化的異同。
關鍵詞:數據挖掘;關聯規則;紅山文化;良渚文化;玉器統計
紅山文化和良渚文化以及凌家灘文化為中國出土玉器數量最多的三大新石器時代考古學文化,這其中凌家灘文化和良渚文化相對距離較近且都為長江流域的考古學文化而紅山文化和良渚文化距離較遠分別分布于中國的北方和南方地區。紅山文化和良渚文化由于其獨特的特性其對周圍文化的影響力和輻射范圍都達到了空前的規模,研究這二者文化出土玉器的統計學關系對于這二者間的比較研究將會對未來的考古發掘有所幫助。近年來雖有紅山文化和良渚文化單一文化單元出土玉器的統計學分析,但是鮮有對兩個完全不同文化類型出土玉器的科學統計比較,尤其以數據庫數據挖掘形式的比較在國內尚屬首次。數據庫數據挖掘獨特方式使得以往幾個不同內容之間的數據表互相比較成為了可能,而類似于器物統計這類簡單表結構的比較則是數據庫系統最為擅長的。
基于數據庫的數據挖掘,通常需要借助不同的數據挖掘算法規則,基于本文所涉及的數據范圍,我們引入關聯規則來建立我們的模型。關聯規則是反映一個事物與其他事物之間的關聯性。若兩個或者多個事物之間存在著關聯關系,那么其中的一個事物就能通過其他事物預測到。關聯規則也是數據挖掘中最活躍的研究方法之一,廣泛運用于購物籃數據、生物信息學、醫療診斷、網頁挖掘和科學數據分析中。關聯分析有三個最為重要的概念即支持度、可信度、及提升度。在數據結果中分別表述為Supp值、Conf值和Lift值。在本案例中我們僅使用支持度及可信度作為觀察值。
關聯算法的輸出結果一般是如下格式:{A, B} -> {C, D, E} (conf: x, supp: y, lift: p, conv: q), 這個語句代表了在出現了物件A 和物件B 時,會出現物件C, D, E 的概率為x . 這里主要看重的指標有conf 和supp , conf在本案例中表示為 : 在出現了物件A 和物件B 時,出現物件C, D, E 的條件概率。也就是出現了物件A 和物件B 時,這時有多大可能性會出現物價C, D, E 。這里conf 值越大,說明規則{A, B} -> {C, D, E} 越可信; supp表示為: 在文件中同時出現物件A, B, C, D, E 的頻次。這里是為了看發現的規則是否為偶然,舉個例子,如果在文件中,物價A 只出現了一次,那么物價A 與任一物件X 同時出現,都可以得到規則{A} -> {X} 。這里由于A 出現的頻次較少,那么規則{A} -> {X} 有可能是偶然發生的。這里supp 值越大,說明規則{A, B} -> {C, D, E} 越可信。
在考古報告中考古人員將出土的玉器進行了詳細的編號和分類,通過紋飾學和器型學的基本理論考古人員把新石器時代出土的玉器在考古報告中大致分為了這么幾種類型:玉琮、玉刀、玉鉞、玉錐、玉璧、玉圓盤、玉紡輪、玉動物器、玉柱、玉珠、玉串、玉墜、玉璜、玉權杖等。這里我們先來看一下良渚遺址中出現明顯捆綁使用玉器組合的數據情況(數據由已出版的考古發掘報告整理得出):
{三叉型玉器, 玉鉞, 玉錐} -> {封底玉柱} (conf: 0.917, supp: 0.087, lift: 8.315, conv: 10.677)
{三叉型玉器, 玉鉞, 玉錐} -> {玉冠} (conf: 1.000, supp: 0.094, lift: 5.522, conv: 818897637.795)
{三叉型玉器, 玉鉞, 玉錐} -> {玉柱} (conf: 0.833, supp: 0.079, lift: 7.056, conv: 5.291)
{三叉型玉器, 玉鉞, 玉錐} -> {玉琮} (conf: 0.917, supp: 0.087, lift: 8.955, conv: 10.772)
{三叉型玉器, 玉鉞, 玉錐} -> {玉質雜物} (conf: 1.000, supp: 0.094, lift: 1.000, conv: 0.000)
從挖掘出的數據中我們可以看出捆綁組合三叉型玉器、玉鉞及玉錐出現時有80%以上的概率會分別出現封底玉柱、玉冠、玉柱、玉琮及玉質雜物等玉器,而同時出現這些器物的頻次則大于7%。在良渚遺址的統計數據中有一組最特別的器物組合即三叉型玉器、玉鉞、玉錐及玉冠這一組。統計結果顯示當出現三叉型玉器、玉鉞、玉錐這三個類型的玉器的時候同時出現玉冠這類玉器的概率是必然事件(當一種概率達到百分之一百的時候我們稱之為必然出現的概率或事件),而同時出現這四種器物的頻次也接近百分之十。這一頻次出現的概率相當之高也從一個側面凸顯出了這四件器物對良渚考古學文化的重要性。
相對于良渚文化的組合數據結果我們來看一下紅山文化的特征捆綁組合的數據結果:
{勾云佩, 斜口器, 玉璧} -> {動物型玉器} (conf: 1.000, supp: 0.025, lift: 6.667, conv: 850000000.000)
{動物型玉器, 勾云佩, 玉璧} -> {斜口器} (conf: 1.000, supp: 0.025, lift: 2.857, conv: 650000000.000)
{動物型玉器, 勾云佩, 斜口器} -> {玉璧} (conf: 1.000, supp: 0.025, lift: 5.000, conv: 800000000.000)
{勾云佩, 玉璧} -> {動物型玉器, 斜口器} (conf: 1.000, supp: 0.025, lift: 10.000, conv: 900000000.000)
{動物型玉器, 勾云佩} -> {斜口器, 玉璧} (conf: 1.000, supp: 0.025, lift: 13.333, conv: 925000000.000)
{動物型玉器, 勾云佩, 珠串玉環等雜物} -> {斜口器} (conf: 1.000, supp: 0.025, lift: 2.857, conv: 650000000.000)
從紅山文化挖掘的數據中我們可以看出出現捆綁組合勾云佩、斜口器、玉璧及動物型玉器時出現其他類型的玉器的概率均是必然事件,而同時出現這些器物的頻次則在2.5%。紅山文化的數據結果直接反映出一個規律即紅山文化的重要器物類型直接存在一個互相依附的關系且這個依附關系可以延伸到兩兩捆綁組合使用的器物類型之中。這一點特性是良渚文化所不曾有的特性。通過以上兩組數據的比較我們不難發現紅山文化在出現捆綁組合之后再出現其他玉器類型的概率大于良渚文化,但是在同時出現若干玉器類型的頻次概率中又遠低于良渚文化。
那么良渚遺址的其他三種玉器類型的顯著組合也和上面列出的組合有相似性嗎,我們來看下面列出的這組良渚數據:
{玉柱, 玉琮} -> {封底玉柱} (conf: 1.000, supp: 0.079, lift: 9.071, conv: 889763779.528)
{封底玉柱, 玉琮} -> {玉柱} (conf: 0.833, supp: 0.079, lift: 7.056, conv: 5.291)
{封底玉柱, 玉柱, 玉琮} -> {玉冠} (conf: 1.000, supp: 0.079, lift: 5.522, conv: 818897637.795)
{封底玉柱, 玉柱, 玉琮} -> {玉質雜物} (conf: 1.000, supp: 0.079, lift: 1.000, conv: 0.000)
{封底玉柱, 玉柱, 玉琮} -> {玉鉞} (conf: 0.900, supp: 0.071, lift: 9.525, conv: 9.055)
{封底玉柱, 玉柱, 玉琮} -> {玉錐} (conf: 1.000, supp: 0.079, lift: 6.048, conv: 834645669.291)
通過觀察我們發現良渚遺址的這組數據保持了和它另外的三元素組合高度的一致性即出現三組合時出現另外玉器類型的概率整體大于80%,所有類型全出現的頻次概率大于7%。
那么良渚遺址和紅山遺址的兩種玉器類型的典型捆綁組合的情況又是如何,他們是否會和三種玉器類型的典型組合統計分布規律保持一致呢,讓我們來看下面的這兩組數據:
{玉圓牌, 玉璜} -> {玉冠} (conf: 1.000, supp: 0.047, lift: 5.522, conv: 818897637.795)
{玉圓牌, 玉璜} -> {玉質雜物} (conf: 1.000, supp: 0.047, lift: 1.000, conv: 0.000)
{玉圓牌, 玉璜} -> {玉錐} (conf: 1.000, supp: 0.047, lift: 6.048, conv: 834645669.291)
{玉圓牌, 玉璜} -> {玉冠, 玉質雜物, 玉錐} (conf: 1.000, supp: 0.047, lift: 6.048, conv: 834645669.291)
這組數據反映的是良渚遺址中兩個玉器類型的典型捆綁數據,從數據中我們可以看到當出現兩個器物時出現第三個類型的器物的概率為必然事件,而同時出現這些器物的頻次概率相較于三元素的捆綁降低到了4.7%。紅山文化二元捆綁的數據分布就相對比較奇特了:
{玉鉞, 綠松石} -> {珠串玉環等雜物} (conf: 1.000, supp: 0.025, lift: 1.250, conv: 200000000.000)
{動物, 勾云佩} -> {斜口器} (conf: 1.000, supp: 0.025, lift: 2.857, conv: 650000000.000)
{勾云佩, 玉璧} -> {動物} (conf: 1.000, supp: 0.025, lift: 6.667, conv: 850000000.000)
{動物, 勾云佩} -> {玉璧} (conf: 1.000, supp: 0.025, lift: 5.000, conv: 800000000.000)
{動物, 勾云佩} -> {珠串玉環等雜物} (conf: 1.000, supp: 0.025, lift: 1.250, conv: 200000000.000)
{勾云佩, 玉璧} -> {斜口器} (conf: 1.000, supp: 0.025, lift: 2.857, conv: 650000000.000)
從數據中我們可以看出紅山文化二元捆綁的器物中出現第三個類型的器物的概率為必然事件,而同時出現這些器物的頻次概率為2.5%。和紅山文化的三元素捆綁器物的統計分布規律完全一致。也就是說紅山文化的器物兩兩出現和出現兩個的同時出現第三個器物的統計分布規律沒有太大的差別,這反映出紅山文化各個部落(如果存在諸多部落的情況下)或者各個層級之間的固化非常穩固,沒有在部落內部形成扁平式的管理分化。
通過以上的數據分析我們可以把紅山考古學文化和良渚遺址考古學文化二元及三元捆綁關系的對比做一個表格清晰的顯示如下:
紅山及良渚考古學文化玉器數據庫分析結果定性對比
考古學文化 二元捆綁模式 三元捆綁模式 總體狀況
紅山文化 出現兩個器物的同時出現第三個器物的概率高(接近必然事件),但同時出現三個器物的概率很低(均值低于3%) 出現三個器物的同時出現第四個器物的概率高但同時出現四個器物的概率很低 二對一、三對一或二對二出現的概率高但同時出現的概率很低
良渚文化 出現兩個器物的同時出現第三個器物的概率高(均值高于80%),但同時出現三個器物的概率較低(均值低于8%) 出現三個器物的同時出現第四個器物的概率高但同時出現四個器物的概率較低 二對一、三對一或二對二出現的概率高但同時出現的概率較低
討論
文中所給出的數據反映了部分統計分布的規律,但是應該注意到的是當置信區間提升之后有一些類型的捆綁特征可能就會顯的不明顯,且同時出現的頻次概率也會降的很低,故而不在我們的討論范圍之內。
綜合以上所有數據反映的情況來看,我們可以發現良渚文化的玉器透露出了一個明顯的和紅山文化玉器的數據區別:良渚文化多元玉器器型的分布具有差異性,特別是二元捆綁類型以上的玉器不會特定的出現在固定的區域內(這里的區域指的是統計分布里的區域,并非考古現場)。良渚玉器的所有類型同時出現的頻數概率總高于紅山玉器,且當捆綁類型大于兩種時良渚玉器的全部出場頻數遠高于紅山文化玉器。通過觀察數據我們可以發現良渚文化的玉器有一個扁平化分布的特性即現有挖掘的墓葬中的各個部落領導人或者重要人物之間所擁有的玉器類型相對比較分散,沒有出現特定個體壟斷玉器類型的情況發生,而紅山文化多個組合必然事件的發生透露出來紅山文化個別個體高度控制及壟斷玉器類型的特性,換言之某一些部落領導人或重要人物所擁有的玉器數量極少且種類極少也相對的固定。
如果我們將良渚和紅山考古學文化的分布范圍和其在全國新石器時代所處的地位結合起來來看,可以觀察到紅山文化更具有侵略性,分布的范圍更廣,而良渚文化則相對沒有進攻性。從數據中反映出來的固化的層級制度充分發揮了制度的優越性,使得紅山部落在自己所處的歷史時期略占優勢,但后續紅山文化的衰敗可以說是諸多因素綜合作用的結果,單從器物統計學角度無法給出太多合理的解釋。
通過對比兩個文化的玉器數據我們似乎可以發現紅山文化玉器所反映出來的中央集權制或者類似于中央集權制的政治體制開始萌芽,重要玉器類型掌握在少數部落首領之中且部落管理層核心層人數不多,部落首領的分工不明確,部分首領身兼數職的情形較多;而相反地良渚遺址似乎反映了早期聯邦制或者類似于松散的邦國概念萌芽,重要的玉器門類五花八門,部落管理層分工明確組織及其復雜化且部落中中層和基層管理層人數占比不低于高層。
誠然,文中涉及到的數據統計集僅僅是基于各省考古所已公開發表的考古報告整理而成的,紅山考古學文化和良渚考古學文化的考古發掘還遠遠沒有結束,隨著這些遺址在申請世界物質文化遺產之后,考古發掘的區域越來越廣大,可收集到的數據集數據越來越豐富可能會對現在得出的分析結論有所改變。
參考文獻:
[1]毛國君.數據挖掘技術與關聯規則挖掘算法研究[D].北京工業大學,2003
[2]遲海成.數據挖掘中關聯規則算法的研究與實現[D],2019
[3]楊秀港.數據挖掘算法綜述[J].科技經濟導刊,2019
[4]遼寧省文物考古研究所.牛河梁——紅山文化遺址發掘報告(1983-2003年度)[J].文物,2013
[5]浙江省文物考古研究所.廟前(良渚遺址群考古報告之四)(精)[M].文物出版社,2005
[6]浙江省文物考古研究所.瑤山(良渚遺址群考古報告之一)(精)[M].文物出版社,2003
[7]浙江省文物考古研究所.反山(良渚遺址群考古報告之二)(上下)(精)[M]. 文物出版社,2005
[8]葉舒憲.良渚文化葬玉制度“鉞不單行”說——四重證據法求解華夏文化基因[J].民族藝術,2020
[9]何 駑.良渚文化原始民主制度崩潰原因蠡測[J].中原文化研究,2020
[10]王綿厚.遼河文明與“紅山古國”和“燕亳方國”的文化反思——淺論遼河文明在中華早期文明形成中的歷史地位[J].渤海大學學報(哲學社會科學版),2021
(作者單位:1.上海寬帶技術及應用工程研究中心
2.北京大學數學科學學院)