房小可 趙宣哲 張雪
摘要:信息社會化的發展使得社交媒體成為檔案信息交流的重要工具。本文以典型的社交媒體——微博為平臺,運用統計方法和社會網絡分析法對微博發布的檔案信息及其主體進行統計和關系挖掘,發現當前社交媒體環境下微博檔案信息的分享現況和主體之間的關聯及特征。研究結果發現:中國南部地區的部分綜合檔案館如溫州檔案、廈門檔案等發布檔案微博的比例較多且較頻繁;微博上的檔案主體相互關注程度比較低,難以實現有效交流;綜合檔案館總體上比高校檔案館掌握更多的網絡聯系資源。
關鍵詞:社會網絡社交媒體微博微博檔案微博檔案實體
隨著互聯網的迅速發展,社交媒體成為記錄人類社會生活變遷的重要載體,并成為大數據時代的熱點。據第 40次《中國互聯網絡發展狀況統計報告》顯示,截至2017年6月,我國網民規模達7.51億,微博作為一個用戶關系的信息分享、傳播及獲取平臺,用戶使用率持續回升,達38.7%,較2016年12月上升1.6個百分點[1]。檔案信息資源作為人類勞動和智慧的結晶,是社會文化的傳承。社交媒體迅速滲透到檔案界,成為信息交流和知識傳播的重要平臺,微信檔案、微博檔案紛至沓來。目前,這些社交媒體上的檔案信息卻未被有序整理,檔案價值不能被有效挖掘,這妨礙了檔案資源的有效利用。本文以此為出發點,借助社會網絡分析工具對典型的社交媒體——新浪微博的檔案主體和信息進行挖掘。
利用社會網絡對社交媒體檔案進行挖掘,理清不同主體之間的關聯,對新媒體環境下檔案傳播具有重要意義。筆者在知網、維普、萬方數據庫進行檢索,發現相關文獻主要集中在三方面:其一是政務微博檔案的研究,包括政務微博檔案保存策略研究[2]、政務微博檔案化管理策略研究[3]、政務微博檔案資源的開發與利用研究[4]。其二是基于微博的檔案傳播研究,如蔡紅[5]闡述檔案部門開通微博的現狀及所面臨的挑戰,分析檔案微博的發展瓶頸,提出提高檔案微博影響力的方法。其三是基于微博的檔案工作研究,如夏婷婷等[6]認為微博在檔案工作中有提高社會檔案意識、促進檔案部門交流的的作用,應提高社會公眾對檔案微博的重視程度。此外,張凡[7]針對微博平臺,從中心性、小團體等方面對我國檔案館微博進行了社會網絡分析,指明目前我國檔案館微博推廣及合作情況。
綜上,微博在檔案工作中發揮著重要的宣傳及交流作用,對微博檔案進行社會網絡分析具有重要意義,但已有研究更多地對微博檔案管理各環節進行宏觀闡述,缺少具體分析。雖有學者對我國檔案館微博進行了社會網絡分析,但數據集較小且沒有對不同類型的微博檔案主體進行對比。本文基于此,選擇綜合檔案館和高校檔案館兩種類型為數據集,對其進行社會網絡分析并進行對比。
一、微博檔案數據描述
筆者于2017年5月1日至10日登錄新浪微博,以“檔案”為關鍵詞進行用戶名查找,鎖定微博檔案主體,深入抓取微博之間的鏈接關系,最終得到注冊新浪微博的檔案主體數量為583個。以活躍程度為標準,選擇發布微博數量為400條以上的微博,過濾活躍度低的微博主體及剔除無意義的微博主體,最后得到微博主體數量為149個。
需要說明的是,本文抓取的微博主體主要是綜合檔案館和高校檔案館兩種類型,軍事檔案館和企業檔案館均不在抓取數據范圍內。其中綜合檔案館113個、高校檔案館36個。
(一)檔案微博主體發布微博比例的分析
社交媒體強調以用戶為中心的服務模式,強調用戶參與和互動,這與檔案行業開展信息個性化服務的宗旨是一致的,檔案類微博在開展檔案信息個性化服務中均遵循以用戶為中心的原則,注重建立和增強與用戶和檔案機構工作人員的關系。同時,微博又是一個開放、自由的平臺,人們可以在法律允許范圍內暢所欲言,因此社交媒體給檔案工作者與用戶之間、用戶與用戶之間、檔案工作者之間的交互,提供了新的渠道和空間。發布微博數量越多表明主體越活躍,服務意識越強。筆者經過一個月的統計,得到發布檔案微博比例排名前十的主體(見表1)。
(二)檔案微博主體發布檔案微博的效率分析
社交媒體的信息更新速度非常快。檔案微博發布的及時不僅可以更快實現資源共享,而且可以實現有效利用。筆者跟蹤調查檔案微博主體的微博發布狀態,發現部分檔案微博主體能及時更新發布內容,統計得到2017年月均發布檔案微博頻率和日均發布檔案微博頻率排名前十的主體(見表2)。
綜合分析表1和表2可知,就發布微博比例和發布微博效率兩個指標,排名前十的微博主體并未變化,說明在抓取數據中,發布微博比例較多的微博主體其發布頻率也較高。
二、微博檔案主體的社會網絡分析
在149個樣本數據基礎上搜集每個檔案主體的關注實體,以相互關注為主要指標構建共現矩陣,即如果兩個微博主體相互關注,則二者在矩陣中取值為1,否則為0,得到的部分共現矩陣如圖1所示。
(一)檔案微博實體密度分析
網絡密度可用于刻畫網絡中節點間互相連邊的密集程度,是指在圖形中實際存在數量的線與可能存在數量的線的比例,在社交網絡中常用來測量社交關系的密集程度及演化趨勢。一個具有N個節點和L條實際邊的網絡,其網絡密度為d(G)=2L/N(N-1)。在社會網絡分析軟件UCINET上對149個微博中檔案信息進行收集排列,導入構建的共現矩陣,除去孤立節點后,利用UCINET計算網絡密度,整個網絡的密度指標如表3所示;運用繪圖功能Netdraw繪制生成微博檔案實體網絡關系圖,去掉孤立節點后得到的結果如圖2所示。
由表3計算結果可知,由149個微博檔案節點組成的社交網絡,連接邊數共924條,其網絡密度為0.0443。密度值介于0和1之間,值越接近1則代表彼此間的關系越緊密,由此可知,檔案微博實體形成的網絡密度相對較小,說明149個活躍的檔案微博主體相互關注程度較低,并未實現有效交流。
由圖2可知,對整體網絡密度貢獻大的節點集中在網絡中心的幾個節點上,大部分檔案微博實體與其他實體關聯并不密切,有些檔案微博實體僅有一個相互關注關系。一方面,由于客觀上的網絡結構龐大,數據信息海量,大部分檔案微博難以從海量的微博信息中提取有關信息;另一方面,大部分檔案館利用社交媒體渠道進行信息共享的方式單一,僅考慮到自身檔案館的發展而忽略了館際間的交流與合作。
(二)檔案微博實體網絡中心性分析
社會網絡分析中對重要性的探討集中體現在“中心度”上,一般常用的中心度指標包括點度中心度、中間中心度和接近中心度。其中“點度中心度”刻畫的是行動者的局部中心指數,點度中心度越高,該節點在網絡中越重要[8];“中間中心度”考慮節點在連接其他節點時表現出的重要性,起到重要的連接作用;“接近中心度”的思想是節點越趨于中心,它們越能快速到達其他節點,即網絡中的節點距離其他節點越近,接近中心性越大。
根據網絡圖的統計特性對檔案微博主體之間的網絡關系進行分析,分別得到其點度中心性、中間中心性和接近中心性指標,排名前十的綜合檔案館微博和高校檔案館微博如表4所示。
由表4可知,由點度中心性來看,排名前十的全部為綜合檔案館微博主體,如海鹽檔案、宿遷檔案、佛山市檔案局、東莞檔案的節點均在30及以上,位居前五,說明這些檔案微博主體掌握較多的網絡聯系資源,對其他檔案微博的影響力大,而其他檔案微博的節點中心度均較小,反映了這些檔案微博主體與其他微博的聯系較少,信息輻射范圍小。在高校方面,沒有一所高校的點度中心性在整個網絡中排名前十,在高校微博領域排名前五的分別為同濟大學檔案館、中大檔案館、中財檔案館、華東師范大學檔案館和西北工業大學檔案館,同理,這五所大學相對而言與其他微博的關聯度較大。
由表5可知,宿遷檔案在中間中心性指標中排名第一,指標值為8.964,說明宿遷檔案在整個網絡中起到十分重要的橋梁作用,由圖2也可看出很多其他微博檔案主體通過宿遷檔案而產生關聯關系。宿遷檔案、佛山市檔案局、蓉城檔案、廈門檔案和株洲檔案排名前五,說明以上微博主體在整個網絡連接中具有不可忽視的作用。在高校方面,位居前五的是同濟大學檔案館、中大檔案館、四川大學檔案館、華東師范大學檔案館和北京科技大學檔案館,其中四川大學檔案館和北京科技大學檔案館雖不具有高點度中心性,但在連接重要節點方面有著重要作用,往往這種節點是較權威的節點。

由表6可知,海鹽檔案、東莞檔案、佛山市檔案局、宿遷檔案和中山檔案方志的接近中心性排名前五,彼此指標相差不大,說明該五個檔案微博主體與網絡中其他節點均具有最短距離;在高校領域,除中大檔案館、同濟大學檔案館、中財檔案館、華東師范大學檔案館外,南昌大學檔案館也位居前五,且彼此差距非常小,說明高校領域中此五個微博主體較趨于中心,能快速達到其他節點。
(三)檔案信息微博間的聚類分析
聚類分析是數據挖掘的最主要功能之一,聚類就是將數據對象分組為多個類或簇,在同一個簇中的對象之間具有較高的相似度,而不同簇中的對象差別較大。本文針對樣本數據關注關系特征,擬對樣本數據進行聚類,去掉孤立節點后得到的結果如圖3所示。
由圖3可知,根據UCINET的K-means聚類方法,檔案微博主體可劃分為八個獨立的小群體。海鹽檔案、中大檔案館等微博主體具有相似性,表明這些微博主體有著相似點,即在利用微博分享檔案信息過程中處于較活躍的狀態,彼此相互關注數量較多;株洲檔案、北京科技大學檔案館等微博主體被劃分為同一類型,這些檔案館的交互關系數量相仿,且與中心位置的檔案館有著些許聯系;依此類推,溫州檔案、西北民族大學檔案館屬于一個類型,這些檔案館缺乏彼此間的微博交流,各個微博間幾乎沒有聯系,而在這一類型的微博主體中高校檔案館所占比例相對較大。由此可以推斷,愿意分享檔案信息的微博主體不僅擁有更多的資源,而且由于馬太效應使得具有類似分享行為的微博主體彼此擁有更多的交互性,并輻射其他微博群體,達到信息分享的增值效益。
三、討論及結語
綜上分析可知,綜合檔案館無論在發布檔案微博數量、比例、效率、作用等方面均優于高校檔案館,可見我國綜合檔案館在檔案宣傳方面起到了先鋒帶頭作用。但從分析結果來看,我國綜合檔案館利用新渠道傳播和宣傳檔案的力度仍需進一步加強,尤其在信息交流與傳遞越來越重要的新媒體時代,綜合檔案館更應主動出擊,建立互通互聯的共享機制,利用社交媒體的便捷性擴大我國檔案的影響力,傳播檔案文化及知識精髓。另外,高校作為教育、科研的圣地,在新媒體時代具有高影響力的微博主體力量總體上是薄弱的。在高校檔案館中起到重要作用的更多聚集于華東、華南地區。當下高校檔案館如何利用新媒體實現全方位的融合發展是亟須關注的問題。
本文以微博為例,運用統計和社會網絡分析方法對檔案微博比例及其主體的關聯關系進行定量分析,探索目前微博檔案的分享和檔案微博實體交互現況,以期為社交媒體環境下檔案研究提供數據支持。但本研究仍然存在一些局限:首先,只對地方微博檔案和高校檔案進行抓取和分析,并未覆蓋企業檔案等所有不同檔案主體;另外,本研究只能體現一段時期內的相關狀況,尚未隨著時間推移動態變化。未來我們會擴大數據集,從不同社交媒體入手,更全面系統地分析當前社交媒體在檔案界中的應用及其交互狀況,為新媒體時代檔案工作的發展提供參考。
*本文為國家社科基金青年項目“面向社會記憶構建的檔案資源檢索研究”(編號:18CTQ041)及北京市教育委員會社科計劃一般項目“虛擬學術社區個性化知識推薦方法與應用研究”(編號:SM201811417007)的成果之一。
注釋及參考文獻:
[1]中國互聯網絡信息中心.第40次中國互聯網絡發展狀況統計報告[EB/OL]. [2017-10-12].http://www. cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201708/ P020170807351923262153.pdf.
[2]黃新榮,吳建華.政務微博檔案化保存初探[J].檔案與建設,2012(4):4-6.
[3]杜永紅.政務微博檔案化管理策略研究[J].蘭臺世界,2014(8):37-38.
[4]范錚.“微時代”背景下政務微博檔案資源的開發與利用[J].蘭臺世界,2015(32):27-29.
[5]蔡紅.檔案微博傳播效果分析與研究[J].檔案與建設,2014(2):33-35.
[6]夏婷婷,王紅梅.社交媒體下的檔案工作——以檔案微博為例[J].檔案,2014(12):57-59.
[7]張凡.我國檔案館微博社會網絡分析[J].蘭臺世界, 2017(23):28-31.
[8]楊小兵.聚類分析中若干關鍵技術的研究[D].杭州:浙江大學,2005.
作者單位:北京聯合大學應用文理學院