洪芳林 邢文明
(1.華南師范大學經濟與管理學院 廣州 510631;2.湘潭大學公共管理學院 湖南湘潭 411105)
協同信息行為(Collaborative Information Behavior, CIB)研究是在計算機協同技術和傳統個體信息行為研究的基礎上發展而來的一個跨學科研究領域, 最早由華盛頓大學協同信息檢索項目研究組成員提出,它是指一組成員為了識別和解決一個共同的信息需求而采取的活動,共同協作和互惠共享是其核心要素[1-2]。
伴隨著協同理論的發展和Web 2.0 群體交互性虛擬社群[3]的出現,協同信息行為研究已經逐漸成為新的研究熱點。目前CIB 領域已有的研究主要是從科研合作中的協同信息行為[4-5]、圖書館信息服務中的用戶協同信息行為(協同信息搜尋與檢索、協同內容創作、協同信息評估、協同信息質量控制和協同信息交流)[6]等視角出發展開研究,對用戶協同信息行為所創造的海量協同信息的分布規律關注較少。
因此,本文以我國部分省級公共圖書館新浪微博為研究對象,從用戶評論視角探討網絡協同信息的分布規律,并提出社交網絡環境下圖書館開展用戶協同信息服務的思考和建議, 以期為圖書館更好地設計和構建群體交互式虛擬社群、提升用戶協同信息交互效果提供一個新的研究視角。
與“協同信息”這一概念相對的是“信息協同”。“信息協同”(Information Collaboration)是協同理論在信息科學中的一個典型應用,是指特定環境中的信息主體之間通過有序的分工與協作獲得相關信息的過程[7]。與信息個體不同,信息協同注重信息資源的共建共享,能充分激發用戶參與網絡信息內容創作的熱情,使社交網絡環境下的信息協同行為產生的網絡協同信息成為網絡信息資源的重要組成部分。
綜上,筆者認為網絡協同信息(Internet Collaboration Information)主要包括了“主體信息”和“客體信息”兩個部分。前者為信息主體在微博等開放性社交網絡上發布的信息,后者是信息用戶一系列協同信息行為所創造的行為記錄和所產生的文字、圖片、表情、符號等一系列表達自身觀點、意愿或表明自身狀態的信息內容。其中,后者是網絡協同信息的重要組成部分,其本質是用戶通過不斷交流和互動所創造的行為記錄。
隨著信息技術的快速發展和人們對“信息協同”概念的不斷認同, 網絡環境中的協同信息分布得到了國內學者們的廣泛關注和研究。如蔡明月教授通過分析我國臺灣地區 “數字圖書館” 的網頁分布,發現核心區(總數開根號所得的數目)網頁制作單位生產的網頁數量遠遠大于總體網頁數量的一半[8];楊濤、鄒永利通過對特定主題的中文商業網站和網頁進行定量分析,提出中文商業網站上不同主題的信息由于自身特點的不同,所表現出的集中分散規律并不一定滿足經典定律中的1:a:a2的比例關系[9]。
在此基礎上,宋恩梅、朱夢嫻進一步分析了“豆瓣電影”和“新浪微博”兩個平臺上24 部影片的評論信息的分布特征和規律,得出“用戶和評論發文數呈現較明顯的冪率分布”“評論信息隨時間的分布上,兩個平臺都在電影上映后呈現出迅速增加的態勢”等結論[10];方愛華、陸朦朦等通過對網易云音樂熱歌榜TOP 30 的評論數量與評論質量的研究,揭示了數字音樂在音樂傳播方式、用戶音樂需求和用戶評論內容等方面的分布規律和發展趨勢[11]。
上述研究為我們了解和研究社交網絡平臺上的協同信息分布規律提供了大量有益參考,但其研究對象多傾向分布于搜索引擎的網站和網頁,以及“豆瓣”等平臺上的電影評論和“網易云音樂”等平臺上的音樂評論,而較少涉及圖書館這一重要信息主體,對圖書館等組織機構缺乏實踐指導意義。因此,本文擬在分析各圖書館官方微博包含的協同信息分布規律的基礎上,提出圖書館加強社交用戶協同交互和構建虛擬社群生態的具體策略,以期為我國圖書館更好地利用微博等社交網絡平臺開展協同信息服務提供一定的工作思路和理論參考。
(1)選取調查對象
微博(Weibo)是一種通過關注機制分享簡短實時信息的廣播式的社交網絡平臺,作為Web 2.0 的典型應用,已經成為網絡協同信息創作、交流、瀏覽、查詢與利用的重要社群媒介。新浪微博數據中心發布的《2018 新浪媒體白皮書》顯示,2018 年6 月,新浪新聞生態流量總用戶量高達3.99億人,新浪微博月活躍用戶已超過4 億[12];第42 次《中國互聯網互聯網絡發展統計報告》也指出,隨著短視頻和 MCN8機構的興盛,截至2018 年6 月,微博在互聯網用戶中的使用率為 42.1%,在用戶互動和內容生成等方面的價值進一步強化,成為網民消費碎片化時間的主流社交應用[13]。互聯網用戶可以隨時隨地利用網絡終端在圖書館發布的微博正文下方點贊、評論或轉發,與微博正文內容共同組成了豐富多樣的協同信息,這些信息記錄為我們了解網絡協同信息及其相關要素的分布規律提供了重要數據來源。故本文選擇我國部分省級圖書館新浪官方新浪微博作為調查對象。
(2)確定調查內容
結合已有研究[14-15]和新浪微博的功能特點,本文采用網絡調查法,調查統計了樣本圖書館微博的正文內容和用戶評論信息。其中,微博正文內容是圖書館發布的微博及其相關數據,主要包括:圖書館發布微博的內容、標簽、時間、轉發數、評論數、點贊數、閱讀量等。用戶的評論信息是用戶對圖書館微博的一系列跟帖評論和轉發等協同信息共建行為所產生的信息數據,主要包括:轉發/評論用戶的名稱、時間和內容等。數據時間范圍為2017 年3 月1 日—2017 年6 月1 日。
本次調查共收集到21 個省級公共圖書館在2017 年3月到6 月發布的共2 594 條微博及其相關數據,表1 按微博等級高低的順序列出了本次調查數據的總體情況。其中,發博數共2 594 條、發博總數共104 501 條(截至2019 年1月1 日)、跟貼評論數據共1 438 條、轉發評論數據共1 688條、用戶總評論數共3 126 條,詳見表1。

表1 樣本調查總體情況列表

11 山西省圖書館文源講壇 27 2010 年10月23 日 12 76 5 5 10 12 安徽省圖書館 27 2012 年08月17 日 29 2275 24 25 49 13 新疆圖書館 27 2011 年04月20 日 4 3981 4 1 5 14 海南省圖書館官微 27 2014 年01月07 日 20 1915 11 8 19 15 四川省圖書館 27 2015 年07月09 日 302 2109 258 109 367 16 貴州省圖書館 16 2011 年01月14 日 23 1757 5 3 8 17 湖北省圖書館新館 15 2013 年05月02 日 79 658 95 74 169 18 寧夏圖書館 14 2015 年02月02 日 46 800 30 105 135 19 云南省圖書館官博 14 2014 年06月26 日 94 2999 15 6 21 20 遼寧省圖書館 9 2013 年05月31 日 69 1177 3 7 10 21 內蒙古自治區圖書館官博 9 2016 年06月07 日 33 78 2 25 27
從表1 數據可以看出,微博等級大致與微博賬號開設時間呈正相關關系。我國各省級公共圖書館自2010 年起陸續在新浪微博開設官方微博賬號,經過近兩年的快速發展,大部分省級公共圖書館已開通微博賬號,開始依托微博平臺開展信息傳遞和服務[16]。
此外,根據21 家樣本圖書館的發博數量可以發現各圖書館發布的微博數量差距明顯。截至2019 年1 月1 日,上海市圖書館官方微博發布的微博總數達到20 108 條,而部分圖書館微博總數甚至低于100 條。這些圖書館微博數量/更新頻率的差異也會影響其粉絲數、評論數和轉發數等衡量微博帳號受關注程度的指標。一般而言,隨著微博數量的增加,越來越多的用戶會參與到微博協同信息的創建和共享中。圖書館需要采取更多舉措增加微博粉絲數量、提高用戶黏性和忠誠度以提升其微博賬號的用戶影響力,取得較好的循環效應和協同共建共享效果。
集中與分散規律是科學文獻分布最普遍的規律,揭示這一規律最有影響力的成果就是布拉德福定律[17]。從1934 年至2012 年,國內外對布拉德福定律的研究成果和科學論文以每年5.4%的速度呈指數形式增長[18]。這些研究主要聚焦于網絡資源的布拉德福定律驗證分析和應用分析,分析對象囿于學術資源范疇,較少針對社交媒介中的標簽、用戶、資源、評論等元素進行布拉德福定律分析[19]。因此,本文根據經典布拉德福定律的方法分別對微博正文內容和用戶評論信息分布進行驗證分析,以探究網絡協同信息內容分布的規律。
為了解微博正文分布規律,本文將各省級公共圖書館新浪官方微博按其在樣本數據時間段內發布的微博數量,以遞減順序排列處理以后得到微博正文內容的布氏分布情況,如表2 所示。同時,為驗證樣本數據的有效性,文章還列出了樣本圖書館于2019 年1 月1 日前發布的所有微博的布氏分布情況,如表3 所示。

表2 樣本微博正文內容布氏分區表

表3 全部微博正文內容布氏分區表
從表2、表3 可知:通過將同一時間段內各樣本圖書館官方微博按其發布博文數量的多少,以遞減順序排列成專門面向“圖書館”這一主題的核心區、相關區和離散區,在各個區的博文數量大致相同的情況下,核心區、相關區、離散區的圖書館微博賬號數大致呈1:n:n3的關系,n 約等于2。與側重于定量描述文獻序性結構的經典布拉德福定律相比,非核心區所含圖書館數量明顯更多,約為n 的3 次方。這表明微博平臺上的網絡協同信息內容分布大致符合傳統的布氏定律,但在數量分布上呈現出更加集中于少數核心帳號的趨勢。這可能是因為圖書館微博賬號屬于“政務文化類微博”,其運營和發展受到了我國東西部地域差異的影響,導致發達地區的公共圖書館往往生產了更多的網絡協同信息。
微博等社交媒介的快速發展使得信息呈單向線性傳播的傳統方式被徹底顛覆,信息個體通過在線查詢或瀏覽等方式獲取所需信息的同時,還往往習慣于積極參與互動評論,表達自己的觀點和意見。協同交互時代的微博評論是重要的網絡協同信息資源,探究其在各圖書館微博中的分布規律能夠幫助我們更加深入地了解網絡協同信息的內容分布規律。
本文在研究中將用戶轉發評論信息和跟帖評論信息都視作評論數據進行分析,是因為用戶轉發圖書館發布的微博時一般會附加自己的觀點、點評和轉發理由,并且會在微博正文下方顯示“轉發微博”。這不僅為其他用戶提供了微博正文之外的信息源,還與微博正文和其他內容構成了一條完整的協同創作的信息單元,相當于對微博內容作出了一次“評論”。微博用戶評論的布氏分布情況見表4。

表4 微博用戶評論布氏分布情況表
從表4 可以看出,“上海圖書館信使”的微博用戶評論數為1 117,約占樣本微博總評論數的1/3,屬于圖書館微博中的“核心區”。調查發現,該微博粉絲數量已達到16萬人,使得其發布的微博能及時得到大量用戶的關注和參與(日閱讀量達到1 萬+,日互動數40 次以上)。該微博擁有較強的社會影響力和用戶參與度,從而成為協同信息集中的核心微博賬號。同時,通過分析上表數據可知核心區的微博賬號數量僅為1(“上海圖書館信使”),與相關區、離散區圖書館微博的數量呈1∶3∶17 的關系。結合微博正文內容在各區分布呈1∶2∶8 的關系,可知微博用戶評論內容在各圖書館微博中的分布比微博正文內容更加集中于擁有高影響力的微博中,這是在發展中優勢長期積累和資源自動匯集的結果。
為了進一步直觀地描述微博評論信息的分布情況,本文根據表4 數據,以圖書館微博數的對數logC 為橫軸,以評論累計數R(n)為縱軸,繪制了微博用戶評論信息的布拉德福分布曲線圖,見圖1。

圖1 微博用戶評論信息布拉德福分布曲線圖
結合上述表格數據和圖1 內容可以發現,微博用戶評論數據的分布近似曲線與布拉德福分布曲線相比,比較接近傳統的布拉德福曲線的走向,即在AB 段呈開始上升趨勢,從BC 段開始趨緩,在CD 段(格魯斯下垂段)甚至不增長或者增長極慢。這與已有研究所指出的社交博客信息分布滿足布拉德福定律這一結論[19]大致相同。但有所不同的是,無論是微博正文內容還是微博用戶評論信息,在非核心區(CD 段)所含圖書館數量明顯偏高,約總數的72%左右,這可能是因為用戶在協同信息瀏覽和內容創作的過程中具有明顯的碎片化、動態性等特點,導致少量微博賬號集中了絕大多數的微博正文和用戶評論信息。
樣本數據中的微博正文內容生產者數僅為21,需要更為充足的用戶數據對網絡協同信息生產者分布規律進行分析驗證。而樣本數據中,共同生成了1 438 條跟帖評論數據和1 694 條轉發評論數據的1 798 位微博評論信息生產者數據,能為我們了解和探究網絡協同信息生產者的分布規律提供新的角度方法和研究路徑。因此,本文在借鑒已有研究方法的基礎上,通過統計樣本數據中的微博評論信息生產者評論數據得到其分布情況,如表5 所示。

表5 微博評論信息生產者分布情況統計表
通過分析表5 數據可知:①在3 132 條評論數據中,發表1 次評論的用戶數有1 376 位,占總數的76.5%,發表2次評論的用戶數有256 位,占總數的14.3%,發表了2 次評論的用戶數是1 次評論用戶數的18.6%,不符合洛特卡定律的“寫了n 篇文章的作者數據是生產了1 篇文章作者數的1/n^2”的規定。②按普賴斯在洛特卡定律的基礎上提出的普賴斯定律:全部生產人員的開根號所得人數生產了全部信息的一半,評論了樣本圖書館微博的總用戶人數為1 798,開根號約得42,而實際上前42 人發文低于747篇,不足全部發文(3 132 篇)的1/4。所以,網絡協同信息生產者分布規律也不符合普賴斯定律的規定。③綜合上述分析表明,微博中的網絡協同信息由于其本身質量控制水平較低,用戶群體分散,導致在圖書館微博信息生成過程中比科學文獻的生產和其他類型的信息生產表現得更加分散。分散的主要原因之一是圖書館微博用戶/粉絲對圖書館的忠誠度較低,這啟示圖書館應該強化激勵機制和加強與用戶的互動交流,為用戶提供一個更好的協同社群環境,以提高用戶黏性,進而提升自身影響力。
同時,本文以累計評論數的對數值(logx)為橫軸,累計生產者數的對數值(logy)為縱軸,得到微博評論信息生產者分布曲線,見圖2。

圖2 微博評論信息生產者分布曲線
從圖2 可知累計評論數的對數值(logx)與累計生產者數的對數值(logy)之間的函數斜率約為1。此外,有研究者通過對圖書館學網絡博文數量的統計分析,對洛特卡定律在網絡博客領域的應用進行了驗證分析,發現圖書館學領域博客的洛特卡定律擬合函數為f(x) =0.0026/X(-0.539 85)[20]。結合這一研究結果發現在用戶復雜多變的職業、學歷、年齡和興趣愛好等因素的綜合影響下,網絡協同評論信息的生產表現得比博文發布主體更為無序,且生產者的集中程度明顯更低。這與馬費成等通過研究珞珈山水BBS 發文情況所得到的推論——“網絡條件下,信息專業化程度越明顯,則生產者的集中程度就越明顯:反之,生產者的分散程度就越明顯”[21],以及其他學者的研究結論[22]相一致。
當然,我們在關注網絡協同信息生產者分布的同時,還應該了解參與圖書館微博評論的用戶信息,以便圖書館有針對性地進行協同互動。文章通過調查3 個月內評論總次數達到20 次以上的10 位用戶的基本情況發現:10 位用戶中機構用戶有6 位,如“上海書屋”“崇州行政學校”等,其關注數、粉絲數、微博數和微博等級總體較高;4 位個人用戶中,年輕化、活躍化、受教育程度較高且較為關注閱讀等成為他們的重要標簽,這些高活躍高影響的微博用戶都應該成為圖書館在微博平臺運營時重點關注的對象。
微博數據具有多個維度的屬性,其中之一是時間維度[23]。已有研究中,對信息時間分布規律的研究主要是以“年”“月”“周”為時間尺度來探究網絡信息隨時間增長情況[21,24],能有效揭示網絡信息在宏觀時間維度上的數量變化。而對于微博信息來說,由于其生命周期較短,以“日”為單位尺度來考察其時間分布規律更為合適。因此,文章從圖書館微博發布時間分布和用戶評論信息發表時間分布兩個方面分析了微博協同信息在一天中的時間分布情況。
為了解圖書館發布的微博在24 小時內的分布情況,本文統計了樣本圖書館微博賬號共2 631 條微博的發布時間信息,得到了圖書館發布微博時間分布圖,時間間隔為30分鐘,見圖3。

圖3 圖書館微博發布時間分布圖
從圖3 中我們可以發現圖書館微博發布時間大致呈三段式波浪分布:圖書館微博發布時間高峰期是9:00—10:00,共計733 條,占發微總數的27.8%,這一時間節點與圖書館開始工作時間相符;15:30—16:00 和22:00—22:30是圖書館發布微博的其他兩個轉發高峰期,占發微總數的10.4%;而零點(24:00)至次日早晨6 點為不活躍期,發博數為0。同時,已有研究表明:由于微博具有時效性,圖書館發布的微博大都在發布后的1—2 小時內獲得較多的關注量,隨后迅速下降,因此,提高更新頻率和選擇合適時間發布微博是在微博易被迅速覆蓋的情況下增加微博的可見度和傳播效果的重要手段[15]。
此外,圖書館微博的發布時間決定了用戶評論和轉發的時間,因而圖書館應該充分了解讀者的微博使用規律,在此基礎上選擇合適的時間發布微博。但也要避免短時間連續發布同一類型的微博,如樣本中的H 省圖書館在2017年3 月14 日15:20 至當天16:57 連續發布30 條標簽為“#H圖借閱部#”的書目推薦類微博,其轉發評論量全部為0,這不僅是忽略了微博的質量和內容,更容易造成部分用戶的反感和不滿情緒。
5.2.3 用戶評論信息發布時間分布規律
為了了解用戶評論信息發布時間的微觀分布情況,筆者將用戶對部分樣本圖書館微博的跟帖評論數據和轉發評論數據合并作為用戶總的活動規律,得到用戶總的評論時間分布情況,見圖4。

圖4 用戶總的評論時間分布表
由圖4 可知,圖書館用戶評論的最高峰出現在下午15:00—15:30 ,從15:00 開始出現較快增長,評論數最高值174,次峰值出現在上午8: 30—11:00 和晚上22: 00—22: 30,大致與圖書館微博發布時間趨勢相似。由此可知,用戶評論信息分布易受圖書館微博發布時間影響,約呈現3級波浪式分布,起伏不大。結合圖3 可知,圖書館發布微博的時間段集中在上午的8:30—11:00 和下午的14:30—17:00,大致與上下班時間一致,而晚上發布的微博較少。由于用戶在晚上對圖書館微博的轉發評論的行為占據總活動數的相當大一部分,因此,圖書館可以選擇在18 點以后即用戶最活躍的時間段內發布一些微博,以達到更好的協同信息交流效果。
微博等虛擬型社交媒介的流行極大地促進了網絡信息的協同創作與共享深度,其內容離散程度高于傳統信息資源,來自于網絡上的任意合法用戶,主要以文字、符號、圖片、表情等豐富的評論形式出現。這些評論信息不僅是對信息主體場域的再構建,還能夠為其他用戶提供參考和借鑒。因此,圖書館等信息主體需要通過建立用戶信譽評分機制[25]、設置評論內容審核和可見度層級等方式對用戶評論內容質量予以控制,以促進自身帳號運營的健康發展和提高網絡協同信息資源的利用效率。
用戶是社交網絡平臺的體驗者和使用者,也是網絡協同信息的創造者和傳播者,他們參與信息協同交互的意愿和規模決定了社交網絡協同信息創作利用和交流共享的質量與效果。因此,在微博平臺運營過程中,圖書館需要利用豐富的想象力和創造力打造用戶喜歡的內容,以增強傳播效果。例如,衛龍食品與暴走漫畫合作,打造出“來包辣條壓壓驚”“來包辣條靜靜”“怒吃十包辣條”等網絡流行語和微博段子,圖文并茂,大量用戶被吸引并主動參與辣條的口碑傳播,使衛龍一躍成為食品界的網紅[26]。圖書館也可以借鑒和利用“網紅”效應,實現跨界合作,做好內容創新。
互聯網用戶日常的點贊、轉發和評論等協同交互行為,包含大量的個人隱私、社交興趣愛好和地理位置等重要的信息,形成龐大的協同信息集合。這些數據集合具有一定的價值和意義,但也會造成信息的批量泄露和非法交易。當前,世界范圍內的社交用戶隱私泄露問題日益凸顯,2018 年3 月,美國社交網站Facebook 超過500 萬用戶的信息被泄露,引發廣大用戶和媒體對個人網絡信息保護的關注。因而,圖書館等掌握了相當數量用戶信息的組織機構,不僅需要重視在網絡協同信息安全中信息本身的公開共享安全,還需要保護圖書館用戶的身份信息、聯系方式、家庭住址等重要的隱私信息安全,主動保護用戶隱私和網絡協同交互時的數據記錄安全。
(來稿時間:2019 年5 月)