黎邦群
OPAC用戶生成內容優化
黎邦群
文章針對當前圖書館OPAC網站的用戶生成內容缺少優化而影響檢索體驗的現狀,進行用戶生成內容優化的影響因素及具體策略的研究。通過探討用戶生成內容優化的用戶、質量及價值等影響因素,研究用戶培養、質量控制及價值挖掘等策略,并在此基礎上,從影響用戶的積極性、產生糾紛風險及加重工作人員負擔等方面對優化的負面效果及改進措施進行了詳細的分析,從而就用戶生成內容的優化給出了合適的建議,呼吁圖書館重視優化工作,以期提高OPAC用戶生成內容的質量,提升用戶的檢索體驗,維護圖書館的良好形象。
OPAC 用戶生成內容 內容優化 質量控制 用戶培養 用戶體驗
近年隨著Web 2.0的概念及用戶參與的理念深入人心,OPAC網站的用戶生成內容(User Generated Content,UGC)與日俱增。用戶輸入的檢索詞、檢索行為及其特征等隱性內容和書評、標簽及留言等顯性內容,逐漸成為書目元數據必要的有益的補充,但與書目數據相比,用戶生成內容明顯存在著信息準確度不高與格式不規范、侵犯隱私與版權、不良信息與行為等弊端,嚴重影響了圖書館的形象與用戶的檢索體驗,亟需優化。
然而,目前針對OPAC內容的優化,多集中于書目元數據,如數據規范[1]、質量控制[2]及編目建設[3]等,很少關注用戶生成內容。文獻檢索結果顯示,相關的理論研究明顯滯后于實踐,尤其缺少以影響因素為視角來系統地論述具體的優化策略方面的研究。
1.1 用戶因素
用戶生成內容屬于一種勞動密集型的信息生產模式,生成的過程離不開用戶,內容優化的影響因素與用戶密切相關,包括用戶特征、用戶動因與生成模式等用戶因素。
(1)用戶特征。OPAC用戶為圖書館的讀者,包括高校圖書館的教師與學生、公共圖書館的普通市民、科研工作者與學術研究者等,分布廣泛。OPAC從以編目元數據的聚合、發布及瀏覽為主的Web 1.0發展到了以用戶的參與、互動及傳播為主的Web 2.0,其用戶已從早期的被動接受與有限參與,發展為主動參與和自我創造內容,用戶性格特征由含蓄內斂到個性張揚,完成了角色轉換,從而奠定了用戶驅動的數字信息資源建設與服務的基礎。
(2)用戶動因。OPAC用戶在生成內容的過程中往往受到興趣、利他主義、易用性、樂趣、社會身份認知、機會主義和個人聲譽等不同因素的影響,具有不同的強度和指向。用戶動因在宏觀上受OPAC功能及圖書館服務觀念等外部因素的影響,在微觀上受使用心理、檢索行為等內部因素的影響,具有動機復雜、自主性強、難以控制等特點。用戶生成內容的詳細動因包括5個方面:①價值表達。用戶利用OPAC的相關開放平臺表達自己的價值觀。比如發表特定圖書的閱讀見解和主觀感受,表達自己的價值觀;或對其他用戶的書評內容與觀點進行響應、探討及爭鳴。這些價值觀帶有鮮明的情感傾向;②功能反饋。用戶對OPAC的功能、屬性與性能進行評價、判斷,提出需求與建議。比如用戶分享圖書檢索的經驗與技巧,披露相關功能的細節等;③知識訴求。用戶為了獲取新的知識,就某一疑難問題向同行詢問、請教或求助,其他用戶答疑解惑,提供幫助;④檢索需求。用戶利用OPAC的書目檢索程序查詢所需圖書,由此生成檢索詞、檢索習慣與行為等隱性知識內容;⑤交友從眾。用戶利用OPAC的讀者交流平臺來尋找志同道合的朋友或受其他用戶言論的感染而直抒胸臆。這類用戶為了結交關系、提升品位或消磨時間而生成內容。
(3)生成模式。用戶動因所表現出的心理活動和行為特征不盡相同,并對生成模式產生影響。獨立自主式、協作關聯式以及兩者結合式是OPAC用戶生成內容的主要模式。獨立自主式是指用戶生成內容的過程完全獨立,不需要其他用戶的參與和幫助,如用戶單獨添加個性化的虛擬書架的過程。協作關聯式是指多名用戶共同參與,圍繞某一具有關聯性的主題展開創作與分享,不斷完善與豐富生成的內容,如多名用戶針對某條書評而展開的討論。兩者結合式是指用戶生成內容既存在單一用戶的獨立貢獻,又存在多名用戶的共同協作,如熱門圖書標簽云圖的形成。
1.2 質量因素
傳統OPAC的基本內容即書目元數據主要由圖書館編目員生成,具有規范化、權威性、客觀性及可信性等專業特征。用戶生成內容則具有很大的隨意性,加上監管困難,相關法律和政策缺位,造成了種種的質量隱患,主要表現形式如下:
(1)劣質數據。用戶生成內容的質量低劣,對其他用戶的參考價值不大,或者毫無價值,甚至存在負面價值。包括無關、重復、片面、偏頗、偏激或錯誤的觀點。
(2)不良信息。隨著用戶生成內容的蓬勃發展與用戶普及而激增的垃圾與虛假信息、違規內容與版權信息、隱私信息與謠言等垃圾2.0[4],幾乎伴隨著Web 2.0的流行應運而生,成為危害網絡與社會的毒瘤,典型特征包括內容與作者相似,目標、時間與IP地址集中等。
(3)不良行為。即用戶惡意的檢索、點擊、訪問、推薦、投票等行為。比如連續不間斷地刷新某頁、檢索重復的關鍵詞等行為,多集中于用戶生成的隱性內容方面。
這些劣質或不良的數據、信息及行為不請自來,對用戶造成困擾與誤導,廣遭詬病,浪費了有限的網絡帶寬與OPAC系統資源,并造成圖書館相關統計結果的不公正。
1.3 價值因素
OPAC用戶的性別、專業、閱讀興趣和愛好不同,價值觀與偏好、需求與行為千差萬別,導致用戶生成內容復雜多樣,具有多元化與差異化、分散性和無序性等特征,可靠性、權威性和價值得不到保證。實際上,互聯網中大部分用戶生成內容貢獻的價值都不高。雖然用戶生成的隱性內容蘊含了豐富的主觀觀點資訊,但并不會實時地共享給其他用戶,價值尚有待發掘。顯性內容受表達方式、語言提煉能力的影響,傳遞的價值可能與用戶生成的初衷存在一定的出入,導致其他用戶的閱讀與理解出現偏差,價值也受到影響。
用戶生成內容對圖書館而言,既是“餡餅”也是“陷井”。為了降低劣質數據、不良信息與行為的存活率,提高內容的質量,必須對其予以優化,以去偽存真,去粗存精。根據其影響因素,相關的優化策略如下:
2.1 用戶培養
OPAC用戶生成內容的參與者可分為以下幾類:一是潛水者或圍觀者即普通看客,看完即走,什么都不留下;二是核心貢獻者即忠誠粉絲,與OPAC充分互動,并真正參與建設;處在兩者之間的是一般的參與者和協作者、傳播者。圖書館需要把握貢獻來源,查看用戶信息,并對貢獻用戶進行收藏、評級、分組、建群及備注等。
(1)用戶自律。包括用戶約束自己與監督他人。從自我約束的角度看,用戶需要提高自身的道德素養;從監督他人的角度看,用戶需要抵制各種不健康、不文明的信息。互聯網的自由性和開放性,導致部分生成內容的匿名性。一般的用戶缺乏明顯的自律意識,應加強教育與培養,促進用戶生成內容的健康發展,使OPAC成為安全、可靠、清潔的網絡空間。
(2)用戶基數培養。用戶基數是指網站形成的相對固定的活躍用戶數量。過少的用戶基數,不利于內容的聚合,無法吸引新用戶加入。優質內容的生成離不開增長強勁的用戶基數支持。圖書館可以通過宣傳推廣OPAC網站、提升用戶檢索體驗等舉措,培養一定的用戶基數與相對固定的核心用戶群。
(3)意見領袖發現。意見領袖是指少數貢獻頻率和貢獻數量極高的用戶,經常提供信息,同時對他人施加影響的活躍分子[5]。其他用戶經常對意見領袖貢獻的內容表示認同、呼應、追隨或反對。OPAC不乏意見領袖,具有對內容進行加工與解釋、擴散與傳播、支配與引導、協調或干擾等作用,并對追隨者產生影響力,左右輿論走向??赏ㄟ^社會學技術、關鍵信息提取及問卷調查等途徑來識別意見領袖,從影響力、支持力等方面刻畫意見領袖。
2.2 質量控制
用戶生成內容質量控制工程師已成一門新職業,優秀人才備受爭奪,體現了用戶生成內容質量控制的重要性與緊迫性。OPAC用戶生成內容的質量控制策略對用戶的使用權利、義務與行為責任進行界定,并明確圖書館的防范與發現、作為與不作為等義務和責任。
(1)制度監管。為了控制用戶生成內容的質量,必須制定相應的管理制度對用戶行為的隨意性加以規范,并認真貫徹執行。管理制度中包括獎勵與懲罰條例,督促用戶發表或編輯合適的內容,提醒用戶遵守法律法規,注意網絡道德。獎勵措施包括激勵用戶多貢獻高價值內容的機制,懲罰措施包括刪除用戶內容、禁言與注銷賬戶等。圖書館可以訂立類似《新浪微博社區公約》[6]的管理制度及行為準則,約束用戶行為,作為《信息網絡傳播權保護條例》等具有強制性約束力的正式的網絡監管法律的補充。
(2)技術治理。為了規避風險和防范不良信息與行為,需要積極采用內容識別和過濾技術,對用戶生成內容進行技術治理與數據清洗,以凈化OPAC的內容,給予用戶更好的體驗。如改進用戶提示系統,隨時提醒用戶注意網絡言行;在允許用戶生成內容的所有OPAC網頁上,添加一個“報告違規行為”或“違法和不良信息舉報中心”的鏈接,以便用戶舉報發送不良信息的嫌疑者;根據需要過濾大量轉載和非法鏈接等不規范的內容,比如過濾字符數在20個以上的書簽或10個以下的書評;建立違規關鍵詞數據表,對不良信息及檢索詞進行關鍵詞過濾;運用SQL語句檢索內容數據庫,禁止發表重復內容等。
(3)人工審核。OPAC雖為非營利性網站,圖書館仍需對用戶生成內容的保存和發表負責。由于用戶群體的多元化和多樣性,生成內容的質量參差不齊,制度監管與技術治理存在一定的局限性。圖書館應制定內容審核機制,并配備專門人員成立檢查小組,主動檢查OPAC熱門網頁,每周至少檢查一次。對內容進行長期的人工評估、甄別、篩選和分析,推薦優質內容,發現并及時屏蔽不良信息與行為。針對訪問統計結果顯示比較熱門的信息,予以高度關注,作出清醒而冷靜的判斷。人工審核的好處不言而喻:根據《信息網絡傳播權保護條例》規定,只要圖書館及時刪除侵權信息,就可以免于承擔賠償責任。
(4)與其他網站交換數據。圖書館可以通過與其他網站交換高質量用戶生成內容的方式來豐富自身的OPAC內容,交換的內容包括但不限于圖書封面、責任者簡介、文摘或摘要、全文目錄、標簽或書評等數據,以彌補OPAC網站用戶生成內容價值低、圖書信息揭示簡單的缺陷,更好地滿足用戶深入了解圖書相關信息的需求。與其他網站進行相關信息的交換與整合,是Web 3.0概念中最重要的特征與理念。
2.3 價值挖掘
(1)檢索詞與檢索行為挖掘。在質量控制的基礎上,利用偏好信息處理與個性化檢索技術,通過分析用戶的行為特征,幫助用戶尋找高質量內容。檢索詞與檢索行為屬于隱性內容,需要進行數據挖掘才能體現價值。OPAC檢索框是用戶向圖書館提交信息需求最直接最便捷的入口,檢索詞是反映用戶信息需求最緊要的數據,檢索行為表達了用戶最明確最迫切的想法。檢索詞及用戶的檢索行為隱含了用戶對書目的評價和需求,蘊藏了豐富、未知、有用的知識,對圖書館的個性化主動服務、關聯性內容推薦、學科文獻資源建設決策、業務管理優化等非常有價值。筆者曾對檢索詞和檢索行為進行收集、利用、挖掘和整理,設計和實現了OPAC拼寫檢查[7]、檢索建議[8]及書目糾錯[9]等功能,以挖掘用戶生成內容的價值。
(2)用戶主觀觀點分析。用戶生成內容由用戶直接貢獻,蘊含了用戶所表達的主觀觀點,例如需求、疑問、建議及評價等,應對其予以深入分析,以了解用戶需求,把握用戶行為。主要工作包括主觀觀點表達的發現與主觀觀點的抽取等。如運用相關的機器學習算法與計算機技術,通過對內容進行詞法、語法分析,利用詞語、語法、位置等特征,識別內容中體現主觀觀點句子,判斷觀點屬于嘩眾取寵還是真知灼見,抽取出評價對象和用戶喜好等。這對分析與判斷用戶的檢索需求與意圖,開展個性化的圖書推薦等特色服務不無裨益。
2.4 負面效果與改進措施
用戶生成內容優化的效果評價應以提升OPAC用戶使用體驗為目的和標準,因此,相關的優化策略不可避免地將會產生如下的弊端:
(1)影響用戶的積極性。質量控制策略中的制度監督、技術治理、人工審核等舉措,如對用戶造成了過多的干涉與管制,容易剝奪其自主性,導致其參與積極性降低,打擊了其熱情與意愿,不利于內容的即時發布分享,對生成的氛圍與環境造成負面影響。因此質量控制措施應做到“潤物細無聲”,盡量讓用戶感覺不到束縛。圖書館在制訂相關的制度條款時,要注意措辭友好、語句溫馨,爭取獲得OPAC用戶的廣泛認同。
(2)產生糾紛風險。用戶可能會對圖書館處理違規內容的行為產生抵觸情緒,對違規的判別標準及執行力度產生懷疑,對懲罰措施產生反感,并由此帶來各種爭執與糾紛風險。制度條款應盡量清晰明了,處理過程透明,以免產生歧義與錯覺,力爭減少爭議。處理違規用戶既不能縱容與姑息,又要避免過度刺激用戶,力戒粗暴的網絡“執法”行為,耐心細致地做好受罰用戶的解釋與安撫工作。例如,可以用隱藏灰色地帶的內容并進行提醒、警示與教育等組合行為來替代強硬刪除等單純的處罰手段。
(3)加重工作人員負擔。OPAC用戶生成內容優化是一項長期工作,需要圖書館持續地投入大量的人力,這無疑會加重工作人員的勞動強度,給本來就在人員編制與人力資源上捉襟見肘的圖書館帶來額外負擔。但是相比優化的需求與價值,這種投入無疑是值得的。僅憑圖書館一己之力難以面面俱到,可以招募內容優化的志愿者,組織熱心用戶成立自律小組,給予核心用戶更大的網絡自治權,以減輕工作人員的負擔。
采用Web 2.0技術生成內容來彌補傳統OPAC書目信息量不足的缺陷,對館藏進行全面、準確、實時的揭示,增加圖書館網站的用戶粘性,是OPAC革新的要求。優化用戶生成內容,去其糟粕,取其精華,是用戶的強烈需求與圖書館義不容辭的責任,對于提高OPAC口碑和促進品牌建設,具有現實意義和直接影響,圖書館應予以足夠重視并實施積極有效的策略。用戶生成內容的發展趨勢是融合化、大眾化與移動化。隨著移動互聯網的高速發展,移動用戶生成內容勢不可擋,成為互聯網的新熱點。手機等移動終端能與用戶產生更好的互動性,更貼近用戶,移動用戶生成內容將隨著移動終端功能的增強而越來越豐富,相關優化的研究近在咫尺。
[1]胡良.新印古籍書目數據建設探討——以中國人民大學圖書館為例[J].圖書館工作與研究,2013(2):78-80,93.
[2]易向軍.聯機編目環境下書目數據規范控制研究[J].中國圖書館學報,2011(6):120-124.
[3]周小敏.全國圖書館聯合編目中心書目數據質量控制[J].圖書館建設,2011(2):56-59.
[4]HAYATI P,POTDAR V,TALEVSKI A,et al. Definition of spam2.0:new spamming boom[C].Digital Ecosystems and Technologies,2010:580-584.
[5]王培.我國大眾虛擬社區意見領袖輿論影響力研究[D].長春:東北師范大學,2009:4-2.
[6]新浪微博社區公約[EB/OL].[2013-03-07].http://weibo.com/z/guize/zhengqiu.html.
[7]黎邦群.OPAC拼寫檢查功能的設計與實現[J].圖書館學研究,2012(4):73-79.
[8]黎邦群.基于數據特征的OPAC簡單檢索及檢索建議[J].圖書館論壇,2012(1):65-68.
[9]黎邦群.OPAC書目糾錯功能的設計與實現[J].大學圖書館學報,2012(1):59-63.
UGC Optimization for OPAC
LI Bang-qun
On account of the poor search experience caused by the lack of UGC optimization for library OPAC,the paper studies the influence factors like users,quality and value of UGC;as well as the strategy of UGC optimization,such as user training,quality control and value mining.The author does detailed analysis of the negative effects and the improvement measures of UGC optimization from user's enthusiasm,potential disputes,increasing librarian workload,etc.;then,makes suggestions to optimize the UGC for OPAC;and calls for library's attention to the optimization,so as to improve the quality of UGC,enhance the search experience,and promote the image of library.
OPAC;UGC;content optimization;quality control;user training;user experience
格式 黎邦群.OPAC用戶生成內容優化[J].圖書館論壇,2014(1):80-84.
黎邦群,男,惠州學院圖書館副研究館員。
2013-03-07