張 坤
近年新信息技術的快速發展導致學術資源爆炸式增長,使用戶面臨的學術信息環境由信息不足轉變為信息過載,這對用戶獲取有效學術資源造成很大困擾,進而對學術資源服務機構提出新挑戰。新信息技術在為學術資源服務機構帶來新挑戰的同時,亦帶來新機遇。受益于新信息技術,學術資源服務機構的重要服務載體——通用學術搜索引擎得到快速發展,國內外幾大通用搜索引擎公司紛紛在其原有基礎上推出了通用學術搜索引擎,如谷歌學術、必應學術、百度學術等,為用戶獲取學術資源提供了極大便利。通用學術搜索引擎依靠通用搜索引擎成熟的技術及特有知名度與影響力,逐漸提升了用戶認知度和接受度[1],其重要性愈益凸顯。但與此同時,新信息技術也推動了專業學術搜索引擎的發展,且專業學術搜索引擎憑借專業優勢對通用學術搜索引擎的生存與發展形成巨大威脅。因此,為應對新信息環境造成的挑戰,更好地滿足用戶需求和要求,并在與其他學術信息檢索系統的市場競爭中占領一席之地,通用學術搜索引擎需不斷進行優化升級。
服務滿意度是用戶對通用學術搜索引擎整個服務過程的評價和情感反應[2],是通用學術搜索引擎服務能力的重要衡量指標[3-4]。對通用學術搜索引擎用戶服務滿意度的關鍵影響因素進行識別與分析,可為通用學術搜索引擎服務能力評估及服務優化與創新等提供參考與依據,具有重要的研究價值。具體說,本文探討如下問題:通用學術搜索引擎服務滿意度影響因素體系具體包括哪些影響因素?體系是否可靠?哪些是關鍵影響因素?有何有益啟示?為回答上述問題,本文基于改進后D&M模型,結合已有文獻、用戶訪談及通用學術搜索引擎的實際特點來構建通用學術搜索引擎服務滿意度影響因素體系,然后利用灰色關聯分析方法對專家評分結果進行計算分析,檢驗影響因素體系可靠性,識別通用學術搜索引擎服務滿意度的關鍵影響因素,并據此提出優化建議。
學術搜索引擎(Academic Search Engine,ASE),指搜尋科技與學術信息的信息檢索系統[5],是用戶獲取有效資源的重要途徑。ASE一般可分為專業ASE和通用ASE兩類,其中,專業ASE包括國外的Elsevier、Wiley、Web of Science(WoS)等和國內的中國知網、維普、萬方、CSSCI檢索系統、超星知識發現系統等;通用ASE包 括 國 外 的Google Scholar(GS)、Microsoft Academic等和國內的百度學術、搜狗學術、360學術等?,F有知名通用ASE多是在原有搜索引擎基礎上建立的[6],如GS是在國外知名通用搜索引擎Google的基礎上建立起來的通用ASE,使用Google獨特的算法,通過自動解析整個學術網站而非特定來源索引在網上查找各種學術資源[7],是科研人員搜索科學信息時廣泛使用的工具[8]。國內知名通用ASE百度學術是在百度這一中國最大通用搜索引擎基礎上拓展而來[9],能一站式為用戶提供海量的,甚至比專業ASE更多更全的國內外文獻[10]。目前,國內外圍繞通用ASE的研究主要集中于通用ASE與其他信息檢索系統的性能比較、通用ASE評價指標的有用性、通用ASE的系統優化、通用ASE的用戶使用行為幾個方面。
針對通用ASE與其他信息檢索系統的性能比較,有研究發現,GS甚至比WoS、Scopus等專業ASE的覆蓋范圍更廣,在對2009-2014年的調查數據進行統計分析發現,從GS中可以免費獲取WoS收錄文獻的55%,并且GS通常會提供指向檢索結果的免費鏈接,即使文檔不能從出版商網站公開訪問時也是如此[11]。研究進一步發現,在地理領域中,GS搜索到的結果數量高于WoS、Francis和GeoRef幾個搜索引擎,盡管在內容上有很大重疊,但GS也有部分新穎之處[12]。在化學領域中,GS在搜索數量、搜索范圍、操作習慣等方面比WoS也更具競爭優勢[13]。
針對通用ASE評價指標的有用性,有研究認為GS在獲取學術影響統計數據時非常有用,特別是在社會科學、人文科學這些學科中使用GS很有必要,它可以提供關于學術影響的全面信息[14];而且GS的表現相對穩定,即使在以往化學、物理等表現不佳學科,其覆蓋范圍也在快速提升,GS的使用可能會改變傳統社會科學在引文分析方面處于劣勢地位的局面[15]。研究進一步發現,除化學和物理領域的學科覆蓋面經歷一段時間的顯著擴張后,GS的學科覆蓋面正以穩定速度增長,GS比過去更適合用于評估和文獻計量學研究[16]。但也有研究發現,GS創建的元數據不符合標準,既不可靠,也不可重現,它曲解了個人、商業機構和期刊層面的度量指標[17],而且GS在引文和內容鏈接以及文獻計量學數據質量方面存在錯誤,盡管錯誤率比前幾年小[18]。還有研究發現,GS中期刊收錄覆蓋面雖有所提升,但h指數過于集中且偏低等問題依舊突出,因此不適合用h指數來評價GS中發文量低但引用量較高的期刊[19]。
針對通用ASE的系統優化,有研究介紹了學術搜索引擎優化(ASEO)的概念,并提供了如何為一般學術搜索引擎,特別是Google Scholar優化學術文獻的指導方針[20]。有研究提出學術搜索引擎優化(ASEO)是學術搜索引擎處理學術文章的關鍵要求,并提供了一個專注于期刊和學術論文搜索的新的專業搜索引擎[21]。還有研究介紹了如何通過在標題、摘要、關鍵詞等方面選擇恰當的詞語來優化科技出版物在互聯網上的可見度,并且給出了一個包含學術搜索引擎優化(ASEO)要素的例子[22]。
針對通用ASE的用戶使用行為,有研究發現75%的被調查者使用過GS,感知有用性、感知易用性和忠誠度顯著影響被調查者對GS的預期使用,而TAM模型可作為預測研究生使用GS的適用模型[7];科研人員的GS采納行為受到信息資源質量、感知有用性、系統質量、界面可用性、感知易用性和態度的顯著影響[23],而高等院校學生百度學術的采納行為主要受感知有用性、感知易用性、主觀規范、個人創新精神、忠誠度以及資料廣泛性的影響[24]。
綜上所述,當前圍繞通用ASE開展的相關研究已形成豐碩成果,這些為本研究開展提供了很好的基礎。但現有研究中仍存在著不足,首先,圍繞通用ASE服務滿意度影響因素主題的相關文獻并不多,且已有少量研究中往往只涉及對通用ASE服務滿意度影響因素和影響機理的探測與驗證等方面,并未構建其影響因素體系和深入識別其關鍵影響因素,這揭示了相關研究存在“量”和“質”的不足。其次,已有研究多是對某個通用ASE進行針對性探討,其研究重心在于“一個”而非“一類”,常見的如GS、百度學術等,這類研究多是從微觀層面進行了更為具體的實證工作,其所得結論對某具體通用ASE的借鑒意義較大,但由于不同通用ASE之間具有差異性,因此,其結論對整個通用ASE而言意義有限。為填補現有研究不足,本文將構建通用ASE服務滿意度影響因素體系,并對其可靠性和關鍵影響因素進行計算分析。
信息系統成功模型(D&M模型)是信息系統(Information System,IS)領域的經典模型,該模型已在諸多領域諸多情境的IS研究中被證實有效[25-26]。該模型提出IS的系統質量和信息質量影響用戶對IS的滿意度,其中,系統質量是IS本身的測度指標,用來衡量IS技術是否成功,信息質量是IS產出的測度指標,用來衡量IS語義是否成功[27]。Delone等[28]對D&M模型進行優化,提出IS的服務質量也會影響用戶對IS的滿意度,盡管過去他們認為服務質量僅是系統質量的一個子集,但IS的發展使他們認為需要從系統質量中提煉出單獨的服務質量指標,并且該指標可能是衡量IS部門整體成功的最重要部分,如果評估方案中不包括該指標,則可能會錯誤衡量IS的有效性,即改進后D&M模型提出用戶對IS的滿意度受IS的系統質量、信息質量和服務質量3個變量影響。該模型同樣被諸多研究證實有效[29-30]。據此,本文將通用ASE的系統質量、服務質量和信息質量確定為基本構面,并結合已有IS領域相關文獻和通用ASE服務的實際情況,初步提出各構面所對應的影響因素,進而構建通用ASE服務滿意度完整的影響因素體系。
針對系統質量和服務質量,Delone等[28]提出系統質量可通過適應性、可用性、可靠性、易用性和響應時長等指標來測量;服務質量可通過保證、同理心和響應性等指標來測量,其中“保證”指IS服務人員多大程度上具有做好本職工作的知識,“同理心”指IS多大程度上把用戶的最大利益放在心上,“響應性”指IS多大程度上可以快速滿足用戶需求。根據通用ASE的實際特點可知,通用ASE的系統質量容易受到易用性、穩定性和流暢性等因素的影響,其中,通用ASE的“易用性”即IS“易用性”的體現,“穩定性”即IS“可靠性”的體現,“流暢性”即IS“響應時長”的體現。由于在通用ASE情境下不存在“適應性”和“可用性”問題,故將這兩個指標刪除。服務質量容易受到移情性這一因素的影響,通用ASE的“移情性”即IS“保證”和“同理心”的體現,而由于通用ASE服務質量構面下“響應性”所表征內涵與通用ASE系統質量構面下“流暢性”所表征內涵具有重疊,故對通用ASE服務質量構面下的“響應性”進行刪除。針對信息質量,Miller等[31]提出信息質量可通過準確性、相關性、及時性和完整性等指標來測量;虞為等[32]提出百度學術可從全面性、權威性、時效性及免費性等指標來評估其信息內容。結合信息檢索系統對信息查全率和查準率的要求,本文認為通用ASE更強調信息的準確性、相關性、全面性、權威性、時效性和免費性。其中,“完整性”與“全面性”所表征內涵、“及時性”與“時效性”所表征內涵有所重疊,故對通用ASE信息質量構面下的“完整性”和“及時性”進行刪除。
由于通用ASE具有自身特殊性,可能會存在一些已有研究并未提及或已有研究提及但在通用ASE情境中并不成立的因素。為進一步保證所提取因素的可靠性,本文圍繞基本構面,結合通用ASE的功能與特點,組織了兩次面向資深用戶(5年以上使用經驗)和資深IS產品經理(3年以上工作經驗)的深度訪談,以進一步補充和修正其影響因素體系。通過對訪談結果進行內容分析,在系統質量構面下提煉出容錯性和安全性兩個新變量,在服務質量構面下提煉出個性化這一新變量,在信息質量構面下提煉出豐富性這一新變量。但考慮信息質量構面下的“豐富性”與“全面性”,“相關性”與服務質量構面下的“個性化”所表征內涵有所重疊,故對通用ASE信息質量構面下的“豐富性”和“相關性”進行刪除。經過補充修正,最終共得到3個基本構面和12個影響因素,進一步確定各因素的具體內涵,并據此構建通用ASE服務滿意度的影響因素體系,見表1。

表1 通用ASE服務滿意度的影響因素體系
鄧聚龍1982年首次提出灰色系統理論[33],衍生出灰色關聯分析方法,即用來研究隨機變量之間相關關系的一種多因素統計分析方法[34]。該方法以“小樣本”“貧信息”的不確定性系統為研究對象,通過從部分已知信息中提取有價值信息,從而正確認識系統運行規律并實現對系統的有效控制,其核心是根據各變量數據序列對應幾何形狀的相似度來判斷各變量序列的關聯度,即幾何形狀越相似,變量關聯度越大,反之則越小[35]。由于用戶對通用ASE服務滿意度受多因素共同影響,各因素間聯系不明確,且該方法已被多次應用于我國各領域關鍵影響因素的識別研究當中[36-37],具有科學性和廣泛適用性,因此灰色關聯分析方法用于本研究較為合適。
通過專家打分的形式對通用ASE服務滿意度各因素的影響程度進行測評,共邀請9位IS領域的專家學者按照十級打分規則對所有影響因素進行評分(0~10表示影響因素極不重要→影響因素極重要)。其中,3位系從事IS相關研究5年及以上的科研人員,3位系從事IS工作3年及以上的資深IS產品經理,3位系使用通用ASE 5年及以上的資深用戶,所得評分結果見表2。

表2 專家評分結果
各因素與通用ASE服務滿意度的關聯度表示各因素對通用ASE服務滿意度的影響程度。根據灰色關聯分析方法要求,本文將通用ASE服務滿意度各影響因素的計算過程分為以下幾步。
(1)確定無量綱化后的比較數據列{Xi}。由于不同專家對各因素的認知差異可能會導致數據量綱存有偏差,因此在進行灰色關聯分析時,需進行無量綱化。本文通過離差標準化公式X*=對原始數據列,即專家評分結果(表2)進行無量綱化。X*表示轉化后數據,取值為[0,1],Xik表示源數據,且1≤i≤12,1≤k≤9。為方便分析,對所得數據進行十分制轉化后,得到最終的比較數據(見表3)。

表3 無量綱化后的數據
(2)確定參考數據列。本文將評分結果(表2)中各列的最大值視為原始比較數據列的最優值,并將其作為參考數據列{X0},據此得到{X0}={10,10,9,10,10,10,9,10,10}。
(3)計算求得參考數據列{X0}與比較數據列{Xi}的絕對差值|X0(k)-Xi(k)|,據此計算各因素的灰色關聯系數ζi(k)。ζi(k)反映的是比較序列與參考數據列在某個具體節點(即曲線中各點)的關聯程度值,可根據以下公式求得

其中,ρ表示分辨系數,取常規值0.5,據此逐一計算各因素的ζi(k)見表4。
(4)關聯度排序。由于關聯度曲線上的節點由許多零散節點聚合而成,因此需將關聯度曲線中各點的關聯度聚合為一個代表其整體的數值,即總體關聯度γi。γi值越接近1,說明該因素與比較目標的關聯度越高,越可能是比較目標的關鍵影響因素。根據公式求得各因素總體關聯度γi,見表4。其中,1≤N≤9。

表4 灰色關聯度
根據γi的排序結果可識別通用ASE服務滿意度的關鍵影響因素。由表4可知,通用ASE服務滿意度影響因素體系中所有影響因素的γi按照由大到小順序排列依次是準確性(0.837)、移情性(0.743)、權威性(0.708)、免費性(0.708)、易用性(0.658)、流暢性(0.641)、時效性(0.628)、穩定 性(0.625)、 全 面 性(0.617)、 容 錯 性(0.581)、個性化(0.579)、安全性(0.579)。在各基本構面中,信息質量對應影響因素的γi按照由大到小順序排列依次是準確性、權威性、免費性、時效性、全面性;系統質量對應影響因素的γi按照由大到小順序排列依次是易用性、流暢性、穩定性、容錯性、安全性;服務質量對應影響因素的γi按照由大到小順序排列依次是移情性、個性化。根據帕累托定律(即二八法則),任何系統中,約80%的結果是由該系統中的重要變量產生,而重要變量通常僅占少數,約占全部變量的20%。據此,本文將所有影響因素的γi計算結果中排名占前20%的因素視為關鍵影響因素,最終確定將γi值最高的3位視為關鍵影響因素。但由于權威性和免費性兩因素的γi值相同,并列第三位,故本文將其全部視為關鍵影響因素。因此,通用ASE服務滿意度的關鍵影響因素為準確性、移情性、權威性和免費性。
灰色關聯度值一般可分5個等級,其中[0,0.3)為低,[0.3,0.5)為較低,[0.5,0.7)為中等,[0.7,0.9)為較高,[0.9,1]為高[38]。研究結果顯示,本文所構建的通用ASE服務滿意度影響因素體系中,所有影響因素的關聯度都超過0.5,證實本文影響因素提煉的合理性和影響因素體系構建的可靠性。在所有因素中,4個關聯度最大的因素中沒有一個源于系統質量,說明在3個基本構面中系統質量對用戶通用ASE服務滿意度的影響較小,這和Wang等[39]、Stefanovic等[40]發現系統質量對用戶滿意度具有最大影響的結論不一致。原因可能在于,通用ASE的系統質量固然重要,但當前許多通用ASE都是在國內外知名通用搜索引擎基礎上發展而來,其系統已相對成熟,基本都能使用戶滿意。以流暢性為例,根據訪談結果,該因素幾乎是所有IS進行優化升級時都會考慮的,但經過多次改進后,其提升空間非常有限,進而可能導致用戶感知不明顯。研究還發現,在所有因素中,4個關聯度最大的因素中有3個源于信息質量,說明在3個基本構面中信息質量對用戶通用ASE服務滿意度的影響較大,這啟示通用ASE服務提供方需重點保障其提供的學術信息的質量。同時,本文識別出準確性、移情性、權威性與免費性4個關鍵影響因素,說明它們對通用ASE用戶滿意度的影響最為重要,是通用ASE服務提供方進行服務優化或創新時必須加以關注和改進的方面。這些指標的識別為通用ASE服務優化與創新提供了具體依據和明確方向。
(1)信息準確性對通用ASE服務滿意度具有最重要影響力,說明通用ASE需全力保障輸出信息的準確性。結合通用ASE的特性,其準確性主要體現于信息內容是否與客觀實際相一致,即信息內容的準確度。新信息環境下,由于信息量大,信息質量高低不一、魚龍混雜,且由于學術信息往往具有較強的專業性,不容易甄別,因此,獲取準確信息成為用戶搜索時所追求的重要目標。在此背景下,通用ASE提供的信息越準確,用戶滿意度可能就越高。對此,通用ASE可借助眾人之智,建立成熟的反饋修正機制,激發用戶上傳版權范圍內的可靠學術信息,而當有用戶向系統反饋信息不實時,服務方應即刻對反饋信息進行標注、查實與修正,并允許其他用戶對標注信息進行修改,甚至可以邀請相關學術領域的專業人士對其進行回答與修改,類似于知乎問答平臺中的“邀請回答”。
(2)服務移情性對通用ASE的影響力位列第二,說明移情性是通用ASE需關注的另一重心。移情性即共情,體現于服務方對被服務方的理解程度,即通用ASE是否會在各個環節均能為顧客著想,并盡力滿足其需求。顯然,用戶所感知到的通用ASE及其服務人員越為其考慮,其體驗滿意度可能就越高。對此,通用ASE需強化相關服務人員“用戶為本”的服務意識,不僅體現于界面設計的友好性、系統使用的人性化、信息傳播的交互性,還體現于用戶服務的積極性與主動性。
(3)信息權威性對通用ASE服務滿意度的影響力位列第三,說明用戶更青睞具有權威性的信息來源。網絡時代為用戶共享信息提供了便利,但由于學術信息往往具有較強的專業性,導致用戶間信息不對稱性明顯,加之用戶個人認知存在差異,其輸出的信息質量很多時候良莠不齊,甚至真假難辨。在此情況下,用戶最省時省力省心的方式就是根據信息源來判斷信息質量,即越是知名學者、官方機構等權威信息源提供的學術信息,就越容易被視為準確的,且越容易被用戶采納,用戶體驗滿意度也越高。因此,通用ASE可通過建立相應激勵機制吸引知名學者、權威人士、官方機構等“意見領袖”的加盟,并通過其特有的“名人效應”促進用戶對其服務滿意度的提升。
(4)信息免費性對通用ASE服務滿意度的影響力位列第三,說明用戶更希望在通用ASE中獲取免費資源。通用ASE的受眾以學生群體居多,學生群體往往沒有收入來源,對免費資源更為敏感,因此通用ASE越容易獲取免費學術信息資源,用戶滿意度可能就越高。對此,通用ASE一方面可考慮加強和部分高校、科研院所等機構的合作,實現非保密性學術資源的流通共享,并通過系統鏈接關聯到部分合作機構的內部資源網站,從而獲取免費資源;另一方面可通過建立適當的激勵機制以促進用戶個人主動進行版權范圍內的資源共享。
此外,隱私問題是數字時代用戶關注焦點[41],隱私憂慮、隱私關注等安全性因素已被證實在諸多情境諸多IS中都會對用戶體驗產生較大影響,但本文發現其對通用ASE服務滿意度的影響最低。可能原因如下:一是由于使用通用ASE的用戶多為科研人員,相較于其他人群,這類群體往往對各種風險都司空見慣,可能對各種風險都具有更強的“免疫力”,并且他們可能更能理解個性化服務的實現需要以信息披露為代價。二是受搜索內容本身特性所致,用戶使用ASE過程中可泄露的信息主要是個人信息和學術信息,而個人信息披露幾乎是用戶使用所有IS都會面臨的問題,因此用戶對安全性的擔憂可能主要源于學術信息搜索痕跡或內容的泄露,但這類信息一般并不會對用戶產生很大負面影響,進而可能導致用戶對該因素并未過度關注。三是由于本文數據搜集對象都屬于高知群體,其信息素養和隱私保護素養相對較高,進而可能導致其對風險感知并不十分明顯。
本文基于改進后的D&M模型,結合文獻調研、用戶訪談和通用學術搜索引擎的實際特點,構建包含3個基本構面和12個影響因素的通用ASE服務滿意度影響因素體系,然后借助灰色關聯分析方法,驗證體系的可靠性,識別出準確性、權威性、免費性和移情性4個通用ASE服務滿意度的關鍵影響因素,并據此提出若干優化通用ASE服務的策略啟示。
本文貢獻在于:(1)以往研究較少對通用ASE服務滿意度影響因素體系和關鍵影響因素進行系統探討和深入識別,本研究的開展在豐富現有研究“量”的同時,也填補了現有研究不足,完善了現有研究體系,不僅為后續研究提供了基礎和思路,還將結論的適用性由“特殊”擴展為“一般”。(2)從改進后D&M視角對通用ASE服務滿意度進行專門分析的研究很少被報道,本研究的開展不僅拓展了改進后D&M模型的適用場景,還對模型中系統質量、服務質量和信息質量的下位指標進行了擴充與細化,并對其影響程度進行了測算,進一步深化了改進后D&M模型的理論內涵。(3)已有類似文獻在對關鍵影響因素進行識別研究時的方法趨同性較強,往往會用到層次分析[42-43]、DEMATEL[44-45]等方法,本文利用區別性的灰色關聯分析方法進行計算分析,研究方法的結合使用及成功運用,在拓展該方法適用領域的同時,也為后續類似研究提供了方法借鑒。(4)構建通用ASE服務滿意度的影響因素體系,為未來專用ASE及其他信息檢索系統服務滿意度評價體系的設計提供了指導與參考,也為通用ASE服務的優化和創新提供了目標與方向。特別是,識別出通用ASE服務滿意度的關鍵影響因素,并提出針對性建議,為通用ASE服務優化與創新提供了具體思路。
本文亦存有不足。一方面由于視角的局限,本文從改進后D&M模型的系統質量、服務質量和信息質量層面來提煉通用ASE服務滿意度的影響因素,可能會導致提煉的影響因素并不全面;未來研究考慮結合其他視角或使用扎根理論等方法對相關影響因素進行全面探測,從而構建更為全面的通用ASE服務滿意度影響因素指標體系。另一方面本文采用小樣本調查法,且在參考數據列設定、關鍵影響因素確定等方面具有主觀性,可能導致研究結論穩健性不足;未來研究考慮擴大樣本的規模與范圍,并結合使用更大規模的問卷調查等研究方法,從而進一步提升結論的穩健性。