張文飛 唐沛
海量內容集成、高效信息處理、智能數據分析……數字技術和信息技術儼然已經重構了專業出版的方方面面,也帶來了學術服務無限暢想的可能,如信息組織集成化將帶來全面精準的內容提供,信息處理數據化使實時把握科研動態成為現實,信息管理智能化讓科研成果管理變得更加高效,信息傳播社交化促進即時互動的學術交流,信息載體多樣化形成隨時隨地多終端閱讀的便捷體驗等。本文擬以人大數媒科技(北京)有限公司(以下簡稱“人大數媒”)的探索為例,從學術內容服務、學術分析服務、學術管理服務三個維度簡要探討如何借助數字技術和信息技術實現學術服務模式的創新。
一、重構學術內容服務模式
學術內容服務中,信息的獲取是學者最迫切的常態化需求。數字技術影響下的學術領域中,學者用戶關注的不再是簡單的文獻、知識的獲取,而是如何從復雜的信息環境當中汲取解決所面臨問題的信息內容,并將這些信息動態重組為相應的解決方案。然而,由于互聯網低質信息泛濫,目標信息極易被淹沒在海量信息中,更多的信息卻無法帶來更多的價值;快速瀏覽信息的互聯網閱讀方式也會受到海量內容噪音(如廣告、圖片、彈出窗口、社交工具、電子郵件等)的干擾,令學者難以保持長時間的閱讀專注力,對學者的系統化思考、概念抽象、內省、推理、批判性思維等方面帶來難以評估的不良影響;與此同時,完全市場化的互聯網消費模式中,學術內容良莠不齊,大量吸引眼球的低質重復性內容充斥屏幕,真正優質的學術內容難以脫穎而出,隱形信息極難捕捉,往往令學者搜索無方,有心無力。
解決這一現狀的創新探索主要可以著力于兩個方面:一方面是通過用戶分析技術,整合用戶的身份屬性(如性別、職業、專業、研究方向等)、興趣屬性(如閱讀偏好、分類維度等)、行為屬性(如瀏覽、收藏、訂購記錄等)、統計數據(如ARPU付費率、PV瀏覽量等)等數據信息,實時向用戶推送其感興趣或有潛在需求的內容,充分實現內容與用戶興趣及專業方向的匹配;另一方面采用用戶上傳、自有信息建設、站外信息抓取等手段,實現網絡信息采集與動態重組,滿足用戶學術信息一站式獲取需求。
人大數媒“學者在線”項目組所進行的幾點探索,也許能帶給人們一定的啟發。“學者在線”人文社科學術成果發布和共享平臺,是人大數媒依托中國人民大學書報資料中心的期刊、文章、學者等學術數字資源,開發的一款致力于實現前沿學術研究成果追蹤、海量學術信息跨庫搜索及應用、學者交流互動及成果自助出版等功能的多終端互聯網及移動互聯網應用平臺。
首先,“學者在線”提供面向用戶興趣點的實時內容推送,以保證用戶能準確獲得目標信息。平臺功能模塊引導用戶關注所在學科方向的期刊、文章、學者,主動向用戶推送目標信息更新內容。例如,某用戶關注了學者陳雨露,系統將根據用戶自定義條件,將陳雨露最新發表的論文及相關領域其他學者的論文主動推送給用戶。同時,用戶可進行“論文點擊量大于X(數量)、論文被引量大于X(數量)、論文引用我的文章、論文作者含我的關系學者、論文屬于我關注的學科”等個性化內容推送方面的設置。
其次,“學者在線”提供面向用戶研究領域的學術資源整合,保證用戶在細分研究領域全面精準地獲得信息。其“學術資源脈絡”產品整合了論文、期刊、圖書、學者、機構、項目、會議等資訊信息,學者只需點擊進入所關注的領域頁面,就能一站式獲取其希望查詢的相對全面的學術資訊。
再次,“學者在線”提供面向內部數據庫與外部數據庫之間的知識網絡鏈接,保證用戶在多個數據庫之間便捷地檢索內容,不需要在多個網站或頻道間頻繁跳轉。例如,用戶搜索某篇論文,頁面將顯示出其來源出自萬方數據庫、中國知網、維普數據庫等鏈接地址。事實上,用戶關心的也僅僅是信息本身,而非信息提供方。
同時,“學者在線”應用強大的LBS技術,可以為學者提供隨時隨地的學術信息的實時獲取。例如,某學者來北京參加某個學科領域的研討會,“學者在線”移動端可根據學者所在位置的變化,實時為他推薦同城該領域及他所關注的學術領域的課程、會議、活動信息,以方便該學者利用出差在外的空余時間參與同行交流。
二、重構學術分析服務模式
網絡時代的數據采集和分析方興未艾,基于精準定量分析的學術觀察還不完善,無論是機構還是學者個人,往往都只能看到自己一畝三分地里的變化,專注于現象而非規律,了解個體而非全貌,癡迷于量化而非分析,這讓各學術主體既缺乏溝通,也缺乏戰略前瞻性眼光,對其自身發展十分不利。當前學術界的各項排名榜單和數據分析也多止步于封閉系統中的感性認知,形成一個個信息孤島,較少關注信息的內在聯系和學術發展脈絡走勢。比如說,我們可以從2012人大《復印報刊資料》轉載學術論文指數排名中得知在2012年度中,中國人民大學在哲學、理論經濟學、應用經濟學、法學、政治學、社會學、新聞傳播學、工商管理、農林經濟管理、公共管理10個一級學科,轉載量、綜合指數排名中位列各高校第一名,但卻無法從指數排名中得出中國人民大學這10個學科的研究特色和發展走勢,缺乏對機構學科發展的整合型數據分析,難以把握機構學科的發展全貌,并據此向機構提出學科發展的建設性意見。可以說,無論是宏觀層面的學科、學者、機構、刊社基本情況,還是微觀層面的文章、讀者、地區、作者細分數據,都亟需投入大量的人力及時間成本進行采集和研究。
事實上,學術分析服務是一個極其復雜的過程,它不同于傳統的數據庫技術和簡單的知識發現,它面對的海量信息不全是簡單的結構化數據,而常常為半結構化的數據,如文本、圖形、圖像數據,甚至是異構型數據。與此同時,發現知識的方法也對操作方提出了極高的要求,既要求學術專業深度,又要求技術深度,在智能化、精確化、交叉語言檢索、多媒體檢索、專業化等技術領域均提出了深度要求。
基于以上難點,學術分析服務模式的重構宜著眼于四個步驟:第一是主動進行海量信息獲取,例如大規模搜集網頁,對大型學術網站的訪問日志進行挖掘,檢索出目標信息群;第二是信息選擇和處理,即從檢索到的信息資源中挑選和處理得到有效信息,例如研究網民的行為模式,將網絡零散且隱形的內容整合起來;第三是對信息進行梳理和概括,即依據不同的統計標準,對隱形信息進行深度挖掘和概念歸納;第四是分析整合,通過整合計算,將挖掘出來的大量數據形成直觀并且完整的期刊、學科、學者相關數據集。
人大數媒的“學者在線”致力于提供面向學術界宏觀和微觀發展態勢的數據分析,將數據的各種屬性和變量用數據可視化(Data Visualization)的方式呈現出來。首先,基于一級學科、二級學科、三級學科不同范疇,分論文被引次數、論文閱讀統計、論文數量、項目數量、發文學者數量、新關鍵字增長、期刊數量、閱讀數量等不同數據類型,以及起始年份、終止年份不同查詢時間段,通過集群、分割、孤立點分析等數據挖掘算法,深入數據內部挖掘價值;其次,采用語義引擎從紛雜的結構化及半結構化數據中智能提取信息,同時輔以專業分析員根據可視化分析和數據挖掘的結果作出一些預測性判斷;然后,通過標準化的流程和工具對數據進行處理,用直觀的文字、圖形、表格及數值模型表述復雜的信息內容。“學者在線”的專業大數據分析流程,可以保證期刊社、學術機構、學者、管理部門對學術發展趨勢和個體狀態有清晰、動態的掌握,以便采取及時的應對措施。以學術機構論文統計為例,“學者在線”“可以為該機構提供其歷年發文走勢圖、論文總被引量排名、論文總下載排名等數據分析。
三、重構學術管理服務模式
長期以來,學術管理服務模式未引起足夠的重視。學術管理應該是研究學術發展和服務于學術研究的,但國內學術不端、失范、腐敗現象層出不窮,學術自由的價值理念未得到應有的保護,在學科建設、人才培養、科研方向等重大問題的決策和指導上,專家、教授、精英學者的領航作用尚待激發。經濟學家張曙光曾在2011年5月召開的華人哈耶克年會上提出過“既然學術界是社會的良知,學者們都主張法治和憲政,主張權力制衡和社會監督,為什么不從自己做起,先在學界逐步建立起一套憲政秩序、法治規則和糾錯機制,并使其正常運行和發揮作用呢?這是學術界可以擔當和可以做到的事情。如果中國學術界連自己的事情都做不到和做不好,還遑論什么改造中國、服務世界,那真是沒救了。”自由的學術空間、高效的激勵機制、醇厚的學術氛圍、專注的學者隊伍,離不開科學合理的學術管理服務模式。重構學術管理服務模式,需要建立百花齊放百家爭鳴的學術評價機制體系,讓學術成果的評價更加多元化、前沿化、合理化,同時也離不開透明公正的學術成果匯總體系。
學術成果填報便是學術管理服務領域中鮮有人深究的灰色地帶。依慣例而言,學者、學校科研處、學校圖書館每年都需要對自身的學術成果進行整理填報工作,但由于信息海量無法迅速形成全面評估,更無法保證評判是否準確,如同名學者冒名問題,使得填報工作不能準確反映實際情況;同時,專業水準如何展開評估,也給學術成果填報帶來困擾。相比較而言,學者發表的論文、出版的著作、所獲的獎項、參與的項目等簡單基礎數據不難采集,但論文收錄詳情、期刊及網站轉載詳情、被引詳情,以及學者被關注度、學術創新程度、論文相關領域排名等相關重要數據卻不易獲得。
用透明來滌清污濁,以科學來洗刷腐朽,還原學術領域的公平公正,重構學術管理服務的品質品位,可從兩個層面入手:一方面通過海量數據的抓取和挖掘,保證學者學術信息完整,能夠更全面定量地反映學者的學術成果;另一方面通過語義分析解決同名學者等問題,保證填報的真實性,以同時滿足學者成功填報和機構成果填報的精準度。
“學者在線”面向機構、學者學術成果填報的內容自助查詢系統保證填報者所填報的內容能夠全面地反應學術成果,輕松完成各項檢查評估。系統不僅提供機構、學者個人的不同身份查詢路徑,同時可按姓名、曾用名、所在單位等不同主體信息查詢路徑,可自動生成及導出查詢該機構、學者所有相關學術成果。例如,通過學者陳雨露的學者空間個人主頁,系統可以自動生成其研究方向、所在單位、關系學者、發表論文、參與學術研討活動等行為軌跡,既可以保證所有學術成果皆為當事人所有,也能將非本人學術成果進行排除、篩選,滿足學者個人及機構的學術填報需求。
在這個信息海量、噪音轟鳴的資訊大爆炸時代,學術界開始呼喚權威與規范,追求秩序與意義。打造一個隨時隨身隨地的觸控信息窗,提供全息、精準、即時互動內容和學術動態追蹤及管理服務,是數字技術和信息技術推動學術服務創新的主要探索方向。