大數據影響下的知識服務應用模式之變革
東方
論文針對大數據知識服務問題開展研究。在對國內外相關研究綜合述評的基礎上,剖析大數據引發的知識服務應用模式之變革,主要表現為知識服務內容和知識服務方式的變革;進而構建大數據影響下的知識服務應用新模式邏輯框架,并分析其關鍵技術。研究結論認為應建立大數據環境下的知識服務應用新模式,目的是為提升大數據知識服務的價值和水平,實現知識共享提供新的思路和參考借鑒。
大數據知識服務知識共享應用模式
1.1 目前國內外相關研究簡單回顧
新信息技術的發展和用戶需求的變化促使現代互聯網逐漸向高附加值的知識創新型服務延伸和擴展,大數據時代的到來使得“面向大數據的知識服務”這一主題日益受到人們的關注。一般認為,大數據技術是從各類型的數據中快速獲得有價值信息的能力之技術,其具備走向眾多企業的潛力[1]。英國倫敦奧運會采用大數據技術監測網絡安全[2];日本重視大數據應用,強化ICT領域國際競爭力[3]。美國推進“大數據”的研究和應用實踐主要表現在三方面:(1)政府主導,全體動員,支持大數據的研發。美國奧巴馬政府在2012年2月宣布推出“大數據的研究和發展計劃”,又于3月29日在美國白宮網站發布了《大數據研究和發展倡議》(Big Data Research and Development Initiative)[4],計劃在六家政府部門的協作下,倡導全民大力推動及改善與大數據相關的采集、組織、分析、決策等工作。(2)非營利性組織和教育機構積極利用大數據開展公共服務。大數據的興起和發展給美國各類非營利性組織開展公共服務提供了良好的機遇,如“數據無邊界運動”(Data Without Borders Movement)通過收集大量的數據并加以分析,借助信息可視化技術為公益性服務提供幫助;美國的高等院校已著手開始培育與大數據相關的高級人才,其中有大學已開設與大數據相關的新課程[5]。(3)圖書館界積極響應,研究和嘗試應用大數據。如,美國哈佛大學圖書館已將“大數據”的服務引入圖書館中并付諸實踐,將圖書大數據向讀者公布[6];美國俄亥俄州經營電子書、有聲讀物的經銷商OverDrive公司通過“Buy It Now網上商店”等渠道為圖書館提供其所不具備的書目記錄,也為讀者開辟了發現新圖書的途徑[7]。另外,國外對知識服務的研究也呈方興未艾之勢;通過檢索OCLC First Search中Article First(學術論文數據庫)得知,目前的研究一般偏重于圖書館,特別是高校圖書館知識服務的實施嘗試;也有研究知識推薦服務的文獻,如Netflix推出的基于大數據分析的個性化推薦系統架構[8]、阿里云推出的基于內容和行為的智能云推薦體系[9]。
就國內來說,大數據正逐漸成為學術界的關注熱點。我國工程院院士李國杰先生指出,大數據將成為信息科技的新關注點,并可能形成新型交叉學科——網絡數據科學[10]。根據檢索結果分析,可總結出我國大數據研究呈現的主要特點為:(1)論文數量呈逐年上升趨勢。2012年專門研究大數據的文獻開始出現,2013年激增,2014年繼續保持增長勢頭。(2)發表的論文主要集中在計算機類和管理類期刊。近年來圖書情報學期刊也刊載有一些大數據的文章,昭示學科的交叉研究之趨勢。(3)研究視角多樣化、研究的重點較突出。刊載在計算機類刊物上的論文主要側重于大數據的技術架構和設計,而管理類刊物則側重于大數據的理論探討和現實借鑒等。(4)對大數據的應用實踐研究不太重視。目前國內的研究普遍重理論,輕實踐。
1.2 簡要評述及選題價值
目前國內外針對大數據和知識服務的研究熱潮對于我們有效開展大數據時代的知識服務方式創新提供了嶄新的思路,對圖書館等服務機構提升知識服務水平具有較大的理論價值和現實參考意義;同時對圖書館學情報學研究范式的轉變也具有積極作用。但仍存在一些缺陷,主要表現在:對大數據的整體研究實力不太強,研究力量較分散;研究中重理論、輕實踐,缺乏實證研究;部分研究內容前后重復,缺乏創意;研究者給出的解決策略一般比較模糊,尚需要進一步的實踐驗證。而令人更感遺憾的是,目前缺乏大數據與知識服務應用模式相結合的綜合研究。大數據時代的到來呼喚適應大數據處理需求的新型知識服務應用模式出現,筆者以此為切入點選題,研究成果可為大數據和新型知識服務應用模式的交叉研究提供有益的借鑒,對于進一步完善面向大數據的知識服務應用模式這一領域的研究提供理論參考價值。

表1 大數據與目前數據庫技術的比較
《中國計算機報》的報道認為,大數據催生數據多樣化的服務形態,大數據的應用方式是從數據服務、信息服務到知識服務[11]。大數據固有的特性賦予知識服務新的內涵和特征,并引發知識服務應用模式之變革,主要表現在知識服務內容的變革和知識服務方式的變革。
2.1 知識服務內容的變革
雖然業界對大數據的認識尚未完全統一,但我們可以這樣簡單地理解:大數據技術即是從各類型的數據中快速獲得有價值信息的能力之技術。大數據不同于海量數據的概念,它與目前的數據庫技術也存在差異,其對比如表1所示[12]。
大數據環境下,如何有效組織和管理好大規模的數據,并有效利用大數據加以分析、推理來獲取新的知識,這是目前擺在科技工作者面前的重要課題之一。大數據時代,互聯網、電子商務、科學研究等領域將涌現出各類非結構化、半結構化以及復雜結構化的大量數據,用戶的數據處理需求和知識需求將會大量增加,數據作為社會資源的重要部分將日益被重視;基于大數據的存儲、分析、挖掘等服務將逐漸得到開展和應用,這使得大數據知識服務模式得以產生并逐漸被社會公眾所接受。大數據將拓寬知識服務的內涵、外延,引發知識服務內容的變革。大數據影響下的知識服務體現在大數據處理過程中對知識資源、服務、過程等的知識服務配置和整合能力,反映知識服務機構在提供相應領域服務和完成預期目標及任務的總體水平;包含資源、數據、知識、服務、過程、能力和任務等七個因素。由此可見,傳統知識服務的內容將隨著大數據的驅動而發生較大改變。學者李晨暉等人將大數據知識服務界定為:“大數據知識服務是為適應信息服務業智慧化、協作化、綠色化、先覺化和泛在化的發展趨勢而衍生的一種基于網絡、用以解決結構化、半結構化及非結構化數據多維度處理的信息服務新模式。”[13]大數據知識服務是一種面向海量數據,并提供智慧服務的知識服務新模式,具有一些典型特征,如:積極強調用戶參與;基于知識、能力、資源、過程共享和交易開展知識服務;提高知識增值價值;強調群體創新和自主需求等[14]。
2.2 知識服務方式的變革
大數據的顯著特征是價值(Value)大,而該特征的直接體現則在于從紛繁蕪雜的海量數據中提煉有價值的知識和規律。人類社會的數據正以十分驚人的速度不斷增加和積累,大數據環境下的知識服務不能局限于傳統的信息服務,而應與大數據的爆發式增長與社會化趨勢同步。大數據引發知識服務方式的變革,主要集中在兩個方面:數據清洗和知識咨詢服務。所謂數據清洗是指在大數據中剔除一些噪聲數據后,對余下的蘊含有價值的數據進行知識提取。數據清洗是提高數據質量的有效手段,也是提升知識服務效率的基礎和有力保障。大數據的數據清洗在客觀上對知識服務提出了新的要求,即大數據環境下的數據整合和數據關聯。大數據容量大、內容豐富,結構異構,蘊含的知識多,但數據的繁雜使得其利用效率受到較大影響;數據整合有助于提高數據的使用價值和效率。另外,大數據影響下的知識服務必須將數據關聯,因為彼此孤立的數據其價值不容易得到實現。通過數據關聯,使大數據能為現實中的問題解決提供有價值的知識并建立知識關聯機制,構建知識圖譜,助推知識服務邁上新的臺階。知識咨詢服務則是大數據知識服務的主要方式。大數據時代,信息資源的競爭力主要在于信息服務的知識化、專業化、數據分析與組織程度以及知識創新力;知識服務的最大價值判斷標準是其提供的有價值知識含量。大數據為知識咨詢服務提供豐富的數據資源和專業的數據分析技術,帶來新的解決問題思維方式和更為廣闊的合作視野[15]。我們應敏銳地看到大數據環境中的社會發展和用戶服務需求,由資源依賴型服務向知識服務轉變,并積極探索知識服務的新方式。
大數據影響下的知識服務應用模式體現大數據生態系統對服務、資源和過程等的知識資源整合和配置能力,在大數據分析和處理過程中產生,并反映服務機構提供和完成相應領域、任務目標等的知識服務水平;大數據知識服務已成為新型知識服務模式發展的重要趨勢,其理念和技術將逐漸引起學術界和產業界的密切關注。當前,知識形態、知識獲取、知識交流及處理機制都面臨著巨大的挑戰,導致知識管理模式以及科技服務工作流的關鍵知識瓶頸發生重大變化。因此,面向大數據的知識服務被看作是應對上述挑戰的重要突破口,是知識服務創新的關鍵。根據上述有關分析,筆者設計出大數據影響下的知識服務應用新模式邏輯框架,如圖1所示。

圖1 大數據影響下的知識服務應用新模式邏輯框架
由圖1可知,大數據影響下的知識服務應用新模式邏輯框架主要由三大模塊組成:大數據知識服務應用新模式組成、大數據知識服務應用新模式邏輯架構以及牽涉到的關鍵技術,三者通過大數據相互聯系。大數據知識服務應用新模式強調數據、資源、知識、能力、服務、任務、過程等要素的有機融合,能滿足結構化、半結構化和非結構化數據的復雜處理需求,實現大數據知識服務體系中的知識動態協調和管理,更好地滿足用戶的各類需求。大數據影響下的知識服務應用新模式邏輯架構主要包括五個方面:
(1)大數據源及資源整合。提供大數據知識服務應用過程中所涉及的各類大數據來源和經整合的數據資源,其中移動互聯網數據、電子商務數據、社交網絡數據、傳感器數據等將成為未來大數據在信息服務領域的主要來源。
(2)大數據知識服務標準和規范。大數據范圍非常之大,同時可能顯得雜亂無章;要想很好地開展大數據知識服務,必須制定科學的大數據管理標準和知識服務規范等,如大數據分類和處理標準、大數據智能感知的識別標準、知識服務接入和描述規范、知識共享準則與大數據知識服務評價指標體系等。這是有效開展大數據知識服務的前提。
(3)大數據知識服務基礎支撐。這主要是提供和保障大數據知識服務所需要的硬件基礎設施和網絡支撐,如大數據服務器、分布式虛擬存儲器、物聯網資源及各類結構化、非結構化數據的存儲等。
(4)大數據知識服務應用模式。這是大數據知識服務系統的核心,起承前啟后的作用;主要有知識推薦、知識咨詢、知識引擎、科研用戶知識共享等模式。將接入到大數據知識服務系統的各類大數據源和處理任務、方案等整合、匯聚成虛擬的大數據知識服務資源,依據需要采取不同的大數據知識服務應用模式將大數據知識服務資源提供給不同的知識服務業務模型調用,引導用戶的大數據處理需求和大數據知識服務資源交易,并根據用戶的反饋評價作出相應的調整。
(5)大數據知識服務質量評價。大數據知識服務應用模式是一種強調用戶參與、面向智慧服務和需求、同時支持離線與實時數據處理、高效率與風險并存的大數據處理和知識服務模式。為了控制風險,應該建立大數據知識服務質量評價體系,將知識平臺服務質量評價、服務體系評價以及知識機構服務質量評價三者有機結合起來,建立大數據知識服務的質量考核和監督機制。
大數據作為時代的產物,必將促使用戶產生更高、更現實的知識服務需求。大數據與知識服務的資源、能力和用戶三方面的結合,促使人們探求知識服務新的增長點和突破點。大數據影響下的知識服務應用新模式邏輯框架所涉及的技術領域較為廣泛,其中的關鍵技術主要有:大數據分析與處理技術,即對結構化、半結構化及非結構化數據的獲取、組織存儲、分析與處理技術等;大數據智能感知技術,即對RFID射頻數據、傳感器數據等的智能感知、網絡傳輸、高效處理技術等;知識服務虛擬接入技術,即對大數據知識服務應用模式七要素(數據、資源、知識、能力、服務、任務、過程)等資源和能力的虛擬化接入技術;知識服務可視交互技術,即大數據知識服務系統平臺與用戶終端之間交互的可視化、智能化實現技術;知識服務安全可靠技術,即實現大數據知識服務安全、可靠運行的一系列方法和技術。大數據也并不是盡善盡美,它在改變我們思維模式的時候也帶來了一系列問題與挑戰:大數據分析預測的精準度問題、相關技術和成本的費用問題以及用戶隱私保護和安全問題等等。囿于篇幅,筆者恕不詳細展開論述。
大數據環境下,科學研究范式、知識獲取、交流和創新機制的變化導致傳統的知識服務模式發生變革,信息服務形態也逐漸轉向知識密集型服務;并從客觀上要求適應大數據分析與處理需求的知識服務新應用模式的誕生。筆者基于大數據的有關理論,剖析其對知識服務模式的影響,在此基礎上構建大數據影響下的知識服務應用新模式邏輯框架,并探討其關鍵技術。這是一種有益的探索和嘗試,目的是為構建大數據影響下的知識服務應用新模式,實現知識服務的交易和共享,進而提升大數據知識服務的價值和水平提供新的思路和參考借鑒。
[1]維基百科.Big Data[EB/OL].[2014-08-08].http://www. en.wikipedia.org/wiki/Big Data.
[2]Chris Petersen.Big data and the London Olympics cyber-security challenge[EB/OL].[2014-08-08].http:// www.technewsworld.com/story/75754.html.
[3]王喜文.日本強化ICT領域國際競爭力[N].中國電子報,2012-06-15(003).
[4]The White House.Big Data Across the Federal Government[EB/OL].[2014-08-08].http://www.whitehouse. gov/sites/default/files/microsites/ostp/big_data_fact_sheet.pdf.
[5]The Wall Street Journal.Big-Data Success Stories:Splunk[EB/OL].[2014-08-08].http://blogs.wsj.com/venturecapital/2011/10/21/big-data-success-stories-splunk/.
[6]The New York Times.Harvard Releases Big Data for Books[EB/OL].[2014-08-08].http://bits.blogs.nytimes. com/2012/04/24/Harvard-releases-big-data-for-books/
[7]Spolanka.OverDrive announces a series of“Big Data”reports[EB/OL].[2014-08-08].http://www.libraries.wright.edu/noshelfrequired/2012/04/11/overdrive-an-nounces-a-series-of-big-data-reports/.
[8]Xavier Amatrain,Justin Basilico.Netflix公布個性化和推薦系統架構[EB/OL].[2014-08-08].http://www.csdn. net/article/2013-04-04/2814767-netflix-ml-architecture.
[9]云推薦[EB/OL].[2014-08-08].http://tui.cnzz.com/.
[10]中國科學院.李國杰院士:大數據成為信息科技新關注點[EB/OL].[2014-08-08].http://www.cas.cn/xw/zjsd/ 201206/t20120627_3605350.shtml.
[11]李奕.大數據應用方式:從數據服務、信息服務到知識服務[N].中國計算機報,2012-07-09(024).
[12]Big data:The next frontier for innovation,competition and productivity[EB/OL].[2014-08-08].http://www.mckinsey.com/Features/Big Data.
[13]李晨暉,崔建明,陳超泉.大數據知識服務平臺構建關鍵技術研究[J].情報資料工作,2013(2):29-34.
[14]秦曉珠,李晨暉,麥范金.大數據知識服務的內涵、典型特征及概念模型[J].情報資料工作,2013(2):18-22.
[15]王天泥.知識咨詢:大數據時代圖書館的知識服務增長點[J].圖書與情報,2013(2):74-77.
東方湖南衡陽師范學院圖書館副研究館員。湖南衡陽,421008。
On the Changes of Knowledge Service Application ModelCaused by the Big Data
Dong Fang
This paper researches knowledge service of big data.Based on the comprehensive description and evaluation of domestic and abroad research documents,it analyzes the changes of knowledge service application model caused by big data, which represents knowledge service contents and modes’changes.Also the logic frame of knowledge service new application model affected by big data is constructed and its key technologies are analyzed.The research conclusion believes that new knowledge service application model should be constructed under big data environment.The research aim is to provide new thinking and references for prompting the value and level of big data knowledge service and realizing the knowledge sharing. Keywords Big Data.Knowledge Service.Knowledge sharing.Application model.
G252
2014-08-28編校:鄒婉芬)