張 蓉 張 瀾
(華中師范大學(xué),湖北 武漢 430070)
大數(shù)據(jù)時代下,龐雜多樣的數(shù)據(jù)從各種不同的渠道產(chǎn)生,對比單一數(shù)據(jù)源的研究,對這些多源、異構(gòu)的數(shù)據(jù)進(jìn)行分析和研究,可以更好地把握問題的整體性, 因而多源數(shù)據(jù)融合就成了研究的一大難點(diǎn)和重點(diǎn)。知識融合是在數(shù)據(jù)融合的基礎(chǔ)上發(fā)展而來的,數(shù)據(jù)融合最初應(yīng)用于軍事方面綜合多個數(shù)據(jù)來輔助分析[1],之后數(shù)據(jù)融合的概念和研究又?jǐn)U展到了信息融合,其處理對象還包括了多源信息,范圍要更加廣泛[2]。而如今研究范疇又?jǐn)U展到了知識融合,不僅局限于數(shù)據(jù)和信息,更將知識庫或者已有信息庫中的知識納入到各種方法、專家經(jīng)驗(yàn)等[3]。
然而,目前學(xué)者對于知識融合的概念并沒有統(tǒng)一的認(rèn)識,同時知識融合的相近概念又很多,如知識整合、知識聚合等,知識融合的基礎(chǔ)理論研究仍需完善。知識融合的研究還處于起步階段,目前的研究并不算很多,已有研究紛繁雜亂,為了更好的了解目前圖書情報(bào)領(lǐng)域知識融合研究現(xiàn)狀,本文采用共現(xiàn)分析、聚類分析等對近年來知識融合的相關(guān)文獻(xiàn)進(jìn)行分析,把握知識融合現(xiàn)狀,分析目前研究的熱點(diǎn)以及未來可以繼續(xù)研究的方向,以期更好地在這個領(lǐng)域進(jìn)行研究。
本文選擇中國知網(wǎng)數(shù)據(jù)庫進(jìn)行文獻(xiàn)分析與研究。中國知網(wǎng)數(shù)據(jù)庫是中國第一個連續(xù)的大規(guī)模多功能、集成化學(xué)術(shù)期刊全文檢索系統(tǒng),收錄范圍涵蓋各個領(lǐng)域[4]。在中國知網(wǎng)數(shù)據(jù)庫中,限定領(lǐng)域?yàn)閳D書情報(bào)學(xué),以“知識融合”作為關(guān)鍵詞進(jìn)行檢索(檢索截止到2019年11月),共檢索到469篇文獻(xiàn),剔除無關(guān)文獻(xiàn)之后剩余418篇。
本研究獲取相關(guān)數(shù)據(jù)后,首先得到知識融合相關(guān)研究的時間和空間特征,然后對知識融合研究主體分布進(jìn)行分析,之后采用SATI、UCINET等工具挖掘出研究的關(guān)鍵詞,并進(jìn)行高頻關(guān)鍵詞共現(xiàn)分析以揭示研究內(nèi)容特征,然后采用SPSS做聚類分析,把握研究的集團(tuán)化特征,最后總結(jié)目前知識融合研究的熱點(diǎn)及不足,針對這些問題提出若干建議。
2.1.1 知識融合年度發(fā)文量分析
通過對年度知識融合文獻(xiàn)產(chǎn)量進(jìn)行統(tǒng)計(jì)分析,可以直觀的看出知識融合領(lǐng)域整體發(fā)展態(tài)勢。從圖1可以看出,目前知識融合研究仍然還有很多的發(fā)展前景,自從2002年我國首次發(fā)表知識融合的論文以來,知識融合相關(guān)研究都不是很多,說明很長一段時間學(xué)者的關(guān)注度都不夠,處于起步階段。從2015至今知識融合研究逐漸引起關(guān)注,文獻(xiàn)產(chǎn)量開始增加,但還未到達(dá)高峰期,說明知識融合研究逐漸進(jìn)入學(xué)者的視野,未來擁有廣闊的可能。

圖1 知識融合研究年度產(chǎn)量分布
2.1.2 知識融合研究的期刊分布特征
期刊分布可以了解知識融合研究的核心期刊特征。經(jīng)過分析知識融合相關(guān)文獻(xiàn)發(fā)布于240種期刊,有194種期刊只發(fā)表了一篇文獻(xiàn)。在剩余的46種期刊中,又有14種期刊發(fā)文量大于2篇,如圖2所示。從圖2可以看出,《情報(bào)理論與實(shí)踐》發(fā)表的知識融合文獻(xiàn)最多,為10篇,其次為《圖書情報(bào)工作》《圖書館學(xué)研究》,同時可以看出,除圖書情報(bào)學(xué)之外,還有一部分學(xué)科處于交叉狀態(tài),如教育學(xué)、工程學(xué)。

圖2 知識融合期刊發(fā)文量
對領(lǐng)域內(nèi)學(xué)者分布特征進(jìn)行分析,可以有效發(fā)現(xiàn)目前知識融合領(lǐng)域內(nèi)核心力量和學(xué)者之間的合作關(guān)系。經(jīng)統(tǒng)計(jì),知識融合相關(guān)文獻(xiàn)的學(xué)者共有814位,其中絕大多數(shù)學(xué)者只發(fā)表了一篇論文,發(fā)表兩篇及以上的作者僅有64位,邱均平發(fā)表數(shù)量最多為6篇,其次鄒湘軍發(fā)表了5篇。
對這些學(xué)者之間的合著關(guān)系進(jìn)行研究,結(jié)果如圖3所示,圖中的節(jié)點(diǎn)為作者,節(jié)點(diǎn)之間的連線代表相關(guān)學(xué)者之間的合作關(guān)系,如果學(xué)者之間的連線形成網(wǎng)狀,代表本領(lǐng)域?qū)W者間的聯(lián)系緊密,交流頻繁。而圖3所示知識融合領(lǐng)域內(nèi)學(xué)者的聯(lián)系多為小團(tuán)體,這些小團(tuán)體各自分散,形成一個個“孤島”,表明知識融合領(lǐng)域目前學(xué)者之間的關(guān)聯(lián)很小,大部分都是獨(dú)自研究或者與本機(jī)構(gòu)同事合作,聯(lián)系松散。

圖3 知識融合領(lǐng)域著者合作關(guān)系網(wǎng)
2.3.1 關(guān)鍵詞分布特征
關(guān)鍵詞是一篇文獻(xiàn)研究內(nèi)容最為簡潔、凝練的概括,通過對關(guān)鍵詞的統(tǒng)計(jì)和分析,可以發(fā)現(xiàn)目前領(lǐng)域內(nèi)學(xué)者研究的主要方向。本文統(tǒng)計(jì)了目前知識融合領(lǐng)域內(nèi)關(guān)鍵詞頻次,共有1136個關(guān)鍵詞,其中167個關(guān)鍵詞出現(xiàn)了兩次及兩次以上,出現(xiàn)頻次最高的為知識圖譜,共計(jì)22次,如圖4所示。圖4展示了頻次為3及3以上的關(guān)鍵詞,除知識融合外,知識圖譜、本體出現(xiàn)最為頻繁,與知識融合的關(guān)系最為密切。

圖4 知識融合領(lǐng)域高頻關(guān)鍵詞
2.3.2 關(guān)鍵詞共現(xiàn)分析
對出現(xiàn)頻次最高的57個關(guān)鍵詞(頻次>=3)做關(guān)鍵詞共現(xiàn)分析,得到關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),并進(jìn)行點(diǎn)度中心性計(jì)算,形成點(diǎn)度中心性網(wǎng)絡(luò),網(wǎng)絡(luò)中節(jié)點(diǎn)越大,其中心性越高,節(jié)點(diǎn)越重要,節(jié)點(diǎn)間線條粗細(xì)則反映了關(guān)鍵詞之間聯(lián)系的緊密度。如圖5可得出結(jié)論:目前知識融合領(lǐng)域內(nèi),知識圖譜研究、知識庫、知識推理、大數(shù)據(jù)、知識推理等節(jié)點(diǎn)與知識融合的連線較粗,處在網(wǎng)絡(luò)的中心位置,與另外的關(guān)鍵詞之間的聯(lián)系較多,在知識融合中處于重要地位,這些也是目前知識融合領(lǐng)域內(nèi)研究熱點(diǎn),與知識融合未來的發(fā)展方向息息相關(guān)。

圖5 高頻關(guān)鍵詞點(diǎn)度中心共現(xiàn)網(wǎng)絡(luò)
2.3.3 關(guān)鍵詞聚類分析
將關(guān)鍵詞共詞矩陣轉(zhuǎn)化為相異矩陣,在SPSS軟件中進(jìn)行聚類分析。具體方法是用SATI得到關(guān)鍵詞相異矩陣之后,將數(shù)據(jù)導(dǎo)入SPSS,采用組內(nèi)連接得到冰柱圖和聚類樹狀圖如圖6、圖7所示。

圖6 關(guān)鍵詞聚類冰柱

圖7 關(guān)鍵詞聚類樹狀圖
對比圖6、圖7展示的知識融合相關(guān)關(guān)鍵詞聚類結(jié)果,可以將關(guān)鍵詞劃分為表1所示的5個類團(tuán)。前三類都只含有兩個關(guān)鍵詞,第5類包含最多的關(guān)鍵詞,而可以看出在類團(tuán)5眾多的關(guān)鍵詞中,既有理論研究,又有相關(guān)應(yīng)用研究,同時知識融合領(lǐng)域本身就容易與其他領(lǐng)域?qū)崿F(xiàn)交叉,因而本文根據(jù)表1結(jié)果結(jié)合實(shí)際對知識融合研究內(nèi)容進(jìn)行歸類。

表1 關(guān)鍵詞聚類
(1)知識融合支撐技術(shù)、方法研究。由于知識融合起源于傳感器信息的融合,因而知識融合過程離不開計(jì)算機(jī)、信息技術(shù)領(lǐng)域的滲透。近年來語義網(wǎng)、XML、RDFS、多Agent系統(tǒng)等跨學(xué)科領(lǐng)域技術(shù)方法已經(jīng)應(yīng)用于知識融合領(lǐng)域[5],成為支撐知識融合研究重要的技術(shù)手段。知識融合方法更是廣泛借鑒了信息融合算法如貝葉斯網(wǎng)絡(luò)等[6]。與此同時,基于知識區(qū)別信息和數(shù)據(jù)具有延伸性,可以通過推理來獲得新知識,因而知識推理的方法同樣適用于知識融合,如基于語義規(guī)則的方法[7]與本體論的方法[8]。
(2)知識融合體系、系統(tǒng)研究。知識融合系統(tǒng)的體系架構(gòu)是指實(shí)施知識融合時系統(tǒng)所采用的一般性原理和形式,包括實(shí)施知識融合的組成要素及其相互作用等[9]。依照不同的體系架構(gòu),融合過程的技術(shù)、選擇方法、組成部分都會有不同,進(jìn)而造成融合結(jié)果的不同。關(guān)于知識融合框架在研究內(nèi)容中占據(jù)重要位置,周利琴等以知識服務(wù)需求為導(dǎo)向,構(gòu)建了面向物化知識倉庫、面向虛擬知識網(wǎng)絡(luò)和面向混合模式的知識融合過程模型,知識融合過程與應(yīng)用結(jié)合起來,促進(jìn)用戶需求的最大化滿足[10];朱娟等構(gòu)建了集數(shù)據(jù)層、模型層以及應(yīng)用層為一體的個性化推薦模型,融合用戶、商品、情境信息等多源知識融合[11]。
(3)領(lǐng)域應(yīng)用研究。知識融合最終是面向服務(wù),面向用戶的,因而最終都會落腳于實(shí)證以解決實(shí)際需求。類團(tuán)中出現(xiàn)了“政府網(wǎng)站”和“信息資源”以及“軍民融合”、“競爭情報(bào)”這種關(guān)鍵詞團(tuán)體,在軍事、政治、教育各種領(lǐng)域內(nèi)多源知識的融合對決策的準(zhǔn)確性、全面性至關(guān)重要。如教育學(xué)中通過理論與實(shí)踐的多源知識融合,豐富和拓展教學(xué)內(nèi)容, 激發(fā)學(xué)習(xí)興趣和創(chuàng)新能力, 促進(jìn)教學(xué)進(jìn)步[12];化工領(lǐng)域?qū)⑾到y(tǒng)故障數(shù)據(jù)與專家知識系統(tǒng)通過權(quán)重D-S證據(jù)理論融合,提高不確定性故障診斷的正確率[13]。
本文通過使用SATI、UCINET、Netdraw等工具,對CNKI上獲取的知識融合文獻(xiàn)進(jìn)行分析,在目前研究現(xiàn)狀進(jìn)行梳理的同時發(fā)現(xiàn)所存在的問題和不足,旨在促進(jìn)知識融合的進(jìn)一步發(fā)展。
結(jié)果表明現(xiàn)階段知識融合研究雖然已有一定成果,但是存在以下問題:①整體研究仍未達(dá)到峰值,后續(xù)仍有發(fā)展?jié)摿Γ虎谀壳爸R融合研究多為技術(shù)、方法、實(shí)證研究,基礎(chǔ)理論研究還未完善;③學(xué)者、機(jī)構(gòu)之間各自為政,交流、合作較少,不易于知識共享和創(chuàng)新;④研究內(nèi)容廣泛、分散,尚未形成整體的、系統(tǒng)的領(lǐng)域體系架構(gòu)與穩(wěn)定的研究主題。
以上的分析結(jié)論對于知識融合的未來發(fā)展具有重要意義:①知識融合研究要緊跟國內(nèi)外研究態(tài)勢,跟隨時代發(fā)展的需要和變化,做到與時代要求緊密關(guān)聯(lián)。在廣泛研究發(fā)展的同時,要注意形成本領(lǐng)域穩(wěn)定的研究主題與整體的體系架構(gòu),形成本領(lǐng)域區(qū)別于其他領(lǐng)域的核心競爭力;②學(xué)者、機(jī)構(gòu)之間要加強(qiáng)交流和知識共享,由于知識融合包含計(jì)算機(jī)、信息技術(shù)等各種領(lǐng)域的交叉滲透,因而各個領(lǐng)域人員之間的交流合作對本領(lǐng)域發(fā)展有促進(jìn)作用;③科研人員在立足于實(shí)際需求的同時,要注意基礎(chǔ)理論的完善,在理論指導(dǎo)下進(jìn)行發(fā)揮領(lǐng)域優(yōu)勢,改善知識服務(wù)實(shí)際需求。