趙海濤,趙 毅,尤江東
(信息工程大學,河南 鄭州 450000)
本體論源于哲學,它與事物的基本存在有關。自20 世紀計算機的開始和發展以來,計算機就使用本體來表示特定領域(通常是詞匯)中的概念和術語。本體試圖通過RDF 和OWL建立概念上的類和屬性,創建的類是指表示資源屬性定義和關聯的資源,并使用邏輯推理規則評估和描述不同資源之間的關系。因此,給定領域中的通用概念構成了知識,從而創建了可以更好地共享和重用的知識網絡。在波蘭等其他國外的圖書館和信息科學領域,大量的科學家和研究機構在本體論領域進行了相關研究,而圖書館和信息領域是重要的研究主題領域本體論的。2010 年后,因為互聯網技術的飛速發展,國內外的圖形學和信息學領域在本體論研究的熱點問題中具有鮮明的時代特征。但是,由于國內外學科發展水平的不一致以及國家研究發展環境的影響,圖書館學和信息學領域的本體研究的方向是不確定的,導致國內外不同。本文的目的是分析和比較國內外圖書館和信息學領域的本體研究熱點。本文從2012-2017 年國外SCI 數據庫和CNKI 國家數據庫中選擇相關文獻,并根據發表的文章數量、文獻的分布情況,采用適當的信息計量方法進行統計分析,如關鍵字和受歡迎的作者。在收集并匯總了數據之后,使用陳超美博士的VOSviwer 和CitespaceII 社交媒體分析工具繪制了一個知識圖,以便直觀地分析和比較該國家和地區的圖書館和信息研究熱點。并在我國提供相關研究人員還有國家和國外進行數據參考。
對于詞源和字典的解答,聚合一詞首先用于聚合物化學領域。它的英文表達是“聚合”,主要是指通過單體或單體混合物的化學反應形成新的聚合物。由于合成或重組,已經發生了質的變化。在《牛津現代英漢詞典》中,用于信息聚合的英文表達為“信息聚合”,其基本定義是指通過組合許多事物或將其整體對待而生成的復雜信息。從字面意義和詞典定義的角度來看,信息聚合是多學科,多領域的研究內容。盡管信息聚合已成為跨學科研究的內容,但其定義和相關概念尚未有清晰統一的描述。在綜合了國內外信息聚合研究的當前普遍應用和重要成果之后,可以總結信息聚合的定義以及所有學科的相關概念的描述。表1 列出了經濟管理、計算機科學、圖書館學和信息科學領域中信息聚合的定義、范圍、技術措施等相關概念。

表1 信息聚合在不同學科領域中的概念表述
表1 顯示了跨學科的信息聚合的目標基本上是相同的,即通過特定方法或技術將定義范圍內的離散信息對象重新集成到邏輯上相關的信息集中。處理對象,應用程序范圍和處理行為是不同的。特別是,各學科之間信息聚合概念表達的差異主要體現在以下幾個方面:
處理對象和應用范圍存在差異。實際上,不同的學科認為信息聚合處理的主要對象是信息,但是不同的學科對信息的理解也不同。在經濟管理中,信息聚合被視為實現特定目標,將許多內部人員已知或支配的信息組織成一個有機整體,然后借助集體智慧做出決策來彌補的過程。個人決策模型不足,該定義將信息定義為社會系統參與者的個人主觀信念和去中心化直覺,這是一種抽象的表達形式。在計算機科學領域,信息聚合通常被認為是信息融合的廣泛過程,并且信息聚合處理的主題也定義為在每個應用程序領域的物理級別也可以感知的數據。例如信息源,信息類型和相應的信息模式,像媒體一樣,它比其他學科更廣泛。在圖書館學和信息學領域,研究人員認為,數據、信息和知識分布在信息聚合過程的不同級別,但是它們通常具有轉換關系。因此,該領域的大多數研究并不嚴格涉及聚集對象。區分僅將應用范圍限制為網絡的信息資源。
操作方式有所不同。計算機科學家認為,在信息聚合處理的行為中,“聚合”“集成”“融合”和“集成”的表達主要不同。例如,Lenzerini 等人相信,數據集成和集成是根據特定關系將來自不同來源和不同結構的數據進行組合。Dong 等人認為,數據融合是指來自現實世界中引用同一實體的不同來源的數據的集成和融合,其主要功能是將一種類型的數據擴展到存在它的另一種類型的數據特定的關系。可以看出,數據集成,數據集成和數據融合解決了不同的處理對象和行為,但是它們的目標基本相同。在圖書館和信息領域,由于聚合對象、聚合方法、聚合粒度等因素的不同,重要子域(例如科學計量、信息組織和信息檢索)中的信息聚合,通常根據特定的研究任務或用途分配不同的類型。短語,但實質上將信息聚合定義為網絡信息資源的關聯,聚合或集合。因此,在該領域中,“聚集”“集成”“融合”和“集成”之間沒有嚴格的區別,它們通常被認為是相同或相似的概念。根據先前的分析,可以看出信息的聚集是一個動態過程,其主要功能是通過多種方法對來自多種來源的異構信息進行轉換、組織、整合和組合,并生成可以滿足需求的聚集結果。但是,就概念表達、技術手段和應用而言,不同學科具有其自身的特征,這些特征定義了信息的聚合和特定的研究方法。反過來,圖書館和信息領域是表達信息匯總的最靈活方式。
按照RGR 和Dt 的計算方式,計算了國內外圖書館信息領域的出版物規模和書目信息聚合趨勢,并得出了表3 所示的結果。如表2 所示,它顯示出線性上升趨勢,雖然國家出版物的總數略高于外國,但該國的年度出版物在2011-2012 年略有增加。有所下降,隨后呈上升趨勢,但在2016 年急劇下降。RGR 和Dt 的統計結果表明,國內外結果的RGR 和Dt 呈下降和上升趨勢,但國內結果的Dt 在2016 年出現了指數上升梯度。原因是2016 年年度刊物發行量偏低。全國性報刊的年平均刊載量略高于外國報刊,且全國報刊的發行量為Dt。這幾乎是外國人的兩倍,但外國的平均RGR 高于國內人的RGR,這表明外國價值的年增長率相對較快,并且需要很長的時間才能實現翻倍成果數量[1]。

表2 2007-2016 增長趨勢
這項研究為單詞頻率大于8 的中外關鍵字創建了一個不相似矩陣,并將它們導入SPSS 以進行多變量分析,以獲得相關的知識圖譜進行多尺度量表分析。從圖1 和圖2 中可以看出,國家和國際信息聚合研究中的高頻關鍵詞可以粗略地分為三個主題研究組。從圖1 所示的結果可以看出,國家地圖C1 區域中的大多數關鍵字與圖書館、博物館、檔案館等的內容有關。它們屬于公共服務領域中信息聚合的研究;C2 區域中的關鍵詞與信息檢索有關。與政府事務和供應鏈相關的電子內容是對大數據環境中來自多個來源的信息融合的調查;從研究數據處理的角度來看,區域C3 中的關鍵字與技術內容有關,例如模型、鏈接數據和語義網,這些信息與信息聚合和知識創新有關。為了進行比較,本國演奏會C1 與外國演奏會C3 相同,本國演奏會C3 與外國演奏會C2 相同,而本國演奏會C2 和外國演奏會C1 在該關鍵字中具有更多相同的關鍵字因此,這兩個主題也與在大數據環境中使用信息聚合的實踐研究大致相同。綜上所述,國內外信息聚集研究的主題分布和發展趨勢具有相似的特征[2]。

圖1 國內信息聚合研究多維度分析圖譜

圖2 國內信息聚合研究多維度分析圖譜
從表4 給出的20 個最受歡迎的中外關鍵字列表中可以看出,國內外相同的研究主題包括:知識管理、圖書館、資源共享和知識整合。國外文獻中出現了有關“信息檢索”“創新”“案例研究”“信息技能”“協作”“互操作性”和“GIS 熱點”的研究。國家文獻中出現的頻率相對較低的有“本體論”“電子政府”“數字圖書館”和“大學圖書館”之類的研究熱點在外國文學中的出現頻率較低。從語義關鍵詞的泛化和分布的角度來看,外國文學關鍵詞是高度標準化的,幾乎不是同義詞,但是大多數高頻關鍵詞不是特定的,例如“整合”“聚集”“信息”“知識”“管理”“知識管理”等。重點放在知識管理領域的集成、共享、協作、創新、學習以及信息或知識管理;在頻率術語中,有12 個是與“信息聚合”同義的表達,它們的短語主要由“數據”“資源”“信息”“知識”和“整合”組成,但明顯減少;根據統計結果,國內和國際結果的Dt、RGR 和Dt 分別呈下降趨勢和上升趨勢,但2016 年國內結果的Dt 呈指數上升趨勢。原因是2016 年出版的年鑒數量很少[3]。

表3 國內外信息聚合高頻關鍵詞對比
在過去的十年中,國家對信息聚合的研究首先出現在數字圖書館領域,其研究重點是根據特定的模型或規格成功地集成或集成來自多個來源的異構數字資產,然后結合大數據時代的到來,信息聚集研究的主題正在逐漸轉移到Internet 上的信息搜索和大數據領域,并且也從最初的信息集成轉變為知識提取和挖掘數據驅動的,即知識的融合和聚合。國外文獻首先側重于信息檢索領域的數據融合與合作,然后逐漸將研究主題擴展到社交媒體和信息技術領域的圖書館知識整合和知識管理[4]。
信息聚合是跨學科和跨領域的研究內容,主要適用于信息學、經濟學和管理學,以及圖書館學和信息學。相似的概念和研究類別的定義的概念和表達因一門學科而異。從學科的角度出發,文章首先對不同學科中信息聚合的概念、相關術語、應用范圍和實現方法的描述進行了比較和分析,并明確了含義的定義和相似術語的表達在此字段中添加信息。然后,在圖書館領域的信息聚合和圖書館中的信息研究中,對文獻的增長趨勢、熱點的分布、熱點主題的識別及其發展方向進行了深入分析。最后總結了研究的特點和未來的發展趨勢。當然,本文還存在一些不足和局限性,需要在以后的研究中加以完善:首先,沒有類似方法的實驗比較。在爆炸物探測方面的研究中,陳朝美教授提出的爆炸物探測方法是應用最廣泛的方法。此方法類似于本文中提出的方法,并且都使用突然的關鍵字更改作為評估新興主題的基礎。因此,下一步將重點通過實證研究對這兩種方法進行比較分析。其次,改進識別新出現問題的方法,由于作者在文獻中定義的關鍵詞相對抽象,并且往往具有更多的同義詞表達,因此本文提出的主題識別方法可以與主題分析模型結合起來,在以后的研究中獲得。使用主題分析模型創建多個主題。并結合主題頻率和加權計算,以改善識別新興主題的方法。最后,分析對象需要進一步擴展。由于本文僅以圖書館數據和信息為研究主題,因此不能完全準確地反映信息聚合的總體發展趨勢。因此,有必要將分析對象進一步擴展到社會科學和生命科學的許多學科,例如計算機科學、經濟管理、心理學、公共管理、定量統計等。充分了解信息聚合的當前發展和未來趨勢,全面而系統地比較和解析[5]。