王壯
【摘要】 本文通過引文分析、共詞分析和社會網絡的分析方法,對計算機學科進行情報科學跨學科知識引用實證分析,對情報學學科的交叉屬性進行分析和研究。通過研究了解到,引文分析和內容分析的方式表明計算機科學中的文本分類、信息抽取、本體研究、數據挖掘等能夠為情報科學提供技術支持,知識管理、科學評價、專利研究等是情報學、科學研究的共同范圍。
【關鍵詞】 情報科學 跨學科 實證
在科學發展中,綜合與分化并不矛盾。當前人們對世界的認識能力逐漸提高,研究領域也日漸精細,學科間的交叉與滲透也不斷增強。情報學有很強的交叉屬性,呈現出很明顯的跨學科性質。現階段,情報學與其他學科間的交流逐漸深入,知識間的交流日益頻繁,怎樣理解情報學與其他學科間的知識交流與融合,拓寬情報學的研究范圍,形成科學的方式和方法是需要研究思考的問題。
一、選擇合適的數據并加工處理
1、選擇合適的數據庫。本次研究選擇的是CSSCI與CNKI兩種數據庫作為數據來源[1]。使用這兩種數據庫從而獲得更多文獻題錄數據。2、期刊選擇。在計量學研究中,劃分學科是難度比較大的,在學術期刊中,論文的學科種類比較多。本次研究使用的中文學術期刊論文,選擇《情報學報》《情報科學》為樣本,使用情報學專業期刊中引用次數比較多的計算機學科進行實證分析。
二、統計結果的分析與研究
情報學中,引用計算機科學期刊文獻的關鍵詞總共有1438個,引用頻次為2446次。合并同義關鍵詞,刪掉寬泛詞后得到1176個[2]。網絡中,本體、文本分類、數據挖掘、信息檢索、信息抽取、電子商務等關鍵詞位置比較重要,能夠將引用的內容大致的顯示出來。通過Ucinet 軟件凝聚子群分析中的派系分析,實現關鍵詞的聚類,得到6個聚類類團。
1、文本分類。這種技術是以內容文本信息管理為基礎,在信息的素質、檢索、提取書庫扥方面都是關鍵性的技術。文本是新聞、技術專刊、郵件等,涉及的范圍和內容比較多,最為常見的文本分類是以主題為分類標準的,大量的文本信息在處理時需要依靠計算機技術作為支撐。將有用的分類特點進行提取,使用分詞技術,提取文檔特征出現的一般都是高維特征的空間,實際操作的難度比較大,所以需要對數據集進行壓縮,數據壓縮的方法主要有特征的選擇、聚類以及變換。信息檢索的一些任務以及自然語言處理中的任務都可以轉化為文本的分類問題。
2、中文信息處理。中文字詞間的分隔符并不明顯,并且在切分詞中容易出現歧義,所以在中文的信息處理中,對漢語進行分詞是十分重要的內容。情報學在計算機科學中輸入的重要內容就是中文信息處理技術。
3、信息抽取。信息抽取就是直接將事實信息從自然語言中進行準確的提取,然后進行整理、組織成一定的結構,對信息進行描述,為檢索、文本的挖掘等提供便利。在學習抽取中,命名實體識別是最為基本的任務,能夠識別出文本中的有意義的短語以及專有名稱,并進行分類,能夠文本的正確理解提供基礎,便于信息的檢索。當前隱馬爾科夫模型是應用比較廣泛的信息抽取模型。
4、本體和語義網。語義網的研究是為了使計算機能夠開發出處理、理解表達語義信息的技術,保證網絡信息間的語義關聯能夠被發現,在網絡環境下實現自動的推理,實現人與計算機以及計算機與計算機間的合作。這種語義網的優勢就能夠對網絡信息進行科學的理解與處理。在語義網中,本體、可擴展標記語言 XML以及資源描述框架 RDF是核心的技術[3]。本體能夠規范知識的概念以及形式,能夠對知識領域中的概念進行描述,明確其關系,從而對知識領域進行理解和描述,保證計算完整的實現,這是語義網信息組織中的核心內容。使用語義網以及本體進行情報研究,注重本學科領域的應用,注重領域中知識的管理。
5、數據挖掘。數據挖掘以數據庫中結構化的數據作為主要的對象,通過關系表發現知識。在數據挖局中,分類、預測、關聯以及聚類是十分重要的技術,能夠查詢數據,明確數據間的潛在聯系,實現更深層次的分析,能夠對未來進行科學的決策,從數據庫中抽取有價值的信息,使用大型的數據庫為知識的抽取提供服務。在情報學中,電子商務等是數據挖掘技術的應用。
6、協同推薦。這種推薦技術是使用數據挖掘,按照推薦的算法,為用戶提供個性化的服務。協同推薦能夠對信息過載的問題進行解決。在圖書的情報研究中,能夠為用戶提供個性化的服務。在電子商務中,能夠為用戶推薦商品,使用戶獲得購物的體驗。
結束語:通過分析與研究,使用引文分析以及共詞分析的方法,對引用的其他學科的內容進行分析和研究,從而客觀的對學科間的關系進行考察,本次研究中使用的方法是科學可行的。但是其中也會存在一定的不足,因此還需要利用訪談法,更加深刻全面的對學科與情報學間的關系進行分析與認識。
參 考 文 獻
[1]馬翠嫦,曹樹金.信息分散下的信息行為——基于國外圖書情報學領域跨學科研究的回顧[J].中國圖書館學報,2014,01:60-72.
[2]王知津,卞丹,王文爽.論情報學研究中的跨學科思維[J].情報科學,2010,05:641-647+651.
[3]孫海生.情報學跨學科知識引用實證研究[J].情報雜志,2013,07:113-118+100.