
摘要:想要完善并健全建設領域學科方法庫,那么就需要識別圖書情報領域中的研究方法。因此需要對現有的研究方法進行探究分析,并且從各項數據中獲取相應的難點內容,本文依靠圖書情報學以及計算機學之間知識的流通特性,提出知識角色遷移規律,并對數據進行批量標注,同時也需要應用深度學習模型。經研究證明此法值得進行推廣和應用,可以從大規模文本中識別圖書情報學的研究方法。
關鍵詞:知識角色遷移;圖書情報學;研究方法識別
引言:從我國目前圖書情報領域的發展狀況來看,照比之前現有的方法識別研究已經取得了一定的進步,而且在實際進行的過程中通常會應用NLP以及深度學習技術。當前我國現存的識別模型可以在學習文本中詞匯、語法以及語義等特征的同時,識別抽取研究方法實體。圖書情報學是一項較為復雜的學科,而且其研究方法多種多樣,除了文獻計量法、引文網絡法等常見的圖書情報學方法,還會融合其他學科的技術方法。
一、研究方法實體識別概述
研究方法識別換一種說法就是信息抽取問題,簡單來說就是在圖書或者是文本之中抽取描述方法的詞語或者是語句。從形式上來講,與它相近的任務還包括研究任務識別、理論術語抽取以及知識元抽取等,最開始研究這個話題時主要是應用基于規則的方法。當前我國科學技術手段以及信息技術手段也在不斷地優化和完善,因此用于研究方法識別的技術也更加成熟,當前機器學習以及NLP技術照比之前也更加完善,而且目前大部分的研究主要以將信息抽取轉化為機器可解的標簽判定問題為主,現階段,在實際進行研究方法識別工作的過程中通常會應用多類別分類或者是序列標注的方法,進而得到文本中包含的方法類實體。
現階段我國研究人員對于圖書情報學研究方法識別也進行了大量的研究,并不斷進行探究和分析,從目前的研究成果來看,在圖書情報學之中方法實體識別已經取得了很大的進步。而且目前統計學以及相關技術也更加完善,因此目前主要以機器學習為主,逐漸取代了模塊學習的地位。以機器學習為主進行實體識別其效果更加明顯,也更加優質,但是其在使用的過程中也存在一定的弊端,在實際應用的過程中,主要是依靠大規模以及高質量的訓練樣本。但是受到跨學科的特性以及學科知識內容交叉的影響,在圖書情報學之中研究方法來源更加廣泛,各類型之間也存在一定的差異性,目前現有的方法語料庫主要是應用人工標準的形式完成數據的集構建,但是其成本較高,文本主體類型較為單一,并且在數據體量方面也存在一定的局限性。因此研究人員需要針對這一問題進一步進行探究和分析,進而實現自建研究方法識別模型的訓練擬合,推動圖書情報學的發展和進步[1]。
二、知識角色遷移的顯現機理
知識遷移在遷移學領域中的重要內容,也是其理論基礎,知識遷移主要是將源領域中學習到的知識更好地應用到目標領域之中,進而幫助目標問題進行求解。而圖書情報學是一種教學復雜且繁瑣的學科,其融合交叉了多種學科內容,比如說自然科學、技術科學以及社會科學,在其發展進步的過程中,需要不斷地融合吸收其知識內容。隨著我國經濟社會的不斷進步,越來越多的研究人員投身至科學技術以及信息技術領域的研究之中,而且也取得了很大的進步,并且也在不斷地進行完善和優化,科學技術手段以及信息技術手段也在不斷地創新,而實際進行工作的過程中不難發現,計算機領域與圖書情報領域之間的知識角色遷移也愈加明顯,研究人員在實際對圖書情報學進行研究探究的過程中,通常會應用到大量的計算機算法、模型、工具以及計算機系統。我國研究學者張瑞等對于圖書情報學中的知識角色遷移也進行了大量的研究,并且對圖書情報學中的知識流入特點進行進一步分析,并明確指出在眾多學科之中,相對而言計算機學科輸出圖書情報學中知識內容最多。而且以作者發文角度為出發點,也可以看出計算機學科與圖書情報學科之間存在緊密的關聯性。
總體來看,學科之間的交叉學習以及一個學科的交叉特性一般都會在研究方法之中展現出來。其實現階段知識產生知識內容的主要方式還是跨學科合作以及多學科知識交叉,對于圖書情報學之中,主要是以計算機學科為主不斷對其進行影響和滲透,在圖書情報領域之中為了解決出現的各種研究問題,通常會應用計算機學科之中的各種算法、模型以及工具等[2]。
三、研究思路概述
目前在圖書情報學之中較為突出的一個問題就是研究方法自動識別問題,因此以計算機學科向圖書情報學進行知識角色遷移規律為基礎,建立一種基于弱監督學習的神經網絡模型,并且在此過程中,研究人員以及相關工作人員需要進行大量標準樣本的訓練擬合,這樣做的目的是更有效地實現高精準度以及魯棒的圖書情報性研究方法識別,進而促進其發展和進步,整體框架如圖1所示。
圖1研究方法實體識別整體框架
從圖1中不難看出,可以將整體框架分為三個流程:(1)數據獲取以及預處理:首先,工作人員可以利用信息網絡技術收集獲取源數據;其次應用字典并結合bootstrapping自學習策略,進而獲取圖書情報學中文本中的方法字典集;最后,需要對圖書情報領域中文本數據進行一定的匹配,在這一過程中通常會應用計算機學科中的算法以及模型等實體,而且受到計算機學科向圖書情報學領域知識角色遷移規律的影響,將出現在圖書情報文獻中的計算機算法或者是模型當作其研究識別方法,這樣才能獲取圖書情報學領域中關于方法實體的標注數據。(2)深度學習模型選擇:再次過程中選擇利用三種較為先進且應用較為廣泛的神經網絡模型,即LSTM+CRF、BERT、ALBERT,然后工作人員利用實驗檢測方法實體識別的效果。(3)方法實體識別:應用通過訓練擬合之后的模型完成學術文本中研究方法的識別。
結語:綜上所述,本文對研究方法實體識別進行詳細說明,并且對知識角色遷移的顯現機理進行進一步探究,同時詳細解釋了其研究思路,并且研究方法實體識別的整體框架進行探究和分析。從中不難發現,計算機學科與圖書情報學領域之間存在大量的知識角色遷移,而且其學科知識內容教學較為明顯,同時在進行圖書情報學中研究方法識別的過程中,通常會應用到計算領域的算法和模型,因此在今后的發展之中值得被進一步研究分析。
參考文獻:
[1]李鵬程,程齊凱.知識角色遷移視域下圖書情報學研究方法識別[J].情報雜志:1-7.
[2]孫琳,孫向榮.知識轉移視角下中國圖書情報學六種合著關系探析[J].內蒙古科技與經濟,2021(11):134-137139.
作者簡介:李佳蓮;1985.8;女;漢族;四川省眉山市;大學本科;講師;研究方向:圖書情報;單位:四川工商學院圖書館。