崔志慧,彭蘭一香,熊 曦,王名揚
(東北林業(yè)大學 信息與計算機工程學院,哈爾濱150040)
隨著互聯(lián)網(wǎng)的高速發(fā)展,每年發(fā)表的科技文獻總數(shù)呈指數(shù)增長。據(jù)統(tǒng)計,僅2018年中國科研人員發(fā)表在國際、國內(nèi)的優(yōu)秀文獻總量就達到31.59萬篇[1]。對研究者來說,從如此海量的數(shù)據(jù)中定位滿足科研需要的文獻是非常困難的。引文推薦能針對某一具體的研究主題和學術(shù)文獻,自動地為研究者推薦合適的相關成果和文獻。借助于引文推薦,研究者可快速獲取到與其研究相關的文獻資料,從而在一定程度上提高撰寫學術(shù)文獻的效率。
2001年,Basu C等首次提出文獻推薦的概念,給出文獻推薦的過程是如何找到與用戶興趣相匹配的文獻的過程,其核心問題在于如何表達用戶興趣和目標文獻[2]。在之后的研究中,研究者們也將關注點更多放在對用戶興趣的建模和文獻間相似度的計算上。2007年,Strohma等提出引文推薦的概念,并結(jié)合文本相似性和圖模型方法對引文推薦問題進行了初步探索[3]。Bethard S等結(jié)合用戶的歷史引用信息和引用偏好來為目標文獻推薦參考文獻列表[4];2010年,He Q等人將詞頻信息和文獻的主題分布作為主要特征,實施引文推薦[5];Pohl等基于用戶下載文獻的行為記錄進行引文推薦[6]。2013年,劉盛博等以全文數(shù)據(jù)為基礎,構(gòu)建基于引用內(nèi)容的引文檢索與推薦系統(tǒng)[7];Liu Yaning實現(xiàn)了基于翻譯模型和用戶過濾算法的混合推薦模型[8];2014年,蔡阿妮等結(jié)合文獻的內(nèi)容信息和引用關系來對引文進行推薦[9];……