盡管目前國內外很多高校已經將學術文獻的閱讀與研討作為高年級學生,特別是研究生培養過程中一種有效的手段與形式,但在文獻的篩選、閱讀效率等方面仍存在一定難點與不足。大多采取的教學形式為教師推薦的方式,即任課教師根據授課內容向學生推薦或安排任務,從而完成學術文獻的閱讀。但這種教學方式在實踐過程中效果并不明顯。本文首先對學術文獻在高校教學活動中的意義進行梳理,總結目前以學術文獻閱讀作為教學內容的不足,基于此,將學術文獻引文推薦模型應用于高校教學活動中,旨在提高學術文獻的篩選與閱讀效率,切實發揮學術文獻在高校教學中的作用。
學術文獻作為知識傳播的載體,能夠起到“站在巨人肩膀之上”的作用,特別是伴隨著互聯網技術的發展,學術文獻以電子化存在的形式不僅避免了文獻在印刷過程中造成的大量資源浪費,更促進了知識傳播的速度與范疇。因此,將學術文獻的閱讀與討論引入到高校的教學活動中,不僅能夠使學生站在學科前沿,掌握本專業、領域的發展動態,更能使學生脫離課本的學習,具備更高的科研能力。
高等學校的教學目標不僅要使學生牢固地掌握本專業、學科的基礎理論知識與內容體系,更要使學生能夠掌握專業、學科的前沿發展,拓寬學生的知識面,培養學生自主學習的能力。為了實現這一目標,目前各高等學校在制訂培養計劃的時候,通常會將基礎課、理論課安排在低年級,而將應用類課程、綜合性課程、實踐實驗性課程等安排在高年級進行。特別是對于研究生教學來講,不僅要培養學生具備專業技能,更重要的是培養學生具備科研能力,為從事科學研究等相關工作奠定基礎。
學術文獻是科研機構、科研人員研究成果的體現,是知識傳播載體的一種形式,其與教材、專著相比往往具有傳播速度更快,范圍更廣的特點,特別是對于掌握學科、行業發展前沿來講,學術文獻具有不可替代的優勢。因此,學術文獻不僅僅作為對研究人員考核的標準,更是科研工作者獲得信息資訊的有效手段。
在對某一領域知識進行學習的過程中,特別是當學生從書本上掌握了基本理論與方法后,要想培養更高的科研能力,那么學術文獻閱讀與學習是必不可少的環節。在實踐中,大多采用如下方式:①任課教師推薦。為了達到教學目標,教師往往會為學生推薦相關文獻進行閱讀與學習,以拓寬學生的知識面。②借助檢索工具自行搜索。高年級學生基本具備文獻搜索與查詢的能力,因此,也有教師會在教學過程中根據學習內容指定方向,再由學生主動查詢文獻進行學習。
無論采用上述哪種學習方式,在實際教學環節中都存在一定的不足。①由教師進行文獻推薦的方式。一般來說,教師可以被認為是某一領域的專家,那么由他們直接推薦或要求閱讀的學術文獻往往在該領域內具有一定的權威性,同時,教師根據學生的學習背景、課程的教學內容所推薦的文獻也往往與該課程教學目標較為匹配,從而可以獲得較好的教學效果。但在實際教學過程中,一方面由于選課人數的問題,教師不可能為每一名學生推薦特定的文獻;另一方面,受到學習背景、學習環境的影響,不同的學生對同一教學內容的接受程度不同,進而造成差異性。②通過檢索工具主動搜索文獻的方式。在實際中,也有不少教師鼓勵學生進行自主學習,例如給定該課程的學習范圍或主題,由學生根據自身特點進行學習,再集中對學生進行考核。這樣的方式盡管能夠給學生創造更多的空間和機會去接觸自己感興趣的問題,但受文獻檢索工具的限制,影響了這一學習方式的效率。
推薦系統的概念是由David Goldberg等人于1992年建立郵件系統Tapestry時候提出的,稱為協同過濾(Collaborative Filtering,CF)方法。目前,常用的推薦系統模式包括基于內容的推薦方法(Content-based)和基于協同過濾的推薦方法(Collaborative Filtering),前者通過計算內容本身的相似度進行推薦,后者通過分析用戶間的相似度進行推薦。
近幾年,越來越多的研究者將推薦系統的概念引入到文獻檢索的研究之中,并取得豐富的研究成果。文獻推薦 (document recommendation)是根據用戶個性化信息,為用戶推送符合其偏好的文獻信息。一般來說,在文獻推薦時,研究者根據寫作需求在網上檢索合適的資源,通過仔細閱讀手動篩選出自己所需的參考文獻,再將參考文獻與特定的引文句一一對應。事實上,這一過程仍然需要研究者花費大量時間在信息的過濾與篩選上。
與文獻推薦有著較大的差別的引文推薦(citation recommendation)返回的是一個重要相關文獻列表,縮小了研究者的選擇范圍。也就是,引文推薦是為目標文檔或者目標文檔中的某個引文上下文(citation context)尋找可供支持的已有研究成果。引文推薦則可以理解為,需要深入到文獻內容中,是一種更細粒度單元的文獻推薦,其要考慮的特征因素遠多于傳統的文獻推薦。
由此可見,學術文獻引文推薦技術的興起很好地解決了學術資源的篩選問題,極大程度地節省了科學研究的成本,提高了信息檢索的效率,更為高校的科研教學活動提供了有利的支撐。一般來講學術文獻推薦包括三個過程:①文檔庫的建立。即將待推薦的文檔作為處理對象進行信息的抓取與索引,為信息的查詢與推薦奠定基礎;②用戶的需求。任何搜索引擎或推薦模型都存在冷啟動的問題,即系統采集或捕捉到用戶的需求后方可給出針對性方案;③需求的匹配。無論是主動搜尋還是被動推薦,其本質都是需要將形成的需求與文檔庫中的內容進行匹配,從而將最優的結果進行輸出。
在高校教學活動中,為了更好地進行學術文獻引文推薦模型的應用,因此,擬在傳統學術文獻推薦的三個過程中,加入高校教學活動的影響因素,建立基于高校教學活動的學術文獻引文推薦模型,如圖1所示。

圖1 學術文獻引文推薦模型
首先,在高校教學活動中,不同課程不同教師所建立的目標文檔庫是有所區別的,因此,擬在該模型中加入相關文獻評價方法,并針對評價后的結果建立索引,使推薦目標更好地滿足個性化需求。然后,以在校學生為對象,將其所在專業、先行課、以往成績、籍貫、興趣愛好等作為用戶模型的結構,形成用戶的個性化需求。接著,將以用戶的個性化需求與目標文檔庫建立的索引模型進行匹配,選出滿足用戶需求的最佳結果進行推薦。最后,再由用戶對推薦結果進行反饋,形成新的需求。
本文在梳理了學術文獻在高校教學活動中的作用后,列舉了在教學中常見的兩種學術文獻推薦方式并闡述了其優缺點,進而形成基于機器學習方法的學術文獻引文推薦技術在高校教學活動中的應用需求,并最終設計了高校教學活動中的學術文獻引文推薦模型,該模型更多地考慮了用戶及課程的個性化差異程度。依托該模型將更好地提高學術文獻的篩選與閱讀效率,切實發揮學術文獻在高校教學中的作用。可以說,科學研究離不開學術文獻的支撐,高校教育的教學更離不開學術文獻的傳播,因此,如何快速、準確地讓信息需求者獲得相應的信息滿足是本文研究的初衷和目標。
[1]郭艷紅.推薦系統的協同過濾算法與應用研究[D].大連:大連理工大學,2008.
[2]李琳娜,張志平,劉春霞.文獻推薦系統綜述[J].數字圖書館論壇,2012,(5):32-38.
[3]陳海華,孟睿,陸偉.學術文獻引文推薦研究進展[J].圖書情報工作,2015,(15):133-143.