戴付晗 樸雪











摘要:隨著智能算法的發展,高考志愿的填報逐漸成為熱點話題,而智能算法在高考志愿平臺的應用相關研究文獻缺少系統性整理。該研究以中國知網期刊數據平臺和 Web of science為數據來源,采用文獻計量學方法檢索2011~2021年該領域相關文獻,通過對比分析與數據可視化,了解國內外研究現狀、研究趨勢以及發展差距,從而為國內研究者提供參考和借鑒。
關鍵詞:高考志愿;智能算法;推薦算法;推薦平臺
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)06-0049-03
開放科學(資源服務)標識碼(OSID):
1 概述
近些年,各省高考政策、考試內容、考核方式、錄取制度等都在不斷調整,高校招生也在變革之中。與此同時,市面上的高考志愿推薦平臺層出不窮,更多是通過對往年高考錄取分數和排名分析來推薦高校,沒有考慮到考生需求、學科偏好等,很難切實進行個性化“因材推薦”。智能算法近年來發展迅速,并已在眾多領域推廣應用,而智能算法在高考志愿推薦平臺中的應用研究又缺少系統性整理。故本文以中國知網期刊數據庫為數據來源[1],借助文獻計量方法,檢索2011 -2021年間該領域相關文獻[2],通過數據分析和數據可視化,為高考志愿填報服務平臺的開發者以及智能算法研究者們提供理論參考和借鑒。
2 對高考志愿的文獻研究與分析
2.1 對高考志愿的文獻研究與分析
筆者在中國知網期刊數據庫中對高考志愿相關研究論文進行高級檢索,時間跨度設置為 2011-2021 年,選取關鍵詞“高考志愿”進行精確檢索,返回結果664條,其中主要來自教育和計算機科學領域。
從圖1分析得出:2011-2021年國內高考志愿相關文獻總體上數量呈上升趨勢,2011~2017年文獻數量增長比較平緩,總體趨勢上升;2017年至2019年,相關文獻數量出現較大增長,其中2019年數量達到十年內峰值86篇;2020~2021年有一定程度的下降。這說明在高考志愿領域,國內研究逐漸深入,2019年后高考改革,之前高考相關研究的文獻參考價值變弱,導致此后論文發表量下降,但隨著各地區新高考模式的逐漸成熟,2021年相對2019年將會有所上升,加之人工智能和大數據技術在各領域的應用,未來高考志愿推薦的研究將會更加深入。
在高考志愿主題下,在檢索結果提煉關鍵詞,通過分析可以發現,占比較高的是新高考改革,占比高達81%,詳見圖2。由此說明新高考政策出臺后,多個期刊都進行了新高考改革后高考志愿的研究。綜合來說,國內研究者主要是通過分析當下的高考改革、高考志愿填報、高考志愿錄取形式、影響高考填報的因素等幾個方面展開論述。值得注意的是,高考志愿填報和志愿服務相關文獻較少,且不夠深入。而在為數不多的高考志愿填報相關文獻中幾乎都涉及智能算法,包括推薦算法、聚類模糊算法、協同過濾算法等。
2.2 推薦算法在高考志愿填報中應用的文獻分析
因此,高考志愿填報,可以通過計算機領域中的算法進行優化和改進。數據挖掘、大數據、志愿填報等關鍵詞與推薦算法都有一定的聯系。那么推薦算法應用于高考志愿服務平臺是可行的,于是在中國知網期刊數據庫中采用高級檢索推薦算法并且模糊匹配高考志愿相關研究文獻進行檢索,檢索時間跨度為 2011~2021年,返回檢索結果8條。
通過表1可以看出,國內對于推薦算法和高考志愿的研究還是有很大的研究空間,近些年來研究相對較多,大多數還是基于協同過濾算法、遺傳算法、模糊聚類算法的研究。文獻中有6篇來源于計算機專項的期刊。與此同時,可以發現推薦算法在高考志愿服務平臺的使用有著很大的前景。
3 對推薦算法相關文獻分析
由于推薦算法可以在高考志愿服務平臺的使用,在一定程度上可以加強志愿服務平臺的個性化和增強適配性,于是通過檢索中國知網期刊數據庫與Web of Science 數據庫相關文獻,進行國內外推薦算法的對比研究與分析。通過分析國內推薦算法相關文獻的出處,更清晰地體現其發展過程和今后的研究目標,為相關科研人員今后發表文獻給予了更加明確的指導。
3.1 國內推薦算法相關文獻
在中國知網期刊數據庫中采用高級檢索對推薦算法相關研究論文進行檢索,檢索時間跨度為 2011-2021 年,選取檢索關鍵詞“推薦算法”進行精確查找,返回檢索結果6059條。其中涉及學科最多的是信息科技、計算機科學,電子信息、軟件工程也有涉及。
國內研究者主要是通過個性化推薦、協同過濾推薦算法、模糊聚類算法的研究[3],并且進行了協同過濾算法等的介紹、發展、基于各類應用場景等方面的系列綜述,從而對研究和應用前景進行了展望。
從2011年至2021年國內與推薦算法相關的文獻總數為上升趨勢,2011年至2012年相關文獻數量平穩發展(根據圖3)。2019年達到近十年最高,達到738篇,2020年有小幅度下降,2021年預計發表量達到771篇。體現在推薦算法領域,國內的相關研究走向成熟,與此同時推薦算法已經被應用到了很多方面,如圖書、音樂、視頻、電子商務等[4],增強了用戶滿意度和用戶黏性,而在用戶滿意度方面目前高考志愿填報平臺較為薄弱,所以高考志愿填報在推薦算法方面的研究前景巨大。
通過分類和人工篩選,得出各“關鍵詞”的詳細占比統計,詳見圖 4 。使用高級檢索以推薦算法為主題,推薦算法占據統計量的20%。協同過濾、推薦系統、協同過濾算法、協同過濾推薦算法占據48%,可以看出關于推薦算法的研究,大多數研究協同過濾算法較多、在研究推薦算法時,可以重點關注協同過濾算法。除此以外,個性化推薦、數據庫、矩陣分解、基于用戶也占據不小的比例。
論文引用率是衡量一個國家科研文獻被其他國家或機構的認可度的標志,有較大的研究價值,于是本文對文獻引用量前兩百進行相關分析。從圖5可以看出對于推薦算法的研究計算機科學、計算機學報、計算機應用研究、計算機研究與發展的期刊研究較多,占比總文獻的32%,綜合類期刊文獻引用量較少。由此可以發現,推薦算法主要出現在計算機領域,因此推薦算法的研究建議相關理論和實踐研究者首先查閱計算機相關的期刊文獻。
1) 國內推薦算法引用量前十文獻的研究
在中國知網期刊數據庫平臺上以“推薦算法”為關鍵詞,選取 2011~2021年引用量前10的文獻(檢索結果見表2)[5]。其中被引次數排名第一的是個性化推薦系統綜述,其次是推薦系統評價指標綜述,都有較高的引用量。從表2可以得出,引用量相對較高的大多數是綜述,10篇中有6篇是綜述類文獻。期刊大多數是計算機工程、電子信息、軟件工程的專項期刊,綜合類期刊占比不高。
3.2 國外推薦算法的文獻的分析與研究
為了解國外對于推薦算法的當下研究情況,在Web of Science 數據庫中對推薦算法相關論文進行檢索,檢索年限為 2011年至2021年,主題設置為Recommendation algorithm,Mesh為Algorithms返回檢索結果3319條。
1) 國外推薦算法的數量分析與研究
從圖6可以看出,2011-2019國外研究發表論文數量整體呈現波動式上升趨勢,發表量基本在300篇上下浮動。2019~2021年出現較大的下滑,2019年達到發表量最高,超過400篇。由此可以發現,國外推薦算法的研究較為平穩,近三年波動較大,有下降的趨勢。
對近10年來推薦算法不同研究方向進行統計(詳見圖7),發現數學占比最大,其次為醫療保健科學服務,另外藥理學藥學、數學計算生物學、放射學核醫學醫學成像、計算機科學等,在大類學科上基本可以分為醫學、數學、計算機科學。由此得出,國外推薦算法的研究有較大部分是在醫學上的應用和研究,推薦算法在醫學領域的應用上有著較大的前景。
2) 國外推薦算法文獻來源與研究
以Web of Science 為數據來源[5],對 2011~2021年推薦算法相關文獻按出版物來源進行分類。其中,PLOS ONE發表的關于推薦算法的文獻最多,其次是MEDICAL PHYSICS、SENSORS、SENSORS BASEL SWITZERLAND。其中PLOS ONE相對其他期刊發表量較多(圖 8)。
國外引用量前10名的文獻分析在 Web of science 數據庫中,以策略(主題)設置為Recommendation algorithm,Mesh為Algorithms為檢索條件,檢索 2011年至2021年引用量前10的相關文獻(檢索結果見表3)。被引次數較多的仍是醫學領域的相關文獻,可見國外在計算機領域的推薦算法研究較少,而醫學領域的推薦算法研究較為深入。
3.3 國內外推薦算法研究情況對比分析
對以推薦算法并且高考志愿為主題檢索,可以發現國內相關論文數量為個位數,說明在國內對于推薦算法高考志愿服務平臺的研究較少。而國外由于升學機制與國內存在差異,當檢索高考、志愿等關鍵詞和主題時,檢索結果為0,于是檢索內容更改為推薦算法,探索國內外對于推薦算法的研究差異。
我國對于推薦算法的研究的學科和期刊大多數還是計算機、軟件工程、電子信息,而國外推薦算法的研究的學科和期刊,種類相對豐富。值得注意的是,國外文獻對于推薦算法研究更傾向于醫學領域。推薦算法出現和研究的時間較短,國內在各種領域的研究相對較窄,主要集中于研究模糊聚類算法、協同過濾算法的研究,對于算法實際應用研究不夠深入。未來推薦算法的研究應當繼續深入,在多個領域進行研究,將醫學、數學、物理、計算機科學等學科進行交叉研究,提升研究的實用性和適用性。
綜合國內外文獻,推薦算法的研究發展時間不長,但是發展日益迅速,文獻發表量、應用量總體逐年上升。與此同時,國外研究開始時間早,發表相關文獻的總量多,并且研究方向更多的是與醫藥衛生相關,而國內研究更偏重計算機科學、電子信息、軟件工程。從長遠來看,國內對于推薦算法各種領域的研究有待發掘。
4 結束語
對推薦算法在高考志愿服務平臺的研究,國內國外文獻總體呈現數量少、相關度低的態勢。目前市面上的相關志愿填報平臺,一定程度上存在政策更新慢、院校介紹缺失、交互性差、缺少人工智能支持等弊端,在推薦院校上較為狹隘,無法體現出平臺志愿填報的優勢,缺失真正合適的推薦算法的體現和探究。近年來,人工智能算法不斷創新和進步,從簡單的數理統計算法(如Logistic回歸算法和線性回歸算法)到復雜的智能算法(如CNN)。隨著算法復雜度的不斷提高,其應用前景也越來越廣闊。許多算法已經應用于語音識別、金融、醫療等領域[6]。與此同時,國內研究者也嘗試、研究推薦算法在高考志愿填報上的應用。隨著國內的推薦算法在高考志愿推薦平臺的研究,相信在不久的將來將會有一個更加智能、詳細的平臺,切實地幫助到使用者。
參考文獻:
[1] 胡嘉豪,孫焱,程景民.基于CiteSpace的互聯網醫療研究文獻可視化分析[J].中國數字醫學,2020,15(10):59-61.
[2] 李穎,石磊,張寧,等.針刺雙向調節效應研究的文獻計量分析[J].遼寧中醫雜志,2017,44(11):2394-2397,2464.
[3] 李華,張宇,孫俊華.基于用戶模糊聚類的協同過濾推薦研究[J].計算機科學,2012,39(12):83-86.
[4] 向邦盛,劉滌.試談推薦算法及應用[J].電腦編程技巧與維護,2020(7):43-45,54.
[5] 劉久煜,張月琴,樸雪.腦機接口技術發展狀況分析——基于文獻調研[J].衛生職業教育,2019,37(19):133-135.
[6] 劉理,吳官權,漆世鍇,等.同時測量曲率和溫度的高靈敏度光纖傳感器[J].傳感器與微系統,2019,38(10):64-66,69.
【通聯編輯:謝媛媛】