王焱
(漢江師范學院教育系,湖北 十堰 442000)
?
群智能算法支持的P2P遠程教育資源搜索和推薦
王焱
(漢江師范學院教育系,湖北 十堰 442000)
在分析P2P教育資源的特點和共享模式的基礎上,提出了群智能算法支持的P2P遠程教育資源搜索和推薦模型。該模型以典型的群智能算法——蟻群算法為基礎,對學習者的學習行為進行數據分類挖掘,通過相似學習者對資源的評價和對教育資源的熟悉度2方面決定資源路徑選擇概率,并根據相似學習者的歷史數據信息更新路徑信息素,實現了學習者的個性化資源搜索和推薦。仿真試驗表明,群智能算法支持的P2P遠程教育資源搜索和推薦方法是有效的。
群智能算法; P2P;遠程教育;搜索;信息素
P2P遠程教育系統具有良好的擴展性,提高了教育資源的利用率,但同時由于P2P遠程教育資源存放分散性、系統擴展靈活性等特點,向學習者推薦其感興趣或者符合目標要求的教育資源,提高學習者對資源搜索結果的滿意度是P2P遠程教育系統亟待解決的重要問題。將群智能算法運用到P2P遠程教育資源搜索和推薦中,為遠程教育學習者提供更符合學習者實際偏好的學習資源,有利于遠程教育學習者更為有效的個性化學習[1~3]。

圖1 P2P遠程教育資源共享模式
P2P遠程教育資源具有分散、動態的特點,其資源的數量和類型較為復雜,通過P2P協議構建遠程教育資源共享網絡,組織和管理能夠自主交換信息、共享資源、協同工作的資源節點。P2P教育資源分布在各個教育節點中,每個節點不僅向其他節點提供共享資源,同時完成其余節點的資源請求,通過P2P網絡整體行為完成教育資源的合作管理。P2P教育資源共享模式打破了教育信息孤島現象,充分利用了閑置的教育資源,使教育機構資源配置更為合理[4],其共享模式如圖1所示。
在P2P教育資源共享模式中,資源分散存儲在地方區域性中心節點和各學校資源分節點中,地方區域性中心節點為該區域資源存儲和管理的邏輯中心,各學校資源分節點依托區域性中心節點,模式中不存在單一的控制中心,各個分節點相互協作,分節點以建設本校特色教育資源為重點,相互協調發展,與區域性資源互為補充。共享模式中提供了教育資源索引與搜索服務,建立了信任機制,通過教育資源搜索程序界面,接受學習者的搜索請求顯示搜索和推薦資源的結果,并為學習者提供良好的擴充功能,方便學習者利用資源。
群智能算法是一種啟發式優化算法,它與人工生命,特別是進化策略以及遺傳算法有著極為特殊的聯系[5]。群智能算法研究領域主要有:蟻群算法和粒子群優化算法這2種代表性算法,由于蟻群算法在求解最短路徑方法的優勢,為此筆者以蟻群算法為基礎構建了P2P教育資源搜索和推薦模型。
教育資源的搜索和推薦應考慮學習者的知識水平、興趣愛好、教育背景等方面因素,部分遠程教育學習者青睞的教育資源對其他遠程教育學習者來說可能并不是最優的。搜索和推薦模型將典型的群智能算法——蟻群算法應用在P2P遠程教育資源環境中,充分利用了相似學習者在學習過程中遺留的學習行為數據信息,為其他相似學習者提供借鑒方案,有利于相似學習者充分利用合適資源。模型中將整個P2P遠程教育系統看作是很多蟻巢以及連接蟻巢的通路構成,每個蟻巢看作是P2P遠程教育系統中的對等節點,并且每個對等節點中都存放著資源。根據蟻群算法,將遠程教育學習者的資源搜索過程類比于蟻群的覓食過程,將遠程教育學習者當作螞蟻,將相似學習者對教育資源的評價和熟悉度當作螞蟻覓食過程中留下的信息素,根據信息素來選擇搜索資源的路徑。整個資源搜索模型如圖2所示。

圖2 群智能算法支持的P2P遠程教育資源搜索模型
群智能算法支持的P2P遠程教育資源搜索和推薦模型中在網絡日志中采集學習者學習特征和學習行為數據,包括學習者的搜索記錄、使用記錄和個人信息等方面的信息,并將存儲到學習者特征庫和學習者學習行為庫中。對于以上信息,通過學習分析技術進一步深度分析獲取更加詳細的行為信息,建立用戶與信息關聯及用戶偏好模型,為學習者的學習過程更新、學習資源的適應性以及資源推薦等方面提供可參考的依據。
在群智能算法——蟻群算法的概率模型中,螞蟻選擇路由的概率由螞蟻留下的信息素和被選路徑的長度2個因素決定。P2P教育資源選擇資源的概率也由2個因素決定:一個是相似用戶對資源的評價,另一個是相似用戶對網絡資源的熟悉度。群智能算法支持的P2P遠程教育資源搜索關鍵問題主要集中在相似學習者挖掘、相似學習者對教育資源的評價和熟悉度、學習者選擇資源的路徑概率、信息素更新等方面。
1)學習者相似度計算。學習者相似度反映學習者在學習特征、學習偏好、知識背景等方面的相似性。當學習用戶相似時,在資源的選擇方面也具有相似性,前者的檢索結果對后者的檢索具有啟發和幫助作用[6]。當前常用的學習者的相似度計算方法有余弦相似性、皮爾森系數和調整余弦相似性3種,筆者采用余弦相似性建立學習者的相似性。余弦值的范圍在[-1,1],值越趨近于1,代表2個向量的方向夾角越趨近于0,方向更加一致,相應的相似度也越高。
相似度計算式為:
(1)
式中,ωik和ωjk分別為學習者i和學習者j的特征向量;n表示向量分量數。
2)學習者對網絡資源的評價。學習者對網絡資源的評價反映的是學習者在利用網絡資源后,根據該資源對自己學習結果的作用大小,從個人的角度結合自身知識背景對該網絡資源的評價值,為相似用戶對該資源的使用提供了最直接的依據。大多數遠程教育系統會要求學習者完成一個教育資源的學習后對其等級評價,有效的反映了該類學習者對該資源的認可程度。
3)學習者對網絡資源的熟悉度。學習者對網絡資源的熟悉度通過挖掘學習者網絡學習行為數據得到,與學習者訪問該網絡資源的次數、持續時間等因素相關,當學習者訪問資源的次數越多,利用資源的時間越長,客觀的反映該類學習者對該網絡資源的認可度較高,該資源對該類學習者具有較高的價值。
學習者對網絡資源的熟悉度計算式為:
(2)
式中,r表示學習者的訪問次數;t表示學習者的持續訪問時間。
4)路徑選擇概率。學習者k在轉發搜索請求時不是盲目的轉發給所有鄰近的節點,而是根據相似用戶對特定教育資源的評價和熟悉度選擇特定的路徑進行請求轉發。搜索請求盡可能的轉發給大于設定路徑選擇概率的鄰節點,充分利用了相似用戶的數據信息,這樣保證了相似用戶滿意度較高的資源能夠被優先搜索。
路徑選擇概率計算為:
(3)
式中,τij為t時刻路徑上的信息濃度,即評價信息;α表示信息素的重要程度;ηij為啟發式因子,反應的是路徑信息,體現學習者對網絡資源的熟悉程度;β表示啟發式因子的作用大??;allowed表示與節點i相鄰的節點集合。
5)信息素更新。隨著時間的變化,路徑信息素不可能無限制的增加,路徑信息素會發生揮發,并且用戶評價較高資源的信息素會增量會較大,為了反映信息素的時效性,其采用下式更新:
(4)
通過數據挖掘Web日志獲取學習者和相似學習者的信息,包括用戶的身份,經常訪問資源地址,不同資源的訪問次數等信息,并利用用戶相似度公式構建用戶的相似度,通過相似用戶的資源訪問情況實現資源的搜索和推薦。蟻群算法支持的P2P教育資源搜索和推薦主要步驟如下:
1)節點i收到為K的資源查詢信息時,首先在本地查詢共享資源表、資源緩存表查詢,若找到了所要搜索的資源,并且查詢資源的數量達到設定的max,則生成返回螞蟻,沿原路反饋給查詢節點,否則轉入下一步。
2)根據閥值選擇相似用戶,并查詢當前節點信息素表中關于該到相鄰節點的信息素值,路徑選取的概率與相似用戶對該資源的評價、訪問數、使用時間等因素有關,根據選擇概率擇優選擇下一個節點q進行搜索,同時將該節點存入已訪問節點表。
3)如果q沒有鄰居節點或者鄰居節點都已經訪問完畢,如果q提供所需資源,則停止搜索,并更新資源信息素表,該螞蟻保持并返回搜索路徑。如果q節點沒有所需資源,則返回上一節點繼續搜索。
4)如果q節點存在鄰居節點沒有被訪問,則從選擇概率較大的路徑中選擇節點進行搜索,若大于路徑選擇概率的節點數超過n,只選擇前n位的數產生n個螞蟻,若小于n則實際路徑產生螞蟻,直到找到資源或者搜索周期結束。
5)當所有搜索螞蟻回到請求節點或者到達搜索周期后,整個搜索過程結束,給用戶返回推薦資源列表。
群智能算法支持的P2P遠程教育資源搜索和推薦充分考慮了相似用戶在網絡學習過程中留下的信息素,與K-random算法搜索相比,路徑的選擇不是盲目的跳轉,具有目的性,更加科學有效。教育資源的搜索和推薦結果更符合遠程教育學習者的實際需要,有利于提高學習者的滿意度。

表1 試驗參數
由于P2P遠程教育網絡構建存在一定的難度,筆者采用PeerSim模型器利用仿真試驗的方法驗證搜索和推薦模型的有效性。PeerSim模型器是一個基于Java的開源P2P模型器框架,仿真試驗參數如表1所示。
筆者采用P2P教育學習者普遍關注的搜索命中率和搜索響應時間作為衡量方法好壞的標準,與K-random算法進行對比,試驗結果對比分別如圖3和圖4所示。

圖3 搜索命中率 圖4 平均響應時間
由圖3和圖4可以看出,筆者提出的搜索和推薦算法的搜索命中率和響應時間相對于K-random算法具有明顯的優勢,并且隨著仿真時間周期的增加,該算法的搜索和推薦命中率比K-random算法命中率增加的快,一直保持較高的命中率,而平均響應時間卻比K-random算法低,說明了該搜索算法在搜索過程中以資源為導向,考慮了相似用戶對資源的評價的熟悉度,減少了對不相關資源節點的訪問,對P2P遠程教育資源的搜索和推薦非常有效。
資源的搜索和推薦是P2P遠程教育學習平臺的重要功能,對學習者實現個性化學習具有重要的意義。通過引入群智能算法,利用群智能算法的群體功能優勢,充分考慮了學習者特征、學習行為對相似學習者資源利用的借鑒效應,達到個性化的資源搜索結果,為優化P2P遠程教育資源智能化搜索和推薦提供了新的思路和理論支撐,下一步工作的重點是進一步在真實P2P遠程教育環境中驗證和優化。
[1]趙錚,李振,周東岱,等.智慧學習空間中學習行為分析及推薦系統研究[J].現代教育技術,2016,26(1):100~105.
[2]李綏,李振興,石鐵矛. 智能優化算法支持下的低碳城市規劃方法初探[J].沈陽建筑大學學報 (社會科學版),2016,18(1):8~12.
[3] 王水花,張煜東,吉根林.群智能算法的理論及應用綜述[J].南京師范大學學報(工程技術版),2014,14(4):31~38.
[4] 李偉,趙慶展,曹傳東.基于GIS與P2P的區域教育資源共建模式[J].實驗室研究與探索,2013,32(5):201~204.
[5] 羅新,王兆禮,路永和.基于蟻群智能算法的文本分類研究[J].圖書情報工作,2011,55(2):103~106.
[6]周奇,陸敬筠,朱曉峰.基于社交團體和用戶相似度的信息推薦方法[J].情報理論與實踐,2016,39(1):123~127.
[編輯]張濤
2016-02-23
湖北省教育廳科研項目(D20145001);鄖陽師范高等專科學校科研項目(2011B09)。
王焱(1980-),女,碩士,副教授,現主要從事現代教育技術及信息管理等方面的教學與研究工作;E-mail:wangyanwsr@163.com。
G40
A
1673-1409(2016)19-0025-04
[引著格式]王焱.群智能算法支持的P2P遠程教育資源搜索和推薦[J].長江大學學報(自科版),2016,13(19):25~28.