賈慶祥 王宇
河北科技大學信息科學與工程學院 河北 石家莊 050018
近幾年隨著科學技術的飛躍發展,智能手機的普及使手機App呈現指數級增長,國內外基于SM-2算法的英語學習APP的開發或研究鮮少涉及,雖然國外一些學者對這類研究頗有成果,但利用理論分析,研究其內涵、特點、結構及使用機制后,不難發現國外對同類APP的開發或研究對我們很難產生理論和實踐意義。因此該類基于SM-2算法的英語學習APP仍具有較大的開發和研究空間,市場上并無類似產品,市場潛力巨大[1]。
通過翻閱書籍和網絡查詢等途徑,查找有關助記方式方法的信息數據,分析相關文獻資料,了解現今最具權威的記憶方法,預測項目開發后對用戶的幫助情況,為之后的項目開展奠定充實的理論基礎。指導老師多年從事軟件開發以及算法分析方面的研究性工作,有較深入的研究經歷,能夠給予該項目理論以及技術方面的指導,能夠給該項目小組成員提供研究方法和研究工具以及市場前景方面的幫助。
支持公共卡包和自建卡包的學習與復習:
公共卡包:公共卡包提供了不同年級需學習的知識,知識資源將持續增加。學生可以添加公共卡包至待學習卡包中,并設置學習計劃。
自建卡包:學生可以自建卡包,進行自主學習。新建卡包時,需設置卡包名稱、每日學習卡包數量;在卡包中自主添加卡片,有文字模板和圖片模板兩種形式。如使用文字模板,需填寫問題及答案。例如添加一個英語單詞,問題填寫[好的],答案填寫[good]。在學習時,先顯示問題[好的],點擊頁面顯示答案[good]。如使用圖片模板,需輸入卡片名稱、問題圖片和答案圖片[2]。
智能記憶:該軟件根據艾賓浩斯記憶曲線和系統算法,把學習過的知識按一定的規律科學分布到遺忘曲線的時間點上(復習計劃表),在知識正要達到遺忘曲線臨界點時提供及時的復習,以達到智能記憶的效果。用戶根據自己對該卡片上單詞的記憶程度選擇“記住”、“模糊”、“忘記”狀態,算法會推算出該卡片下一次出現的時間。這里所提到的卡片包括新卡片和老卡片。
新卡片:新卡片第一次出現,無論點擊“記住”“模糊”還是“忘記”,都會在第二天再出現,讓用戶進行復習。第二天出現后,按老卡片的規則進行推送。
老卡片:出現過一次以上的卡片為老卡片,用戶在點擊了“記住”“模糊”“忘記”其中任一按鈕后,系統會根據算法計算下一次卡片出現的時間,例如某張卡片連續點擊三次“記住”之后,系統會默認用戶已經牢牢掌握了這張卡片,將不會再出現。而點擊了“模糊”按鈕后,該卡片下一次出現的間隔時間會比同等情況下點擊“記住”的間隔時間短[3]。
整個項目研發周期為1年,對于項目進度做了如下安排。項目前期進行調研,分析用戶需求與同類產品優勢,研究SM-2算法。中期分組合作,進行軟件開發工作。后期對軟件進行內部測試,修改出現的問題,不斷完善后正式發布。根據實際運行情況進行數據分析和資料整理,將研究成果進行匯總、整理,完成撰寫結題報告。
初期主要是查閱文獻,查找有關助記方式方法的信息數據等,收集的具體數據,收集分析相關文獻資料,基本確定開發時使用的SM-2算法。
中期軟件開發開發分為前端開發、數據庫建模、后端開發和真實數據錄入四部分。分工合作,軟件初步開發完成。
后期對軟件進行內部測試,繼續完善、改進。最終將研究結果匯總、整理。
3.3.1 將知識分解為最小的項目,與所有項目相關聯的電子因子等于2.5。
3.3.2 使用以下間隔重復項:
I(1):= 1
I(2):= 6,n> 2:I(n):= I(n-1)× EF
其中:I(n)-重復第n次重復之后的間隔(以天為單位),EF-給定項目的E因子,如果間隔是小數,則將其四舍五入到最接近的整數[4]。
3.3.3 每次重復后,以0-5級量表評估重復響應的質量:
5-完美響應。
4-猶豫后正確的響應。
3-嚴重困難時召回的正確響應。
2-錯誤的響應;正確的人似乎容易被回憶的地方。
1-錯誤的回答;正確的記憶。
0-完全停電。
3.3.4 每次重復之后,根據以下公式修改最近重復的項目的E因子:
EF’:= EF +(0.1–(5–q)×(0.08+(5–q)× 0.02))
其中:EF-新電子因子的值,EF-電子因子的舊值,q-(0-5)等級量表的響應質量。
如果EF小于1.3,則令EF為1.3。
3.3.5 如果質量響應低于3,則從頭開始重復該項目,而無須更改電子因子(即使用間隔I(1),I(2)等,就好像該項目是新存儲的一樣)。在給定日期的每個重復會話之后,再次重復質量評估中得分低于4的所有項目。繼續重復直到所有這些項目得分都至少為4。
3.3.6 經過大量的心理學試驗后,德國著名心理學家艾賓浩斯(Hermann Ebbinghaus,1850-1909)對人類記憶遺忘規律的研究總結:短時記憶在20分鐘后的保持量就只剩下 58.2%,1天后剩下35.8%,之后遺忘的速度會逐漸減慢,6天后剩下25.4%,30天后剩下 21.1%,只有小部分的短時記憶能夠轉化為數日、數周、數年乃至一生的長時記憶。艾賓浩斯遺忘曲線如圖1所示[5]。

圖1 艾賓浩斯遺忘曲線
3.3.7 記憶保留函數。在艾賓浩斯遺忘曲線基礎上進行修改,收集用戶瀏覽不同單詞的具體信息,先將信息細化處理,根據對不同最小級別劃分的類,計算出用戶對某類英語單詞暫記其為A類的預覽時間,將預覽時間簡記為φ,根據相關學術資料,在每個時間節點上都有與之相對應的記憶保持量,故可將艾賓浩斯曲線歸結為。其中t為自變量,e為自然數底數,c為常數,t0=0.00255。結合實際中人們對A類單詞的記憶會受限于其所在的客觀環境,無法得出確切的放大倍數,記放大倍數為λ,得到關于記憶的保留函數,

3.3.8 單詞快速推介算法流程。算法通過對用戶的基本信息, 全體用戶的單詞列表,對于新單詞而言,通過 C-means和Slope one來進行模型訓練和單詞推薦。至于已經學習過的單詞,根據艾賓浩斯遺忘曲線的理論,將和新單詞按照一定比例推薦給用戶,將單詞轉化 成一定的詞向量。通過詞袋法去噪音,最后按照一定的邏輯進行造句,而造出的句子作為輔助學生記憶單詞的工具[6]。其流程可歸納為圖2。

圖2 單詞推介算法流程圖
3.3.9 各種重復間隔模式對重復對知識保留的影響的實驗(2020年1月31日-2021年1月2日)

圖3 實驗結果
研發小組五人進行分工合作,分別針對用戶分析、市場調查、算法研究、產品開發、軟件測試等方面開展研究、完善。開發出一款基于SM-2的智能學習助手APP, 用戶僅需每天花費少量時間,經過App科學有效的記憶指導便可聚沙成塔,增加單詞記憶量,提升英語水平。