薛靜 程達



摘 要:在線練習是在線教育的必備一環,但從傳統線下教育轉到線上教育時需要將往年積累的海量習題導入在線教育配套的數據庫中。這一過程會消耗大量的人力、財力,出現效率低、出錯率等一系列問題。針對這些問題,文章提出一種基于神經網絡的實現模型。
關鍵詞:題目解析;在線教育;TensorFlow;神經網絡
0? ? 引言
該研究目標是改變人力制題導題,實現全自動化解析處理。目前,市場上人力導題的普遍方法是,首先下載電子版試題,然后在每一題的指定位置上以人工的方式加入試題所需標記,然后計算機遍歷試題文檔,按指定的標記解析出對應的題目、題型與題號等數據。
1? ? 基于神經網絡的軟件系統設計
整套軟件系統由服務端與測試客戶端(demo)組成,并提供可用于第三方集成的SDK。
1.1? 服務端設計
1.1.1? 服務端架構
服務端采用的是SOA架構,由Service Interface層、Service Bus層和 Persistence層組成。使用的技術框架包括:Flask與TensorFlow。ServiceInterface與ServiceBus由Flask框架+TensorFlow框架結合RabbitMQ實現,其中識別處理與模型訓練由TensorFlow實現[1]。Persistence由MySQL實現。
1.1.2? 服務端模塊
服務端由服務接口層、服務總線層、數據持久化層組成。服務接口層是面向用戶或者二次開發人員的endpoint,提供的接口有4個。
(1)用戶注冊接口。
用戶注冊接口主要用于注冊使用的用戶,請求地址為 IP/reg,請求參數如表1所示。
(2)題目上傳接口。
題目上傳接口用于用戶提交試題文檔,請求參數如表2所示。
(3)題目解析接口。
題目解析接口用于用戶獲取題目的智能解析結果,請求參數如表3所示,返回參數如表4所示。
另外,還有識別處理模塊及模型訓練模塊的設計,識別處理模塊的目標是識別出文檔中的所有試題,并且做到準確拆分試題,之后識別題型,從而生成標準化試題[2]。根據特征識別試題的偏移量就成為拆分試題文檔的關鍵。模型訓練模塊是提升試題識別能力的關鍵。其分為題型模型、題號模型與題干模型等。前文已經論述如何提取題號偏移量,最終達到提取試題的目的。因此,提升題號識別能力,訓練題號模型就成為提高拆分試題準確率的核心。
2? ? 實驗結果
點擊“解析試卷”后,從服務器返回的結果可以清楚看到所用時間情況和試題的解析情況。原試卷是一套完整的帶標準答案的初中數學試卷,其中包含選擇、填空和解答三種題型,沒有做任何的標記處理。經服務端解析后,進行了準確的切分,從試卷中提取出每個試題,并識別出對應的題型。
實驗過程中用一套完整的初中數學試卷作為實驗用例,試卷中包含選擇題12道、填空題4道、計算題6道。人力制題,用時48分鐘,平均每題用時約2.2分鐘,折合132秒。利用該軟件制題,用時7.35秒,平均每題0.33秒。由此可見,制題效率得到極大的提升,實現了本文的研究目標。
3? ? 結語
本文的研究是在充分調研在線教育行業現狀的基礎上展開的。首先,針對目前基于word人工制作可用于大數據學情分析的標準化試題的現狀,本文提出了完整的提升效率的方案。其次,研究并建設了完整的軟件實驗環境。最后,用相同的一套試題分別測試了人工制題和AI制題的效率,測試結果充分證明了該研究的必要性和重要性。
[參考文獻]
[1]朱溦.神經網絡結合平均影響值方法篩選變量[J].產業與科技論壇,2017(1):78-79.
[2]俞頌華.卷積神經網絡的發展與應用綜述[J].信息通信,2019(2):39-43.
(編輯 王永超)