向煜暉
摘 要 隨著計算機網絡技術的應用普及,計算機在線考試系統已經得到了大量的使用,如駕照考試、GRE考試等,文章針對當前一些計算機在線考試系統需人工上傳試題,造成工作效率低下、成本代價高等問題,在充分調研相關技術基礎之上,結合當前主流的智能文檔解析技術(Intelligent Document Parsing, IDP)特點,提出IDP技術應用于計算機在線考試系統中的思路與方案,并分別從題目的類型識別與語段分析兩個角度進行了設計方案闡述,接著又深入分析了IDP應用于計算機在線考試系統的技術優勢和仍舊存在的技術問題,為IDP技術推廣提供有力支持。
關鍵詞 智能文檔解析技術;IDP;計算機考試系統;在線考試
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2018)225-0140-03
“互聯網+教育”的理念是傳統教學的有力補充,在線學習系統、網絡課堂到如今大量存在的在線考試系統,不僅給學校一種更加方便、簡單的檢測學生學習成果的方式,也給自主學習的學生提供了一條自我檢測的途徑[ 1 ]。同時,這樣的方式,既節省了大量人力成本,還節省了大量的紙張,對環境保護也有積極影響。而在線考試系統的靈魂,則在于其試題庫的建立。雖然計算機在線考試系統已經越發完善,但是在用戶的數據上傳前,仍需要大量的人工干預,使用戶體驗不是很好。因此,迫切需要一種高效、準確的上傳方式,這種方式能夠智能地選擇用戶上傳的題目題型,并與試題庫中的內容匹配。
而智能文檔解析技術是一種能對文檔具有智能化處理的計算機信息處理技術,從文獻調研來看,該技術對傳統計算機在線考試系統題庫上傳問題具有一定的潛在解決優勢[1-2],本文正是基于智能文檔解析技術與計算機在線考試系統的結合,提出相應的技術思路與方案并進行相關技術分析,為今后進一步學習計算機技術奠定基礎。
1 基本概念
1.1 計算機考試系統
計算機在線考試系統是現代信息技術在教育領域應用的典型,對于一些固定題庫的考試類型提供了極大便利,可以避免繁瑣的出題、閱卷和成績分析,且能給考試帶來客觀公正的評判標準[3-4]。其一般功能構成如圖1所示。
當前主流的計算機考試系統是考生從瀏覽器登入在線考試系統,服務器驗證考生身份信息,通過在瀏覽器發布考試試題,待作答完畢后提交,服務器進行會根據規則進行自動批改閱卷并給出成績[ 4 ],基本流程如圖2所示。
1.2 智能文檔解析IDP技術
類似計算機在線考試系統,需要事先建立試題資料信息庫,且需要對信息庫進行持續的維護與更新。對于計算機在線考試系統而言,題目信息庫的建立當前無非兩種,分別為逐題上傳和批量上傳,且都是事先按照一定的格式對題目進行編輯(通常有特定的Excel和Word格式),上傳后,系統進行特定的完整性檢驗,如有問題必須退回手工修改,可見其工作量大、效率低、時間成本高、操作性不好,已經難以適應計算機信息系統的發展要求。
而智能文檔解析技術是針對Word編輯的電子文檔的一種智能解析技術,可以大大減少人工預處理,提高文檔上傳效率,其主要思想是對特定題型的特征進行預定義與預提取,并進行程序規則化便可自動對文檔進行處理,常見題型規則定義如表1所示。
通過建立規則后利用計算機信息處理技術進行規則匹配,即可得到相應的題庫,智能文檔解析IDP技術原理示意如圖3所示。
2 IDP在計算機考試系統中的應用
2.1 IDP在計算機考試系統中的應用方案
從1.1和1.2的描述來看,本文正是基于智能文檔解析IDP的技術優勢與計算機在線考試系統的題庫建立、更新與維護工作存在的難點,提出將這種先進的計算機信息處理技術應用于題目信息庫的建設與維護,有利于解決實際存在的問題。基于1.2對智能文檔解析IDP技術的原理理解,在應用于計算機在線考試系統時需要進行題目類型識別與語段分析兩個方面的應用設計。
2.1.1 智能文檔解析IDP中的類型識別設計
類型識別就是將上傳的Word版本文檔按照之前預定義的規則進行分類與處理,而規則的制定通常都是基于語義進行的,即事先建立規則庫和段落數據的解析規則,用于與實際文檔中試題的匹配。由于一般計算機在線考試題型相對單一,無非為選擇、判斷、填空和簡答題,所以規則庫的建立也只有這幾種,當Word試題文檔上傳后便可按照規則進行類型匹配處理,為后續的語段分析提供先決條件。
2.1.2 智能文檔解析IDP中的語段分析設計
語段分析是基于2.1.1所述的類型識別基礎之上進行的,因此需要結合類型識別的結果進行特定類型的語段分析設計,為便于敘述,本文主要以計算機在線考試系統中常用的選擇題類型進行闡述。
當在類型識別中得到的是選擇題類型,則進一步進行判斷選項部分,選項往往可能由多個選項組合而成,因此便可以通過事先定義的語段分析規則,如選項之間是否有若干空格連接,基于類似這種的語段分析規則,便可進行分析處理,得到選項內容,進而完成整個題目的識別,最后通過與題目信息庫進行匹配,如無該題則按照題目信息庫規則進行入庫編排程序,否則給予舍棄,實現題目的處理與歸檔。其他題型也是按照類似的方法進行語段分析。
2.2 IDP在計算機考試系統中應用的技術優勢
從本文所述的類型識別與語段分析來看,智能文檔解析IDP技術屬于一種計算機智能信息處理技術,一旦將其應用于計算機在線考試系統題目信息庫的建設與維護,其技術優勢是十分明顯的,主要體現在以下兩點。
2.2.1 可以有效提升計算機在線考試系統文檔智能化處理水平
計算機在線考試系統文檔的智能化、自動化處理是其發展的潛在要求,傳統的手工操作人力投入過大,且在很大程度上仍舊無法滿足實際要求,與計算機智能化信息處理系統的發展趨勢相違背,而智能文檔解析IDP技術的應用則可以實現計算機在線考試系統更智能、更人性化的互操作性。
2.2.2 可以明顯提高計算機在線考試系統題目信息庫維護效率
傳統的計算機在線考試系統的題目信息庫建立往往依賴事先預定義的格式,需要人工按照規則進行預排版,且一旦出現手工錯誤,便會在后續的處理中報錯,給實際題庫的建設與維護帶來巨大的潛在麻煩。而智能文檔解析IDP技術則可以將任意的文檔進行上傳自動匹配,大大提高了題目信息庫的建設維護效率。
3 結論
隨著科技的發展,互聯網已經逐漸融入了人們的生活,也對現代教育產生了許多積極的影響[ 5 ],本文所敘述的計算機在線考試系統是順應計算機網絡技術的發展潮流下孕育產生的計算機信息管理系統,不僅給很多行業、機構的考試提供了便利,也為人們進行測試與評測提供了有效途徑,系統的建立節約了大量的社會人力物力,也給偏遠地區學生自主學習先進的知識奠定了基礎。
本文的核心是提出了將智能文檔解析IDP技術應用于計算機在線考試系統中題目信息庫的建設與維護,從題目的類型識別與語段解析兩方面進行了方案設計闡述,相信一旦智能文檔解析IDP技術真正得到應用,將進一步推動計算機在線考試系統的智能化、自動化和人性化發展,當然從目前一些文獻調研來看,還存在一些技術障礙需要得到進一步的解決,如圖片的自動處理、公式的編排等需要后續相關技術的跟進。
參考文獻
[1]劉思婷.在線考試系統中若干技術研究與優化[D].合肥:中國科技大學,2016.
[2]于洋.文本信息智能處理技術綜述[C]//全國計算機信息管理學術研討會,2009.
[3]葉宇風.計算機基礎在線考試系統分析與設計[J].微型電腦應用,2006,22(6):39-40.
[4]丁革媛,宋揚,袁忠臣,等.基于C/S模式多層結構的通用計算機在線考試系統的實現[J].微型機與應用,2011,30(14):1-3.
[5]蘇藝.高校計算機公共課在線考試系統的設計與實現[J].黑龍江教育(高教研究與評估),2013(6):89-90.