黃偉
(北京語言大學 漢語水平考試中心,北京 100083)
基于VOD的面試型漢語口語考試數據管理系統設計與實現*
黃偉
(北京語言大學 漢語水平考試中心,北京 100083)
本文闡述了面試型漢語口語考試在數據管理與應用方面遇到的安全與效率問題;分析了利用數據庫和視頻點播技術實現一個管理系統的可行性;討論了考試視頻數據管理系統的功能需求和系統設計;介紹了該系統的數據庫、存儲機制和應用程序的設計與實現方法,以及系統部署時的平臺選擇與安全等問題。視頻點播技術在考試機構數據管理工作中的應用是一次有益的嘗試。
口語面試;視頻點播;數據管理;系統設計
實用漢語水平認定考試(C.TEST)的口語考試(簡稱C.TEST口語面試)是由北京語言大學漢語水平考試中心研發和組織實施的一項面試型漢語口語考試。旨在考查國際環境中母語非漢語人士在社會生活以及日常工作中運用漢語進行口頭交際的能力。該考試由兩名面試官和一名被試人員面對面地針對一系列相關話題進行不同深度的交談,面試官根據評分標準和被試人員的語言表現進行評估。[1]考試過程進行全程錄像,考試結束后,根據考試工作流程和規范,會將考試錄像處理為wmv格式的視頻文件后存檔。隨著考生人數逐年累積,出現了視頻數據在存儲效率和安全等方面的問題。同時,為了更好地研究C.TEST口語面試的相關課題,研究人員也需要經常調用這些視頻數據。這些數據在使用方面也面臨效率和安全等管理問題。
為了解決這些問題,筆者及同事們借鑒了視頻點播(Video On Demand,VOD)系統在教育領域應用的經驗。視頻點播系統一直是媒體應用的一個熱點。隨著網絡視頻應用的普及,視頻點播技術也成為了電化教育和遠程教學的重要手段,在現代教育中發揮著重要作用。[2][3]經過比較分析,筆者及同事發現視頻點播系統的應用特點正好符合C.TEST口語面試視頻數據在管理和應用方面的需求。
筆者及同事設計并開發了一個基于VOD的面試型漢語口語考試視頻數據管理系統。該系統實現了C.TEST口語面試數據的數據庫管理和視頻點播服務功能,能夠為管理人員和研究人員提供安全和高效的數據管理與應用服務。
該系統要求能夠存儲C.TEST口語面試的全部考試數據,能夠為研究人員提供方便的數據檢索服務,并能夠在線瀏覽視頻內容。同時要保證數據安全,非授權用戶不能訪問這些考試數據。從實際需求來看,該系統相當于一個基于Web的視頻點播服務系統。從事管理工作的人員是該系統的最高權限管理員,研究人員是用戶,考試數據是檢索和點播的內容。
該系統的功能需求可以從系統管理、數據管理和數據應用(檢索與點播)三個方面來考慮。系統管理模塊負責用戶、角色、權限的管理操作,以及用戶信息維護操作;數據管理模塊負責考試數據的管理與維護操作;數據應用模塊為用戶提供數據檢索服務,可根據特定的考生信息、考官信息、考試題目、成績等條件進行單一條件檢索或組合條件檢索,并能夠在線點播檢索結果中的視頻文件。同時,由于考試數據的保密性要求,該系統對來自系統外部威脅和系統內部威脅的安全性要求都比較高。
1.系統設計的原則
該系統的研發以滿足和方便管理人員和研發人員的工作和研究需求為出發點,兼顧安全性(包括系統安全和系統內部權限機制等)。具體地應該遵循以下原則:
(1)只有管理人員能夠對全部數據進行增、刪、改操作;
(2)研發人員在獲得管理人員的授權后能夠方便地對授權數據進行檢索和訪問;
(3)系統內的全部數據不得外泄;
(4)由于日常工作中不設專人負責該系統的運行維護工作,設計時應該充分考慮系統管理與使用的易操作性。
2.系統結構設計
目前大多數大規模的視頻點播系統已經采用了點對點(Peer-to-Peer,P2P)模式,而非傳統的瀏覽器/服務器(Browser/Server,B/S)模式。P2P模式比B/S模式在可擴展性和性能方面具有更好的表現。[4]-[6]但是,我們的實際應用被限制在內部局域網范圍內,用戶規模較小,對并發連接數量、連續播放度和響應延遲等方面的要求并不高;考試數據的使用也受限于保密協議,將來在用戶數量與使用范圍方面進行擴展的可能性比較有限。因此,我們仍然采用了傳統的 B/S結構模式。基于這一模式的技術已經非常成熟,在滿足基本功能需求的前提下,在開發、部署和維護等方面具有技術成本低的優勢。
3.系統功能設計
該系統包括系統管理、數據管理、數據應用(檢索與點播)三個功能模塊,主要功能設計如圖 1所示。

該系統運行的參與者包括管理員和用戶兩類。根據實際工作需要,用戶還可能被進一步細分。比如高級用戶角色和普通用戶角色分別代表是否對全部或特定數據具有訪問權限。系統管理模塊主要完成管理員對用戶、角色的相關管理工作,以及用戶自己的信息維護工作。主要功能包括:添加、修改和刪除用戶對象;設置用戶所屬的角色;用戶登錄管理;用戶維護個人信息(如修改密碼)。
C.TEST口語面試考試數據主要包括:考生背景信息(考生編號、姓名、性別、出生日期、國籍、就讀學校/工作單位、照片等)、面試官信息(姓名、性別、工作單位等)、考試試卷與題目①、考試信息(考試日期、主面試官評分、副面試官評分、復評成績、最終成績、獲證級別、證書編號、診斷性評價等),以及記錄考試過程的視頻數據。數據管理模塊主要功能有:
(1)錄入(或批量導入)、修改和刪除考生背景信息;
(2)錄入(或批量導入)、修改和刪除面試官信息;
(3)錄入(或批量導入)、修改、刪除考試信息;
(4)上傳和維護考試視頻數據。
從事C.TEST口語面試的研究人員通常需要根據考生背景信息、面試官信息、考試信息等內容檢索和訪問考試數據。數據檢索與點播模塊為此提供支持。數據應用模塊的主要功能有:
(1)以上述數據為條件進行單條件檢索;
(2)以上述數據為條件進行組合條件檢索;
(3)保存(或導出)檢索結果;
(4)在線點播考試視頻數據;
(5)(對高級用戶)提供視頻數據下載服務。
該系統采用數據庫存儲與文件系統存儲相結合的數據存儲方式,以ASP動態網頁技術與Windows Media Player Extension為實現手段。在完成數據庫設計與程序設計后,我們在內部局域網的服務器上部署了該系統。
1.存儲設計
考生背景信息中的照片和考試視頻數據分別以圖片文件和視頻文件的形式存儲在磁盤文件系統中,而沒有采用數據庫系統存儲的方式。這是在綜合考慮了開發的技術成本、日常工作效率、可擴展性等多方面問題的基礎上做出的折中選擇。我們統一設置圖片文件和視頻文件的命名格式為“考試日期”+“考生序號”+“.擴展名”的形式,并將不同考試日期的照片和視頻文件存放于不同文件夾中,文件夾以“考試日期”命名。
2.數據庫設計
面試型漢語口語考試視頻數據管理系統是以數據存儲、數據檢索與調用為主要應用的數據庫應用程序。它的設計與實現離不開數據庫的支持。我們把考試數據(不包括照片和視頻數據)、系統數據(用戶信息等)都存放在數據庫中。數據庫的設計遵循數據庫規范化的要求,同時兼顧設計與實現的便捷性。數據庫中的主要數據表設計如下,并以SQL腳本程序實現創建過程。
(1)國籍(民族)信息表
主要字段包括:國籍/民族代碼(主鍵)、國籍/民族名稱。表中信息與中國漢語水平考試HSK、實用漢語水平認定考試C.TEST等考試的相關信息系統中的數據保持一致,有利于多個系統的集成和信息交換。
(2)考生信息表
主要字段包括:考生編號、中文姓名、外文姓名、性別、出生年月、國籍/民族代碼、就讀學校/工作單位、照片文件路徑。該表以考生編號和中文姓名作為聯合主鍵字段。
(3)面試官信息表
主要字段包括:面試官編號(主鍵)、姓名、性別、工作單位。
(4)考試信息表
主要字段包括:考試日期、考生編號、試卷編號、主面試官編號、副面試官編號、主面試官評分、副面試官評分、復評人②編號、復評人評分、最終評分、證書級別、證書編號、診斷性評價、視頻數據文件路徑。該表以考試日期和考生編號為聯合主鍵字段。
(5)試卷和題目信息表:略。
(6)系統用戶信息表主要字段包括:用戶名(主鍵)、密碼、所屬角色類型、真實姓名。

如圖 2所示,各數據表間的關系為:國籍(民族)信息表和考生信息表間存在外鍵約束(國籍/民族代碼),考生信息表與考試信息表間存在外鍵約束 (考生編號)、考試信息表與試卷和題目信息表間存在外鍵約束 (試卷編號)、考試信息表與面試官信息表之間存在外鍵約束(面試官編號)。
3.程序設計
我們以Dreamweaver CS3為開發工具進行程序設計。該工具能夠以圖形化操作界面輔助編程人員自動地完成大部分代碼編寫工作,比如數據庫連接、登錄控制和權限控制,以及對數據庫的增、刪、改、查等操作,在很大程度上節省了開發的時間開銷。
檢索模塊采用了單一條件檢索與組合條件檢索同一界面的形式。檢索條件除了考生姓名外,均從數據庫中提取后以下拉列表的形式呈現給用戶以供選擇。視頻數據的播放功能是以在ASP頁面程序中調用Windows Media Player Extension的技術形式實現的。通過設置 Windows Media Player Extension的 Enable-ContextMenu等參數,可以有效地控制頁面內嵌播放器與用戶的交互程度,從而在一定程度上加強了對視頻數據的保護。圖3是檢索、檢索結果和詳細數據內容(包括視頻播放)的界面截圖。

4.系統的部署與安全
在參考了一般的考試機構信息系統建設方案的基礎上,我們根據系統的工作流程和信息處理的要求,經過測算,選擇了以下的硬件平臺、網絡通信平臺(結構如圖 4所示)和軟件平臺,并從系統和用戶兩方面加強了安全保障。[7]

為了同時滿足局域網內的其他網絡應用,我們選擇了雙CPU、8G內存的服務器作為該系統運行的硬件平臺。經過處理的C.TEST口語面試視頻數據文件是以 Windows Media Encoder 9標準進行壓縮處理的,視頻大小為640×480像素,幀速率為30fps。以平均每位考生參加考試的時間長度為15分鐘計算,每個視頻數據文件大小約為100MB。根據該考試的發展前景測算,我們暫時選擇了可用容量為1TB的磁盤陣列作為存儲設備。一般說來,視頻點播系統的一個特點是帶寬開銷比較大。實際上我們處理后的 C.TEST口語面試視頻數據文件的視頻碼率為768kbps,并發連接數以5個計算,單位時間內占用的帶寬大約只有4MB/ S。為了不影響局域網內部的其他網絡應用,結合目前網絡技術與設備的市場現狀,我們在建立局域網時選擇了千兆以太網。軟件平臺方面,我們在服務器上安裝了微軟公司的Windows Server 2003R2標準版,該服務器操作系統包含了Web服務組件IIS 6.0。數據庫系統采用微軟公司的SQL Server 2008標準版。客戶端方面,要求能夠正常運行微軟公司的瀏覽器工具IE 6.0(或更高版本)即可。微軟公司對教育行業的優惠支持力度和產品在用戶群體中的通用性,以及隸屬同一公司的數據庫管理系統、服務器操作系統、多媒體編碼與解碼方案、瀏覽器等產品間的高兼容性,是我們選擇這樣的技術平臺的主要原因。
前文相關論述中已經涉及到了系統安全性問題。使用用戶名、密碼登錄和根據業務規則劃分用戶角色等手段,是保障系統內部安全的一個方面。除此以外,應用程序服務器、數據庫服務器、網絡設備和客戶端計算機的自身安全與穩定也非常重要。通過及時更新系統程序、安裝必要的病毒防護程序等手段可以從軟件技術層面提升服務器和客戶端計算機的安全性。在此基礎上,還可以通過加密、安全連接訪問、地址限制、訪問時間限制等手段,進一步提升系統的網絡安全性。
該系統試運行后,我們將根據用戶體驗反饋進行改進完善。在安裝部署了相關的軟硬件平臺和開發的程序后,我們也開始著手進行相應的文檔整理工作。主要任務是編寫《“面試型漢語口語考試視頻數據管理系統”使用手冊》和《“面試型漢語口語考試視頻數據管理系統”使用協議》。前者為用戶使用該系統提供詳細的幫助,后者是用戶使用該系統前需要簽訂的有關安全保密和版權問題的協議。
本文討論了設計和實現一個基于VOD的面試型漢語口語考試數據管理系統的研發背景、需求分析、系統設計和具體的實現方法。該系統為從事面試型漢語口語考試的管理人員和研究人員提供了一個安全、高效的數據管理和應用平臺。
我們將視頻點播技術應用于考試機構的面試型漢語口語考試數據管理領域,是該技術在現代教育和測試領域中的一次有益嘗試。隨著該系統的試用與使用,我們也將根據系統運行的反饋情況及時進行修改,以使該系統日臻完善。
[1]王佶旻,趙琪鳳,韓陽.面試型口語考試研究——實用漢語水平認定考試 (C.TEST)口語考試的設計[A].載:不同環境下的漢語教學探索——第五屆對外漢語國際學術研討會論文集,北京:外語教學與研究出版社2009:453-465.
[2]熊冬升.支持隨機播放HTTP協議流式視頻點播系統的搭建[J].現代教育技術,2010.20(8):52-53.
[3]金智勇,孫樂傳,宋志明.基于校園網的視頻點播系統的構建及在教學中的應用[J].電化教育研究,2009(2): 72-74.
[4]錢碧偉,謝冬青,周再紅,熊偉.一個基于分層結構的P2P視頻點播系統[A].計算機工程與應用,2010,46(7):203-207.
[5]沈時軍,李三立.基于P2P的視頻點播系統的存儲設計[J].計算機應用,2011.31(1):187-189.
[6]鄒元君,王瑋.基于P2P的VOD系統設計與實現[J].中國教育信息化,2008(19):62-63.
[7]田清源.考試機構信息系統建設的研究[J].中國考試,2005(10):34-37.
(編輯:楊馥紅)
TP315
B
1673-8454(2011)23-0065-04
*本研究受北京語言大學青年自主科研支持計劃資助項目(中央高?;究蒲袠I務費專項資金資助)(10JBG07)和北京語言大學“特色重點學科”項目資助。