周謙豪, 盛嘉祺, 姚占雷,2
(華東師范大學 1.經濟與管理學部信息管理系;2.經濟與管理學部實驗中心, 上海 200241)
目前,經管類虛擬仿真實驗一般是指利用財務管理軟件、供應鏈管理軟件、電子沙盤等模擬各種經濟管理活動中的具體場景,使學生通過親身體驗和動手操作,在實踐中掌握相應的管理技能。
然而,當前數據正在演變為人類社會最重要的資源和資產,大數據資源在人文社科研究中的地位不斷提升,人文社科研究范式和研究問題發生變革[1]。數字技術應用于人文社科領域,產生了數字人文這種新興的研究趨勢和研究范式。文本挖掘作為一項重要的數字人文技術,在全社會中的應用愈發廣泛,并已經在商業領域的客戶關系挖掘、用戶偏好挖掘等方面取得了不錯的成效[2]。
當前的經管類虛擬仿真實驗教學,重在重現、模擬企業或其他經營主體內部的全部情景和過程(運營管理、財務管理或管理決策等)[3],雖然在一定程度上提高了經管類學生的專業知識應用能力和實際操作能力,但是運用文本挖掘等數字人文技術解決企業管理問題的仿真場景幾乎沒有體現過。因此,亟需順應數字人文興起的趨勢,構建一個新型的虛擬仿真實驗教學平臺,以補充和完善現有的虛擬仿真實驗教學體系,培育學生的數據素養,幫助學生應對就業中企業對競爭情報、品牌感知、前沿洞察等相關技能的訴求,有其必要性和現實價值。
同時,當前經管類實驗教學多限定在課程設置的框架內,學生運用教師提供的資源,按照預設思路展開活動。在這種模式下,體驗的真實度較低,實驗的開放度不夠,問題探究式實驗偏少。基于此,通過構筑一套數據驅動的經管類虛擬仿真實驗教學平臺,專注打造集選題與需求分析、數據理解、數據準備、建模、評估和總結匯報于一體的實驗環節,可以拓展現有實驗活動(僅僅熟悉使用工具軟件)的邊界。通過高度逼真的模擬,幫助學生親身感受企業中的數據挖掘、數據分析活動,解決了學生體驗不夠真實的問題,培育了學生的數據思維以及運用數據分析解決專業問題的能力。教學平臺中的實驗可不對選題進行限制,因此具有很強的普適性。
教學平臺的設計緊緊圍繞培育經管類學生的數據思維和分析能力這一目標展開,不再采用過去模擬企業內部管理活動的傳統思路。如圖1所示。

圖1 教學平臺設計思路示意圖
平臺的總體設計思路是在提供課程管理、用戶管理等基本功能的基礎平臺之上,由教師基于模板設計出一系列融合了數字人文模塊等特色的虛擬仿真實驗課程,培養學生的品牌感知、決策咨詢等知識應用和實際操作的能力。
平臺上課程的實驗流程主要遵循和對照CRISP-DM(跨行業數據挖掘標準流程)展開。CRISP-DM由歐盟與多家企業在2000年時共同推出,它把數據挖掘過程中必要的步驟都加以標準化,并強調完整的數據挖掘過程,而不僅僅針對數據的整理、呈現、分析和構建模式[4]。CRISP-DM分為六大階段:商業理解、數據理解、數據準備、建模、評估、部署,標準流程中的六大階段與實驗的六大環節一一對應,如圖2所示。

圖2 實驗流程模板設計思路示意圖
教學平臺采用瀏覽器/服務器模式搭建,部署在校園網內的服務器上。校園網內的用戶直接訪問教學平臺,遠程用戶則使用VPN撥入內網進行訪問。平臺注重頁面自適應設計,除兼容個人電腦外,也兼顧網頁能通過智能手機、平板電腦流暢訪問。
教學平臺的實現,既可以選擇完全自主開發,即從零開始構建,也可以選擇基于開源項目進行搭建。鑒于國際上已經存在多個功能和側重點不同的開源教學平臺項目[5],且開源開發具有開發速度快、成本低、容易取得支持等優勢,結合對教學平臺穩健性、易用性、開發周期等方面的要求,決定選擇一個主流開源教學平臺,基于其進行二次開發,融合自研工具,形成經管類虛擬仿真實驗教學平臺。
為了滿足教學平臺的所有功能需求,并能在此基礎上達到用戶界面友好易懂、深度兼容自研工具等高階要求,需要慎重選擇作為開發基礎的開源項目。從這一點出發,評估了Moodle、Sakai、Dokeos三個國際上主流的開源教學平臺項目,最終選擇更為合適的Moodle平臺作為開發基礎。相比其它兩個開源項目,首先,Moodle具有更高的國內知名度和普及度[6],因此更容易獲得有價值的開發參考案例;其次,Moodle進入國內的時間長,本地化效果最佳[7];再次,使用PHP語言實現的Moodle,其二次開發和維護的難度低于使用Java的Sakai,可節約開發和日后維護的成本;最后,Moodle功能的豐富程度強于Dokeos,模板化課程、電子白板、多樣化的評價模式等功能均為Moodle獨有[6]。此外,Moodle社區活躍且強大,能夠提供海量現存插件,為改善和優化教學平臺的功能提供了近乎無限的可能。
Moodle Modular object-Qriented Dynamic Learning Environment的縮寫,意為“模塊化面向對象的動態學習環境”(音譯作“魔燈”)是一款由澳大利亞教師馬丁·多基馬創始的開源學習管理系統,它以建構主義思想作為設計依據,強調學生和教師互動配合,在已有經驗的基礎上共同開展知識構建[8]。Moodle平臺中的課程通常由一個或多個主題構成,每個主題由若干個不同類型(共20種類型)的活動模塊組成。課程設計者不僅可以根據需要,靈活自如地組配活動模塊,還能夠依靠每項活動的設置功能,對該活動的參數進行細致地調整,例如:可以根據課程安排,為各個活動模塊設置訪問限制,例如在學生沒有完成先續任務的情況下,不能訪問后續任務;為各個模塊選擇不同的進度管理模式,例如學生在某一模塊中提交了作業,平臺才將該模塊標記為已完成;在作業模塊中使用不同的評分模式;使用小組合作模式等。
2.3.1 部署Moodle
Moodle本質上是一個PHP網站,并支持Web方式安裝。借力于XAMPP等集成安裝包,Moodle可以快速、簡單地部署到服務器上。因教學平臺需要部署在一臺運行Windows Server 2008 R2操作系統的服務器上,故選擇使用XAMPP for Windows 7.2.2搭建PHP環境。PHP環境搭建完成后,首先在MySQL中為Moodle建立一個名為“moodle”的數據庫,同時將包含Moodle代碼的目錄“moodle”復制至XAMPP安裝位置下的目錄“htdocs”。然后,使用瀏覽器訪問“服務器IP:端口號/moodle”(如使用默認的80端口,可省略端口號),根據頁面上的提示,逐步完成對網站的語言、路徑、數據庫、管理員賬號等參數的一系列配置。
2.3.2 部署后的基本設置
為了將教學平臺打造得開放、自主,在Moodle部署完成后,先要進行一些基本設置,令平臺允許自助注冊新賬號、允許用戶自主加入課程。上述需求均能直接通過Moodle提供的設置功能實現滿足。首先,使用管理員賬號登錄平臺,進入“網站管理”模塊,依次訪問“服務器”、“電子郵件”、“發送郵件設置”,填入相應參數,確保網站可以向用戶正確地發出電子郵件。然后,依次訪問“插件”、“身份認證”、“管理身份認證”,找到“基于E-mail的自助注冊”,單擊右側的“啟用”圖標,啟用該注冊方式,即允許新用戶基于電子郵箱地址自助注冊平臺賬號。最后,依次訪問“插件”、“選課”、“自助選課”,在“選課實例缺省值”一欄中,將“允許自助選課”和“允許新的選課”兩項前的復選框選中,即允許用戶自主加入課程。
2.3.3 建立實驗課程
在平臺上展開虛擬仿真實驗教學,先要在平臺中針對該實驗建立一門課程。這里簡要介紹在Moodle平臺中建立課程的基本步驟。首先,使用管理員賬號(或具有課程創建權限的其它賬號)登錄平臺,依次訪問“網站管理”、“課程”、“管理課程和分類”,選擇或創建一個合適的分類,在其之下單擊“建立新課程”創建一門課程。然后,網頁跳轉至課程基本設置頁,在頁面上相應填入課程概要、課程描述等基本信息。隨后,單擊左側邊欄頂部本門課程的鏈接,跳轉至課程主頁。在課程主頁中,單擊右邊的“設置”圖標,在彈出的菜單中選擇“打開編輯功能”,此時即可對課程內容自由增加、刪除或編輯主題和活動模塊。
以“汽車品牌網絡口碑分析虛擬仿真實驗”為例,該課程中設置了六個主題。每個主題下都有一個或多個活動或資源類型的活動模塊,每個活動模塊都被設置了相應的訪問限制和進度管理,以便于控制教學進程,其中一個主題“導讀”的設置如圖3所示。

圖3 實驗中“導讀”主題的設置
限于篇幅,每個主題及每項活動模塊的具體設置等更多可編輯內容不作介紹。
虛擬仿真模塊作為教學平臺的特色,為學生提供一站式仿真體驗,培養了學生的數據思維和分析能力。目前已實現了信息采集、預處理、分詞、詞頻統計和情感分析五個數字人文虛擬仿真模塊,每個模塊界面友好、使用方便。各模塊以基礎平臺的插件形式呈現,實現了與實驗環節的無縫對接。
學生要展開虛擬仿真實驗,信息采集是首先環節。如圖4所示。
學生將在互聯網上找到的合適數據源URL填入“URL”文本框;單擊“預覽”可在下方預覽待采頁面;單擊“采集”即由服務器啟動爬蟲,對指定數據源中的數據進行采集;單擊“結果”可以查看或下載已采集到的數據。采集到的所有數據自動暫存入服務器,作為后續環節中預處理模塊的輸入。
從互聯網采集到的數據可能存在含有重復值、缺失值等種種問題,并不能直接用于分析和挖掘,因此首先要對數據實施預處理。預處理模塊應運而生,如圖5所示。

圖4 信息采集模塊頁面

圖5 預處理模塊頁面
其首先讀取之前階段由信息采集模塊采集完成的數據,或讀取用戶上傳的數據,再對上述數據實施清洗。清洗完成的數據自動暫存入服務器,既作為后續環節中分詞等模塊的輸入,也向學生提供查看和下載功能。
中文分詞是實驗中完成文本分析的重要一步。如圖6所示。
分詞模塊既支持直接讀取之前階段中由預處理模塊處理完的文本數據,也支持由用戶手動輸入或上傳待分詞文本數據,并支持用戶上傳自定義詞典、停用詞詞表和同義詞詞表,然后由服務器進行分詞。分詞結果自動暫存入服務器,既作為后續環節中詞頻統計模塊的輸入,也向學生提供查看和下載功能。
詞頻統計可以輸出文本中各詞語的出現頻數,反映各詞語的重要性。如圖7所示。

圖6 分詞模塊界面

圖7 詞頻統計模塊界面
詞頻統計模塊首先讀取之前階段由分詞模塊給出的中文分詞結果,或用戶手動上傳的待統計文本數據,然后由服務器進行計算。詞頻統計結果自動暫存入服務器,也向學生提供查看和下載功能。
文本情感分析可以判斷每條數據中所包含的正面和負面情緒的構成占比。如圖8所示。
情感分析模塊首先讀取之前階段由預處理模塊處理完的文本數據,也支持由用戶手動輸入或上傳待分析文本數據,然后由服務器進行分析。情感分析結果自動暫存入服務器,也向學生提供查看和下載功能。
研究依托Moodle開源平臺構建了一個通用的經管類虛擬仿真實驗教學平臺,實現其較強的開放性和未來擴展能力;同時,將數字人文相關成熟技術進行拆解,形成豐富多樣的虛擬仿真組件,實驗人員可以借助組件間的自由組合,實現對不同場景的快速模擬與重現。

圖8 情感分析模塊界面
該平臺是對現有經管類虛擬仿真實驗教學環境的有益補充,聚焦為培育學生的數據思維和分析能力,提供了一個開放自主的學習空間,能夠為相關兄弟院校的實驗實踐提供可參考的案例。
此外,平臺未來還將進一步豐富虛擬仿真組件(如:神經網絡、深度學習、語義關聯等);同時兼顧自動摘要、自動評分等智能評估功能設計與實現,構建智能化的評測體系,使平臺更加完善、更富技術水平。