區詩柔,肖 遙,劉 聰,徐雅靜,鄭世玨
(華中師范大學 計算機學院,湖北 武漢 430079)
2017年5月在北京召開的“一帶一路”國際合作高峰論壇會上,習近平總書記從世界形勢和人類命運的角度觀察思考,描繪了人類命運共同體建設的美好畫卷,形成我國長期國家戰略的重大布局。“一帶一路”沿線約64個國家,使用的語言約2 488種,這使漢語教學和我國高新技術推廣面臨巨大挑戰。因此,要采用新思路和手段進行這類技術性漢語詞教學。
自2013年“一帶一路”倡議提出至今,關于“一帶一路”與漢語教學的論文與日俱增,國內的專家學者從不同角度和方向進行了大量研究:宋陽等[1]提出“一帶一路”戰略的實施需要語言鋪路;陳思琦[2]調研得出在“漢語熱”潮流下,學習漢語的人數估計已過億,目前已有100多個國家近2 500多所大學開設了漢語課程;劉君[3]提出當今以高鐵等大型建設工程為代表的工業文化代表了我國的高科技水平,成為當代中國文化的代表性內容,這種科技文化十分值得傳播,并且“一帶一路”潛在的文化圈受眾規模龐大,可以利用信息化方法打造智能的文化一體化管理模式以及利用網絡手段搭建虛擬的文化設施,實現多媒體、多渠道、多維度的跨文化交流法;黃方方[4]認為漢語教育資源面臨重帶輕路的問題,我國孔子學院的分布缺少戰略,離國家“一帶一路”戰略布局相距甚遠;張日培和張露等[5-6]提出智庫交流是民間外交的重要方式,是“一帶一路”人文交流的重要內容,因此培育國家語言文字智庫并加強沿線國家在語言、文化以及教育領域的政策溝通,是“一帶一路”語言規劃的迫切任務。
以上研究結果說明了采用新技術進行“一帶一路”高新技術漢語詞教學以及對其建立資源庫的必要性,且關于這類教學新方法的研究仍有欠缺。針對這一問題,本文結合相關成果,面向“一帶一路”,對高新技術漢語詞進行分析,建立起一種高新技術漢語詞數字媒體庫,應用于一個高新技術漢語詞新型教學系統,并結合VR技術生成一種模擬環境,給學習者帶來極強沉浸感,幫助沿線人民便捷高效地學習高新技術漢語詞并掌握其使用語境。
本文所建立的面向“一帶一路”的高新技術漢語詞教學系統分為兩個子系統:高新技術漢語詞學習系統以及高新技術漢語詞管理系統。在學習系統中,任何人都可以注冊普通用戶并登錄,普通用戶可安裝不同版本的系統,登錄后可學習詞匯,其學習情況(次數、時間、方式)會被記錄。在管理系統中,管理員可以隨時使用密碼登錄并增加、修改和刪除詞條。系統結構如圖1所示。

圖1 系統結構
系統主要面向“一帶一路”沿線人民,因此如何選擇詞語、選擇語種及設計詞條能夠方便他們高效地掌握漢語詞匯十分關鍵。以下描述詞語及語種的選取規則和詞條設計流程。
1.2.1 詞語及語種的選取規則
(1)候選詞語選取。
候選詞語選取的來源基于國家語委語言資源網提供的語料庫。首先,根據當前我國的主要高新技術建設項目及“一帶一路”沿線20國青年于2017年5月評選出的中國“新四大發明”,系統的漢語詞涉及對象選出12個類別:“共享單車”“航天工程”“北斗導航”“橋梁建設”“孔子學院”“高速鐵路”“機器人”“無人機”“網購”“清潔能源”“支付寶”“針灸”。然后對每一個類別,從國家語委語言資源網中人工挑選出100個漢語詞。
(2)候選詞語與對應類別相關性計算。
按照候選詞與對應類別共現性的范例個數作為分析指標去計算它們的相關性。統計并計算兩個詞語在國家語委語言資源網的語料庫中單獨出現的頻率和同時出現的頻率,根據互信息方法的公式計算其相關性,其數學模型如下:

其中,分子是兩個詞匯共同出現的概率,分母是兩個詞匯分別單獨出現的概率。
(3)用矩陣數據分析法計算詞語得分。
選取詞語的因素(按重要性降序排列)有:詞語與對應類別的相關性(a)、詞語在國家語委語言資源網的語料庫中出現的頻率(b)、詞語在網絡上出現的頻率(c)。根據3個因素的重要性確定對比分數,自己對比的地方打0分,以 “行”為基礎,逐個和“列”對比,若“行”比“列”重要,給正分,否則取倒數。組成數據矩陣如表1所示。

表1 數據矩陣
根據選擇因素的權重計算詞語得分,公式如下:

(4)詞語確定。
根據計算結果,將各詞語按照得分降序排列,每個類別挑選出前20個詞語左右,共300個詞語。
(5)語種界定。
“一帶一路”沿線國家使用的語言頻率最高的前5種語言依次為漢語、阿拉伯語、英語、俄語、德語,因此選取這5種語言對詞語進行描述。
1.2.2 詞條設計
系統對每個漢語詞建立起漢語、阿拉伯語、英語、俄語、德語這5種語言的對照詞表,并對每個詞語進行配音及錄制音頻。
因此,每個高新技術詞匯有漢語、英語、俄語、阿拉伯語、德語物種語言的描述,每種語言有對應的音頻,每個詞匯有相應的視頻,數據庫存放音頻和視頻的URL即可。
(1)系統的開發采用LAMP網站架構,其組成軟件均開放源碼。在Linux的環境下采用MySQL建立數據庫、創建視圖并添加300個詞語,再用PHP編寫系統接口,最后啟動Apache以運行系統。
(2)系統采用B/S網絡結構模式,它將系統功能實現的核心部分集中到服務器上,簡化了系統的開發、維護和使用。
(3)用戶佩戴VR眼鏡后,可通過眼球定位詞語3秒選擇需要學習的詞語。VR眼鏡通過眼球追蹤技術得到用戶選擇的詞語,向系統接口發送請求從而調用接口從數據庫中檢索出該詞語的相關數據。
(4)系統在目前流行的新型智能手機、iPad等環境下均可結合VR眼鏡使用。在手機上打開系統,將手機橫向放置于VR眼鏡中,用戶佩戴上VR眼鏡即可進行學習。
通過需求分析階段所得的應用需求,設計概念模型,如下為數據庫對象屬性E-R關系(見圖2)。
根據E-R圖,設計出以下邏輯模型,有下劃線的屬性為主鍵。
文學作品只有不斷攀登精神高峰,才能在展現精彩人世的同時,體現美學價值,保持藝術生命力,網絡文學、傳統文學概莫能外。
高新技術詞匯(詞號、類別號、漢語、英語、俄語、德語、阿拉伯語、漢語音頻、英語音頻、俄語音頻、德語音頻、阿拉伯語音頻、視頻)
用戶(用戶號、姓名、密碼、操作權限)
管理員(管理員號、姓名、密碼、操作權限)
系統(版本號、類別)
學習情況記錄(情況記錄號、學習時間、學習次數、學習方式、高新技術詞匯詞號、用戶號)
類別(類別號、類別名)
(1)情況記錄表與高新技術詞匯表、用戶表都分別存在多對多關系,因此在情況記錄表與高新技術詞匯表、用戶表之間建立鏈接。在情況記錄表中屬性word_id、user_id都是外鍵,分別作為鏈接高新技術詞匯表與情況記錄表、用戶表與情況記錄表的橋梁,從而實現表間的關聯查詢,并避免數據冗余。
(2)對每個表的主鍵、外鍵建立索引,另外由于高新技術詞匯可被用戶搜索,因此對詞匯的漢語、英語、俄語、德語、阿拉伯語屬性建立索引,從而提高數據查詢速度。

圖2 數據庫對象屬性E-R關系
為合理使用有限的存儲空間,并確保數據的傳輸速度,對于系統中使用到的所有數據,均需遵循以下格式規范(見表2)。

表2 數據格式規范
為保證系統中所有數據符合格式規范,對于收集的數據,均先進行如下處理過程。
(1)將所有數據轉換成符合規范的格式;將圖片、動圖和視頻轉換成符合規范的分辨率。
(2)對音頻和視頻剪輯,去除無用部分。
(3)若數據的大小超過規范,對于文字,人為進行刪改;對于其他,則進行壓縮。
(4)對音頻和視頻消除雜音。
(5)對于文字,直接將內容儲存至數據庫;對于其他,先上傳至服務器,再將相應URL存放至數據庫。
“高速鐵路”漢語詞條表如圖3所示,可見屬性Num是漢語詞唯一標識的主碼,類別“高速鐵路”的Sort為6,現有20個與“高速鐵路”相關的詞匯,表中存儲了每個詞匯對應的5種語言以及每個語種所對應的音頻和描述該詞條的短視頻,用戶佩戴VR眼鏡后觀看類別“高速鐵路”中的詞語“高速列車”的短視頻如圖4所示。
本文中的教學系統結合VR技術為“一帶一路”背景下的漢語教學以及高新技術的推廣提供了新的方法,是一種幫助沿線人民高效便捷地學習高新技術漢語詞的新嘗試,還需要不斷完善和開發,便于更有利地向世界各國推廣我國的高新技術,促進我國與沿線國家工程建設領域交流合作。

圖3 高速鐵路漢語詞條

圖4 高速列車
[參考文獻]
[1]宋陽,黃宣方.“一帶一路”背景下的漢語與中國文化傳播研究綜述[J].才智,2017(4):227.
[2]陳思琦.一帶一路下對外漢語教學的新方向[J].課程教育研究,2015(19):43-44.
[3]劉君.“一帶一路文化共同體”與漢語國際教育[J].語文學刊,2015(22):123-124.
[4]黃方方.“一帶一路”沿線國家漢語教育狀況探析[J].河南師范大學學報(哲學社會科學版),2017(3):102-106.
[5]張日培.服務于“一帶一路”的語言規劃構想[J].云南師范大學學報(哲學社會科學版),2015(4):48-53.
[6]張露,馬麗.數據庫設計[J].安陽工學院學報,2007(4):76-79.