周玫
(安康學院,外語學院, 陜西,安康 725000)
采用現代信息技術建設的英語聽力資源庫可為學生提供良好的英語聽力學習與練習環境,為提高學生聽力的水平起到重要作用。資源庫提取資源時易出現亂碼、提取延遲等問題,導致使用者滿意度較低,影響學生的學習進度,本研究深入探討了英語聽力庫資源自動集成的方法。
為了進行全面的英語聽力教學改革,滿足新時代社會與國家對人才培養的要求,2007年教育部正式發布英語聽力的教學目標[1]:學生缺少對聽力材料的整體把握與深入學習,也就談不上對知識的應用與了解,因此通過科學、客觀的教學方式與環境才能使學生充分地了解所學知識與知識的應用。多媒體網絡教育能夠加深學生對英語的聽、掌控與理解,其通過計算機網絡傳輸的知識儲存在資源數據庫。大部分的英語聽力資源都屬于異構資源,儲存在資源庫時,會出現提取不及時、提取出現亂碼等問題。
針對上述問題,本研究提出一種多媒體網絡環境下英語聽力庫資源集成方法,通過分析各階段學生的需求,構建資源數據庫,同時通過挑選邏輯較強的資源池,標定集成中心,根據隸屬度與目標改進函數確定需要集成的資源,進而完成英語聽力資源集成的目的。
英語聽力資源庫即為學生自主學習與教師組織教學提供不同素材的融合工具,提供的素材要和學生實時學習的英語聽力水平相關,其需要按照每一階段的教學大綱要求,對當前教學的重點合理地安排,為學生供給實用且方便的學習環境與資源。
1.1.1 學生特點
通常來說,學生自身的英語基礎大多較為薄弱,較大部分學生對英語聽力還存在較強的抵抗心理。因此,在構建英語聽力資源庫時需要分析不同學生的身心成長特點。此外,不同的學習階段,對資源的需求也存在差異,所以,需要更為詳細地了解學生學習風格、特點與水平等,通過得到的結果構建聽力資源庫,才能符合大部分學生理想中的學習環境與學習資源。
1.1.2 學習內容
大學的英語聽力教育,大部分以書本為基礎,因此想要構建資源庫就需要充分地了解并迎合目前學習的教材,在考慮學生的語言基礎之外,還需要充分地挖掘、創新與擴展教材內容,使用好教材為教與學提供良好的服務。同時,完成基本學習內容后,大部分學生還會參加英語的四六級考試與應用考試[2]。因此,在構建英語聽力資源庫的同時,還需要對以往的考試試題進行整合與分析,選出教育能力較強的內容,同時進行討論、歸納該題目類型,設定不同類型題目的難度系數。
1.1.3 學習需要
構建聽力資源庫需要以學習作為基礎。在構建前,需要對學生的需求與環境進行分析,良好的聽力資源庫能夠充分地掌握學生當前的基礎水平與期望水平之間存在的差距,憑借差距確定構建資源庫的方向與重點。
構建英語聽力資源庫的目的即為學生提供有效且能夠使其自主學習的平臺,激發學與教兩種體系的積極性與創新性,同時還需要遵守以下幾種原則。
(1)科學教育原則
在構建英語聽力資源庫時,需要利用當前性能最好的構建水平與條件,客觀、理性、科學地整合多種類型的聽力資源,并保證其內容不存在錯誤,且符合學生的認知規律與學習特點。同時構建的資源庫需要有較好的知識性,能夠為日常的學習互動提供相關的參考,不能產生讓學生出現歧義的內容。所有整合的資源都需要具有一定的教學意義,能夠使學生的身心得到發展,培養學生的國際文化認知[3],同時還可以幫助學生熟練掌握一定的聽力技能。
(2)適用性原則
通過對具有針對性英語聽力教學體系的深入研究發現,英語聽力資源庫的內容眾多,具有多樣化的特性,這不僅能為學生提供豐富的語言知識,還能夠描述英語的實用性,同時,資源庫需要滿足不同階段學生的需求。
(3)趣味性原則
英語聽力資源庫的內容需要具有一定的趣味性,增加學生對英語學習的興趣。在資源庫中,可以為學生帶來多姿多彩的交集場景與生活背景,慢慢培養學生的跨文化交集能力。
(4)操作性原則
構建英語聽力資源庫時,需要具備易上手、好操作的特性,這種特性能夠便于學生的自主學習,并為教師收集教材提供參考[4]。
(5)開放性共享原則
多媒體網絡技術的快速發展為英語聽力素材的擴展與更新提供了很大的幫助,綜合不同階段學生的需求,為聽力教學與學習提供了貼近現實且新鮮生動的資料。英語聽力資源庫構建的目標是為了完成資源的共享,讓有限的資源發揮最大的效益。
1.3.1 列式數據庫
為了使讀取性能得到改善,數據列內的資源數據一般都較為密集,并且顯示儲存記錄ID,同時盡最大可能使用壓縮比高的壓縮策略[5]。列掃描器和行掃描器的區別是列掃描器需要將資源數據坐標信息變換成磁盤地址,然后根據需要重建或組合,得到整個關聯元組數據。經過接收重建好的元組鏈接操作器,通過鏈接操作器得到對應的數據。
列式數據庫的優勢體現在資源數據的壓縮儲存與查詢等方面,而因為儲存英語聽力資源數據的架構設計在資源數據的操作性能上并不出色,因此針對海量數據下大量復雜查詢檢索的資源數據庫應用狀況,列式資源數據庫是一種比較適合的儲存解決方案。
1.3.2 整體架構設計
本研究把分布式資源數據庫結構擬定成三層,如圖1所示。

圖1 系統整體架構關聯
第一層:接口模塊。該模塊主要負責供給學生與教師接入同時訪問資源數據庫的接口,管理資源數據庫的線程池與連接線程,把來自教師與學生的查詢與操作請求傳輸至分布式資源數據庫控制器中[6],同時把從分布式數據庫控制器中得到的操作響應與查詢資源返還至用戶。
第二層:分布式資源數據庫控制器模塊。該模塊是負責控制管理整體分布式資源數據庫運行的控制模塊,其內存在數據儲存管理、數據獲取管理、數據緩存管理、數據分布式管理等子模塊。其可以把來自學生與教師接口模塊的請求經過分布式策略,將資源數據庫查詢與操作任務分配至各個節點中,同時對返回的資源數據進行整合排序等處理以滿足查詢需求。
第三層:儲存層。儲存層主要負責資源數據庫內資源的儲存,本研究使用了列儲存引擎與分布式資源緩存,試圖優化資源數據庫在海量數據查詢分析應用環境下的表現[7]。
使用該結構設計存在以下幾種優勢。
(1)提升性能。使用分布式結構能夠有效地提升資源數據庫系統的性能,并且也提供了系統的可擴展性,使系統對資源數據儲存與查詢分析需求的性能能夠通過添加節點來得到提升。
(2)層間獨立。經過三層模型完成整體資源數據儲存系統,層間憑借標準接口通信,這使得所有層能夠挑選最為合適的策略,而不用考慮是否會干擾到其他層的正常運行。
(3)數據保障。在三層模型內,學生與教師不會直接訪問到資源數據儲存層,也就無法對數據進行直接操作,能夠在管理層擬定數據安全策略,確保因為惡意或誤失操作導致的數據威脅[8],這能夠大大提高資源數據的安全性。
(4)便于維護。因為三層模型是互相獨立的,在對中間層進行修改與調整的時候,不需要更改客戶端的應用程序,這樣就降低了系統維護所需要的成本與時間。
1.4.1 資源描述
多媒體網絡環境下,英語聽力資源存在多重重疊現象,因此本研究從這五個方面進行考慮,擬定任意資源為HVi,其資源屬性表示為
HVi={CPU,Memeory,BandWidth,t,GeLoc}
(1)
式中,CPU代表資源運行速度,通過Ghz進行測量,Memeory代表數據庫內存大小,通過容量進行測量,BandWidth代表網絡帶寬,通過Mbps·s-1進行衡量,t代表每秒運行資源的成本,GeLoc代表資源所處的坐標。
1.4.2 集成中心選取
資源有其各自儲存的坐標,考慮到運行速度、成本等因素,需要挑選存在極強邏輯的資源池。在此融入變量r,如果GeLoc值相同,那么r=0,認定該坐標的資源為邏輯資源,如果0 本研究的集成個數c通過學生與教師的指定,隨機挑選資源庫內某坐標資源,組成原始集成中心,描述為{w1,w2,…,wc}。 1.4.3 構建資源矩陣 擬定多媒體網絡環境下,英語聽力資源總量是n,通過集合X={X1,X2,…,Xn}進行描述,其中所有資源Xi存在m種屬性,通過向量Xi=(xi1,xi2,…,xim)進行描述,那么獲得的資源空間即: X={Xi|Xi=(xi1,xi2,…,xim),1≤i≤n} (2) 1.4.4 改進目標函數 模糊C-均值集成算法的目標函數J與其約束條件如下: (3) (4) 式中,uij代表隸屬度,其能夠描述成資源點和類中心的關聯,式(4)代表約束條件,要求所有資源段xj和c種集成中心的總和是1。通過上述條件進行限制,使集成中心不被孤立,因此將隸屬度函數的約束條件改成: (5) 資源與集成中心的關聯通過uij進行描述,但相較于同一集成中心,不同資源的關聯無法進行表示。其具體架構如圖2所示。 圖2 資源點和類中心關聯圖 圖2中,A、B、C代表三種資源點,x、y、z代表集成中心,點C是某一集成中心的隸屬度,其分別是0.2、0.5、0.3,通過對比能夠看出點C屬于類中心y的可能性較高。但對于類中心y來說,資源點A、B、C的關聯無法進行對比,所以,需要提取一種加權因子來對比資源點之間的關聯。 擬定加權因子Mij代表相較于同一集成中心ci的各資源點的歸屬程度[9],其公式計算過程如式(6)、式(7): (6) 式中: (7) 改進的新目標函數是: (8) 通過乘數法計算的集成類中心是: (9) 隸屬度是: (10) 1.4.5 具體過程 集合X={X1,X2,…,Xm}代表需要集成的英語聽力資源,輸入集成總量c與最大迭代次數k[10],擬定誤差是ε,參數是m=2,運行以下流程: (1)確定原始集成中心{w1,w2,…,wc},同時使k=1; (2)憑借式(10)對隸屬度進行計算; (3)憑借式(9)對集成中心進行更新; 為了證明本研究方法的實用性,與傳統的基于數據挖掘[12]的資源集成方法進行對比,本研究方法與數據挖掘方法在單位時間內出現的資源量相同時,通過可挑選的路徑數量(可挑選的路徑數量多,表明融入至路徑內的節點資源多,進而證明資源集成得多,反之資源集成得少),取兩組參數(p=0.75,p1=0.7,p2=0.6)、(p=0.55,p1=0.7,p2=0.3)進行對比實驗,實驗結果如圖3、圖4所示。 圖3 參數(p=0.75,p1=0.7,p2=0.6)的方法對比圖 圖4 參數(p=0.55,p1=0.7,p2=0.3)的方法對比圖 通過圖3、圖4能夠看出,在相同的資源量時,本研究所提的集成方法能夠挑選的路徑明顯超過基于數據挖掘的資源集成算法,即在相同的時間內,本研究所提的集成方法的資源總量要超過傳統方法所集成的總量。這是因為,本研究所提的集成方法會通過構建資源矩陣來確定資源的具體坐標,進而大大提升集成的效率。 為了使學生更好地掌握和使用英語聽力,本研究提出了在多媒體網絡環境下,通過構建資源矩陣,添加目標函數和隸屬度,實現英語聽力資源的整合。雖然所提方法在資源集成上取得了較好的成績,但隨著研究的推進,也出現了一些弊端即:在集成的過程中會出現一些冗余資源,這些資源的來源大多是存在主觀意識的英文注釋,這些注釋的數據如果融入集成內,就會導致學生受主觀意識的影響,產生錯誤的認知英文的解釋與語義。因此,下一步需要研究的課題即:在本研究所提的集成方法中添加資源檢測方法,通過該方法實時檢測資源庫,同時檢索資源庫中的冗余資源,并進行資源剔除。


2 實驗證明


3 總結